非公開求人

LLM Inference Engineer/日本語特化型AI開発企業の求人

求人ID:1473482

募集継続中

転職求人情報

職種
LLM Inference Engineer
ポジション
担当者〜
おすすめ年齢
20代
30代
40代
50代以上
年収イメージ
〜1800万円
仕事内容
自社大規模言語モデルのモデルの価値をユーザの価値に変えるシステムの構築
- チームの開発プロセスの設計管理や生産性向上のための各種活動

【この仕事の魅力】
- 海外ベンダにも引けを取らない計算基盤を使って正面から戦えること
- ユーザに対して価値のあるプロダクトを自ら考え提案し開発までを一貫して行うことができること
- プロダクトに必要なことであれば技術領域を問わず何でもできる環境があること
必要スキル
【必須スキル】
- 実務経験 (5年以上)
- スケーラビリティと高可用性を要求される大規模分散システムの開発または運用経験があること
- 常に理想を追いかけて開発に取り組めること

【歓迎スキル】
- オンプレまたはクラウドの GPU クラスタ上で稼働するシステムの設計・開発
- 複数データセンタ (マルチリージョン) に跨る高可用システムの設計・開発・運用
- オンプレでの分散データベースや検索エンジンの開発・運用
- 機械学習モデルオンラインサービング基盤の設計・開発
- 機械学習モデル推論ワークロードの高速化に関する研究開発
- LLM 推論フレームワーク (vLLM, SGLang, TensroRT-LLM 等) を用いたシステムの運用
- 分散処理基盤のモニタリングやオブザーバビリティに関するシステムの設計開発
- エンタープライズ向け API サービスにおけるセキュリティ・ガバナンス設計
- 実装フェーズに手を動かすことを厭わず、詳細設計からレビューまで自らドライブできる能力
- OSSへの貢献、論文執筆、技術コミュニティでの活動
就業場所
就業形態
正社員
企業名
生成AI技術の研究開発企業
企業概要
日本語に特化した国産の大規模言語モデルの研究開発、生成AIサービスの開発、販売、提供
企業PR
業務カテゴリ
組織カテゴリ
備考
関連キーワード
応募ありがとうございました。コンサルタントからご連絡します
応募出来ませんでした。恐れ入りますがもう一度やり直してください
気になるに登録しました
気になるに登録出来ませんでした。恐れ入りますがもう一度やり直してください