非公開求人
LLM Research Engineer/AI開発プラットフォーム提供企業の求人
求人ID:1492365
更新日:2026/03/02
転職求人情報
職種
LLM Research Engineer
ポジション
スペシャリスト
おすすめ年齢
20代
30代
40代
50代以上
年収イメージ
〜1500万円
仕事内容
当社では、AIモデル開発に不可欠な学習データの生成・整備・評価プロセスをプロダクトとして提供しています。
近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。
特に、LLM / VLM / マルチモーダルモデルの高度化、本番運用を前提とした大規模データ要求、データ品質がモデル性能を直接左右する構造が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。
さらに現在は、有害データの混入、バイアスの増幅、誤学習によるリスク、評価指標と実運用性能の乖離といった AIの安全性・信頼性に関わる課題 が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。
当社では現在、データ設計や評価が属人的に行われている、モデル改善のボトルネックがデータ側にあるが体系化されていない、安全性・品質・性能を統合した設計思想が未確立という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。
このポジションの本質:
AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。
扱う対象は単なる学習データではなく、モデルの挙動を規定する訓練信号、評価基準を形作るテストデータ、安全性を担保するガードレールデータといった、AIのモデルの出力特性と性能を規定する要素です。
そのため本ポジションでは、どのデータがモデルの意思決定に影響するのか、どの評価が本番性能を適切に測定できるのか、どのようなデータ設計が安全性を担保するのかといった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。
主な役割:
・LLM / VLM / マルチモーダルモデル向けの学習データ設計
・データ前処理・アノテーション方針の設計と改善
・モデル評価指標の設計および評価結果の分析
・学習 → 評価 → データ改善 のフィードバックループ構築
・モデル開発チームとの連携による性能改善
・データ品質・バイアス・安全性に関する設計指針の確立
研究テーマとしての領域:
データ設計領域
・モデル性能を最大化するデータ分布設計
・データカバレッジと一般化性能の関係
・少量データ環境での効率的データ生成
評価領域
・モデルの実運用性能を反映する評価指標の設計
・評価データセットの品質設計
・自動評価と人手評価の統合設計
AI安全性領域
・有害出力を抑制する訓練データ設計
・バイアス・公平性に関するデータ分析
・安全性評価データセット(ベンチマーク)の設計
・データガバナンス・トレーサビリティ設計
・SFT, RLHFによるモデルの性能向上
主軸(最も期待する領域):
・AIモデル向けデータ設計・品質管理
・モデル評価とデータ改善ループの設計
・Pythonを用いたデータ処理・分析
・データ視点からのモデル性能改善
扱う対象例:
・LLM / VLM 向けテキスト・画像・動画データ
・物体検知・画像認識モデル向けデータ
・アノテーションデータ・メタデータ
・安全性評価用データセット
このポジションで得られるもの:
・AIモデル性能を左右するデータ設計の実務経験。
・最新のLLM / VLM を実運用レベルで扱う希少な機会。
・AIの安全性・信頼性に関わる最前線の課題に取り組む経験。
・研究とプロダクト開発を横断したキャリア。
近年、AIモデルの進化に伴い、競争力の源泉はモデル構造そのものから、「どのようなデータを、どのように設計し、評価し、改善し続けられるか」へと急速にシフトしています。
特に、LLM / VLM / マルチモーダルモデルの高度化、本番運用を前提とした大規模データ要求、データ品質がモデル性能を直接左右する構造が同時に進み、AI開発におけるボトルネックは完全に「データ側」に移行しています。
さらに現在は、有害データの混入、バイアスの増幅、誤学習によるリスク、評価指標と実運用性能の乖離といった AIの安全性・信頼性に関わる課題 が顕在化しており、データ設計は単なる精度改善の問題ではなく、AIの社会実装における責任領域へと拡張しています。
当社では現在、データ設計や評価が属人的に行われている、モデル改善のボトルネックがデータ側にあるが体系化されていない、安全性・品質・性能を統合した設計思想が未確立という課題を抱えており、AIモデル性能と安全性を「データの観点から」引き上げられるResearch Engineerを募集します。
このポジションの本質:
AIモデルが正しく学習され、安全性・信頼性を担保し、本番環境で信頼できる性能を発揮する状態を、データ設計と評価ループの構築によって実現することを担っていただくポジションです。
扱う対象は単なる学習データではなく、モデルの挙動を規定する訓練信号、評価基準を形作るテストデータ、安全性を担保するガードレールデータといった、AIのモデルの出力特性と性能を規定する要素です。
そのため本ポジションでは、どのデータがモデルの意思決定に影響するのか、どの評価が本番性能を適切に測定できるのか、どのようなデータ設計が安全性を担保するのかといった問いに対し、研究的視点と実装視点の両方から取り組むことが求められます。
主な役割:
・LLM / VLM / マルチモーダルモデル向けの学習データ設計
・データ前処理・アノテーション方針の設計と改善
・モデル評価指標の設計および評価結果の分析
・学習 → 評価 → データ改善 のフィードバックループ構築
・モデル開発チームとの連携による性能改善
・データ品質・バイアス・安全性に関する設計指針の確立
研究テーマとしての領域:
データ設計領域
・モデル性能を最大化するデータ分布設計
・データカバレッジと一般化性能の関係
・少量データ環境での効率的データ生成
評価領域
・モデルの実運用性能を反映する評価指標の設計
・評価データセットの品質設計
・自動評価と人手評価の統合設計
AI安全性領域
・有害出力を抑制する訓練データ設計
・バイアス・公平性に関するデータ分析
・安全性評価データセット(ベンチマーク)の設計
・データガバナンス・トレーサビリティ設計
・SFT, RLHFによるモデルの性能向上
主軸(最も期待する領域):
・AIモデル向けデータ設計・品質管理
・モデル評価とデータ改善ループの設計
・Pythonを用いたデータ処理・分析
・データ視点からのモデル性能改善
扱う対象例:
・LLM / VLM 向けテキスト・画像・動画データ
・物体検知・画像認識モデル向けデータ
・アノテーションデータ・メタデータ
・安全性評価用データセット
このポジションで得られるもの:
・AIモデル性能を左右するデータ設計の実務経験。
・最新のLLM / VLM を実運用レベルで扱う希少な機会。
・AIの安全性・信頼性に関わる最前線の課題に取り組む経験。
・研究とプロダクト開発を横断したキャリア。
必要スキル
【必須スキル】
・機械学習またはAI関連プロジェクトにおいて、データ前処理・分析・評価設計に関わった経験がある方。
・Pythonを用いたデータ処理・分析経験をお持ちの方。
・モデル性能に対して「データの観点から」改善に取り組んだ経験がある方。
・AIの品質・安全性・バイアス・評価指標といったテーマに関心をお持ちの方。
【歓迎スキル】
・LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
・アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
・精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
・学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
・Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
・研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
・生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
・強化学習を含む学習手法や、課題設定 分析 実装 検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
・Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
【求める人物像】
・LLM / VLM / マルチモーダルモデルに関する実務経験。
・評価データセット設計・モデル評価指標設計の経験。
・データ品質管理やアノテーション設計の経験。
・AI安全性・公平性・バイアスに関する研究または実務経験。
・論文実装・研究活動・学会発表などの経験。
・機械学習またはAI関連プロジェクトにおいて、データ前処理・分析・評価設計に関わった経験がある方。
・Pythonを用いたデータ処理・分析経験をお持ちの方。
・モデル性能に対して「データの観点から」改善に取り組んだ経験がある方。
・AIの品質・安全性・バイアス・評価指標といったテーマに関心をお持ちの方。
【歓迎スキル】
・LLM / VLM / 画像・動画モデルにおけるタスク特性を踏まえたデータ構成・粒度・ラベル設計の経験
・アノテーション業務における、ガイドライン設計、品質基準策定、レビュー、改善サイクル運用の経験
・精度・再現率・F1・BLEU 等の指標を用いた評価結果の解釈・ボトルネック分析の経験
・学習 → 評価 → 改善を意識したデータパイプラインやRLHF基盤構築のご経験
・Data-centric AI / MLOps といった考え方に基づき、モデルだけでなくデータ設計に価値を置いた開発に関心がある方
・研究コミュニティでのアウトプットとして、学会等での論文発表/査読付き発表などの実績がある方
・生成AI(LLM/AIエージェント等)を用いた開発経験があり、エージェント設計・ツール連携(Function calling等)・RAG/検索・マルチモーダル文書理解(VLM/OCR)・安全運用(ファクトチェック/ガードレール)・タスク特化ベンチマークによる継続評価のいずれかに知見/実装経験(または強い関心)がある方
・強化学習を含む学習手法や、課題設定 分析 実装 検証までのDSプロセス、および AI支援コーディングツールの活用・運用の経験
・Robotics・Physical AI領域におけるデータ作成(IL用データ収集・VLA学習用データの生成・評価設計等)の経験がある方
【求める人物像】
・LLM / VLM / マルチモーダルモデルに関する実務経験。
・評価データセット設計・モデル評価指標設計の経験。
・データ品質管理やアノテーション設計の経験。
・AI安全性・公平性・バイアスに関する研究または実務経験。
・論文実装・研究活動・学会発表などの経験。
就業場所
就業形態
正社員
企業名
AI開発プラットフォーム提供企業
企業概要
AI開発プラットフォーム提供事業、AIコンサルティング事業 等
企業PR
業務カテゴリ
組織カテゴリ
備考
関連キーワード
応募ありがとうございました。コンサルタントからご連絡します
応募出来ませんでした。恐れ入りますがもう一度やり直してください
気になるに登録しました
気になるに登録出来ませんでした。恐れ入りますがもう一度やり直してください