非公開求人
Data Scientist(Creative Vision)/日本語特化型AI開発企業の求人
求人ID:1473458
募集継続中
転職求人情報
職種
Data Scientist(Creative Vision)
ポジション
担当者〜
おすすめ年齢
20代
30代
40代
50代以上
年収イメージ
〜1800万円
仕事内容
データサイエンティストとして、データ処理、キュレーション、キャプションを含むデータ関連の業務に従事します。研究者やエンジニアと協力し、大規模な基盤モデルの学習を支える効率的なデータ基盤およびコードベースの開発を推進していただきます。
【ポジションの魅力】
- 大規模マルチモーダル生成モデルの学習と開発プロジェクトに携わることができます。
- 研究成果を実世界のアプリケーションに適用し、ビジネスに測定可能なインパクトをもたらすことができます。
- 拠点の多様かつ国際色豊かなチームで連携して研究開発ができます。
- 国内最大の計算リソースを使った研究開発ができます。
【ポジションの魅力】
- 大規模マルチモーダル生成モデルの学習と開発プロジェクトに携わることができます。
- 研究成果を実世界のアプリケーションに適用し、ビジネスに測定可能なインパクトをもたらすことができます。
- 拠点の多様かつ国際色豊かなチームで連携して研究開発ができます。
- 国内最大の計算リソースを使った研究開発ができます。
必要スキル
【必須スキル】
- データ基盤/パイプライン:大規模マルチモーダルパイプライン(ingest→dedupe→filter→shard→snapshot/version)設計、および標準化データAPIと高スループットローダー(ストリーミング、キャッシュ、サンプリング等)の提供経験
- キャプション/人手ラベリング:キャプション注釈フロー構築(属性/関係スキーマ、多言語対応)、ベンダー/内部アノテータ運用、ゴールドセット、IA一致率、QCダッシュボードの構築と運用、自動キャプショナー(CLIP/VLM補助)の検証経験
- キュレーション/品質管理:重複検出、クラスタリング、品質/美的評価、ポリシーフィルタ(NSFW/暴力/PII等)の経験、領域・スタイル・地域間のバランス調整、密キャプションや合成データ効果測定の経験
- 研究志向データサイエンス:データアブレーション(構成、キャプション密度、合成比)、軽量スコアラー試作(品質/安全)、社内レポート作成の経験
- 連携/展開:研究・プロダクトと協働しデータ構成をロードマップに沿って最適化、スキーマ/マニフェスト/SLAを整備し、複数チームで再利用可能にする経験
【歓迎スキル】
- 学習時品質トラッキング/評価:固定プロンプト・シードによる評価フック、CLIP整合性、美的代理指標、安全率、編集指標の追跡経験
- テストセット運用とチェックポイント管理の経験
- 安全/ガバナンス:データソース・ライセンス管理、削除フロー、顧客データ隔離、ポリシーフィルタとNSFWトレースの運用経験
【求める人物像】
- 自社の事業内容、ミッションに共感し、新たな事業への挑戦姿勢・意欲を持った方
- データ基盤/パイプライン:大規模マルチモーダルパイプライン(ingest→dedupe→filter→shard→snapshot/version)設計、および標準化データAPIと高スループットローダー(ストリーミング、キャッシュ、サンプリング等)の提供経験
- キャプション/人手ラベリング:キャプション注釈フロー構築(属性/関係スキーマ、多言語対応)、ベンダー/内部アノテータ運用、ゴールドセット、IA一致率、QCダッシュボードの構築と運用、自動キャプショナー(CLIP/VLM補助)の検証経験
- キュレーション/品質管理:重複検出、クラスタリング、品質/美的評価、ポリシーフィルタ(NSFW/暴力/PII等)の経験、領域・スタイル・地域間のバランス調整、密キャプションや合成データ効果測定の経験
- 研究志向データサイエンス:データアブレーション(構成、キャプション密度、合成比)、軽量スコアラー試作(品質/安全)、社内レポート作成の経験
- 連携/展開:研究・プロダクトと協働しデータ構成をロードマップに沿って最適化、スキーマ/マニフェスト/SLAを整備し、複数チームで再利用可能にする経験
【歓迎スキル】
- 学習時品質トラッキング/評価:固定プロンプト・シードによる評価フック、CLIP整合性、美的代理指標、安全率、編集指標の追跡経験
- テストセット運用とチェックポイント管理の経験
- 安全/ガバナンス:データソース・ライセンス管理、削除フロー、顧客データ隔離、ポリシーフィルタとNSFWトレースの運用経験
【求める人物像】
- 自社の事業内容、ミッションに共感し、新たな事業への挑戦姿勢・意欲を持った方
就業場所
就業形態
正社員
企業名
生成AI技術の研究開発企業
企業概要
日本語に特化した国産の大規模言語モデルの研究開発、生成AIサービスの開発、販売、提供
企業PR
業務カテゴリ
組織カテゴリ
備考
関連キーワード
応募ありがとうございました。コンサルタントからご連絡します
応募出来ませんでした。恐れ入りますがもう一度やり直してください
気になるに登録しました
気になるに登録出来ませんでした。恐れ入りますがもう一度やり直してください