メニュー

大手総合インターネット企業のSite Reliability Engineer(ML/AI領域) / データグループの求人

求人ID:1415303

更新日:2025/05/29

転職求人情報

職種

Site Reliability Engineer(ML/AI領域) / データグループ

ポジション

担当者〜

おすすめ年齢

年収イメージ

700万円〜1260万円

仕事内容

ポジション概要
当社で開発・運用しているMachine Learning Platformに対するSRE業務を担当いただきます。
本ポジションでは、レコメンデーションシステムや機械学習パイプラインなどを安定提供・運用するためのソリューション開発と継続的な改善を通じて、データサイエンスの価値創出を支える役割を担います。
現在、組織のTechnical Director(以下、TD)が主導して開発している機械学習のマイクロサービスを、マネージドサービスとして社内展開を進めています。
そのため、TDをはじめ、機械学習エンジニアやサーバサイドエンジニアと連携しながら、SREの専門知識を生かしてスケーラブルかつ高信頼なサービスの成長に挑戦することができます。

主な業務内容
具体的には以下の業務を想定しています。
- 運用課題(デプロイパイプライン、パフォーマンスボトルネック、監視など)に対するソリューション開発
- キャパシティプランニング・スケーリング戦略の策定と実施
- 信頼性向上のための運用体制の改善
※変更の範囲:会社の定める全ての業務への配置転換の可能性あり

必要スキル

求める人物像
- 業務に情熱と責任感を持ち、必要な場合にはサポートを求めることができる方
- 業界のトレンドを追いながら、新しい技術も自発的に学習できる方
- 複雑な課題に直面した際に、不確実性の中でも最適な判断ができる方
- チーム内外の意見や指摘に耳を傾け、積極的に自己改善を図ることができる方
- 自身の業務だけでなく、必要に応じてリーダーシップを発揮してチーム全体の生産性向上に貢献できる方

必須な経験/スキル
- Go、Rust、Pythonいずれかを利用したプロジェクトにおける、SREまたはDevOpsエンジニアとしての実務経験(3年以上)
- アプリケーションデリバリ・インフラストラクチャのコード化(Argo CD、Terraform、Ansibleなど)の経験
- 監視・アラートシステム(Prometheus、Grafanaなど)の導入・運用経験

あると望ましい経験/スキル
- 機械学習を使ったプロジェクトでのSREリード経験
- サービスメッシュ(Istio、Linkerdなど)の知識・経験
- フロントエンド・デモシステムなどの開発の経験

就業場所

就業形態

正社員

企業名

大手総合インターネット企業

企業概要

日本最大級のポータルサイトおよびSNS運営事業者

企業PR

業務カテゴリ

組織カテゴリ

備考

関連キーワード

応募ありがとうございました。コンサルタントからご連絡します
応募出来ませんでした。恐れ入りますがもう一度やり直してください
気になるに登録しました
気になるに登録出来ませんでした。恐れ入りますがもう一度やり直してください