1. 転職サイト ビズリーチ
  2.  > 
  3. 求人検索
  4.  > 4326 サイトリライアビリティエンジニア SRE(機械学習プラットフォーム)_DPS

転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です

新規会員登録(無料)

4326 サイトリライアビリティエンジニア SRE(機械学習プラットフォーム)_DPS

年収: 800万 ~ 1200万 ?

ヘッドハンター案件

部署・役職名 4326 サイトリライアビリティエンジニア SRE(機械学習プラットフォーム)_DPS
職種
業種
勤務地
仕事内容 【事業・組織構成の概要】
私たちは、当社のAI事業を加速させるためのAIスパコンを開発・運用する、新設のエンジニアリンググループです。世界で最高のモノづくりにこだわり、先進AIで社会にイノベーションを起こしたい方を募集しています。

当社では、世界でも有数の数百名のAIエンジニアがAIスパコンを用いて、当社独自の生成AI等の大規模なAIモデルの開発を行っています。また、生成AI以外にも世界トップレベルの生体認証技術を始めとして、画像認識・データ分析・言語モデル(LLM)・ロボット制御等、多種多様な分野でAIの開発を行っており、事業の応用分野も多岐に及んでいます。

このAIスパコンは、生成AIの研究開発を支えるキーコンポーネントであり、当社のAI事業全体を強化・推進するべくAIスパコンの開発・運用を共に行って頂ける方を求めており、技術の力で事業の未来をデザインする、極めて重要なポジションです。

※ 本ポジションは、事業用AIスパコンの開発はAIテクノロジーサービス事業部門(AITS)、研究開発用AIスパコンは研究&事業開発戦略統括部(RBSD) への配属となります。当社のAIエンジニアとともに顧客向けの業務特化型AIの開発環境を共に作りたい方はAITSへの配属を、当社のAI研究者を研究所とともに作り先進AIの研究開発を行う開発環境を作りたい方はRBSDの配属を希望してください。


【職務内容】
最新のハイエンドGPU928基を備える国内企業で最大級のAIスーパーコンピューターを開発・運用を共に行って頂くSite Reliability Engineer (Machine Learning Plaftorm) を数名募集します。スケーラブルかつ洗練されたGPUサーバーを用いた世界有数のAIスパコンを開発・運用し、AIの技術開発に革新をおこしたい方を募集しています。コンピューターアーキテクチャ・ソフトウェアアーキテクチャに精通し、世界に誇れるAIスパコンを共に開発・運用して頂ける方を求めています。

AIスパコンの安定運用を行いながらもAIの進化に合わせ基盤強化を行うには、ソフトウェアの高い開発能力が必要であり、ソフトウェア開発へのこだわりのある方を募集します。

【職場環境】
リモートワーク:週半分以上可能
出社推奨日としてチーム全体で集合日が週一回程度設定される場合あり

職務変更の範囲:会社の定める職務
応募資格

【必須(MUST)】

【MUST】
下記を全て満たすこと
・ 5年以上のソフトウェア開発・運用の実務経験
・ Kubernetesの利用経験及び拡張経験
・ 大規模システムの運用設計・監視の経験
・ 7-10名程度のチームのマネージメント/開発チームのリード経験(課長採用の場合)

【WANT】
・ 大規模サイトなどでのSREとしての経験(ベアメタルサーバーでの開発経験があれば尚良いです)
・ Kubernetesのクラスタの運用経験
・ 数PB規模の分散ファイルシステムを用いたストレージの開発・運用の実績。
・ GPU関連処理技術への理解(CUDA、NCCL、MPI等)
・ Go言語での開発経験
・ オープンソースプロジェクトへの貢献(GithubのURLがあればプラス)
・ 各種の学習フレームワークへの理解(PyTorch等)

【求める人物像・ソフトスキル】
・コンピュータサイエンスに精通し、ソフトウェア開発への情熱のある方
・AIの可能性を信じ、AIで世界を変えたいと思っている方
・新しいテクノロジースタック群を追い続けられるだけの強い技術への好奇心を持っている方
・高い自主性を持ち、プロジェクトをともに推進して頂ける方

受動喫煙対策

その他

「就業場所が屋外である」、「就業場所によって対策内容が異なる」、「対策内容は採用時までに通知する」 などの場合がその他となります。面接時に詳しい内容をご確認ください
更新日 2026/06/16
求人番号 8673774

採用企業情報

この求人の取り扱い担当者

転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です

新規会員登録(無料)

<< 検索結果に戻る