転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
| 部署・役職名 | ITインフラ本部/SRE部/SRE(AIとともに、信頼性を設計するSREを実践してみませんか?) |
|---|---|
| 職種 | |
| 業種 | |
| 勤務地 | |
| 仕事内容 |
# 募集背景 サービス規模の拡大に伴い、DMMのSRE部が向き合う運用課題は年々複雑化しています。 障害対応、オンコール、コスト管理、設定変更の影響把握など、「判断が遅れること自体がリスクになる」場面も増えてきました。 これまで私たちは、標準化・自動化・可観測性の整備によって運用を改善してきましたが、次のステップとして、運用データや過去の知見をAIに活用させるフェーズに進んでいます。 SREの経験を持つエンジニアがAIを理解し、AIを理解したエンジニアがSREの現場を知ることでしか実現できない取り組みです。 運用の最前線で課題と向き合いながら、SREのあり方そのものをアップデートしていく仲間を募集しています。 # 事業概要 DMMは、動画配信、電子書籍、EC、ゲーム、金融など、多様な事業を展開する多角化企業です。 それぞれの事業は独立したスピード感で成長する一方、その基盤となるインフラと運用の信頼性が、全社の価値提供を支えています。 SRE部は、こうしたDMMの複数事業を横断して支える専門組織として、サービスの可用性・信頼性・パフォーマンス・コスト最適化を担っています。 個別の基盤は各サービスの担当が担いますが、共通でメリットが出る部分は特定のプロダクトに閉じず、共通基盤・共通指針を整備することで、事業やチームの増減に左右されない安定した運用を実現しています。 また、可観測性基盤を中心としたデータに基づく運用や、自動化・標準化による運用負荷の低減にも継続的に取り組んできました。 現在はさらに一歩進み、これらの運用データや知見をAIと組み合わせることで、障害対応や意思決定をより再現性の高い形へ進化させる挑戦を進めています。 SRE部のミッションは、単に「障害を防ぐ」ことではなく、事業が安心して挑戦できる土台を提供し続けることです。 技術と運用の両面からDMMの事業成長を支えることが、私たちの役割です。 # 「業務内容」 SRE部の一員として、DMMが展開する複数の事業・サービスを横断的に支える 信頼性・可用性・運用効率の向上に取り組んでいただきます。 主な業務内容 ・AI Agentの開発を通した運用改善 運用データを活用した障害対応・判断支援の自動化 LLMを用いた運用ナレッジの整理・検索・活用の仕組みづくり ・サービス信頼性の向上 可用性・パフォーマンス・耐障害性を考慮したシステム設計・改善 障害発生時の原因分析および恒久対応の実施 ・可観測性の設計・運用 メトリクス/ログ/トレースを含む可観測性全体の設計・改善 特定ツールに依存しない、可観測性の考え方・設計方針の整理 サービス特性に応じた監視・アラート設計および運用改善 運用データを活用した課題発見・障害予兆の検知 クラウド、オンプレ双方のオブザーバビリティツール基盤(Datadog/NewRelic/Prometheus)の構築・運用 ・運用の標準化・自動化 手作業に依存しない運用フローの設計・実装 Runbookや運用手順の整備・改善 ・コスト最適化の推進 クラウドリソースの利用状況の可視化 コスト削減施策の立案・実装・全社展開 ・事業部・開発チームとの協業 各事業のSRE/開発チームと連携した課題整理・改善提案 共通基盤・共通指針の整備による組織全体の信頼性向上 # 「ポジションの魅力」 ・特定のプロダクトに閉じず、横断的な視点でSREに取り組める ・可観測性・自動化・コスト最適化といったSREの王道領域をしっかり経験できる ・AI活用は「必須スキル」ではなく、現場課題から自然に使うフェーズ ・仕組みを作って終わりではなく、全社に広げ、定着させるところまで関われる |
| 労働条件 |
【リモート勤務可】 ※所属部署の判断によりオフィスへ出勤していただくことがあります。 ※所属部署の勤務実態については面接時にお問い合わせください。 【エンジニア向けサポート制度】 ・PC端末選択制(windows/mac)※一部指定部署あり ・AWS、GCP、Azure実弾演習場(雇用形態により利用制限あり、非エンジニアも利用可) ・技術書の貸出 ・勉強会、コミュニティ支援制度(雇用形態、所属により利用制限あり) ・カンファレンス参加支援制度(雇用形態、所属により利用制限あり) ・資格受験費用負担 ※合格の場合。対象資格制限あり |
| 応募資格 |
【必須(MUST)】 ・Webサービスにおける 信頼性・可用性を意識した運用経験・障害や性能劣化に対し、事象の切り分けから恒久対応まで主導した経験 ・メトリクス/ログ/トレースを用いた 状態把握および原因分析の経験 ・監視・アラートを運用負荷の観点で設計・改善した経験 ・運用上の判断や対応を 再現可能な形で言語化・定着させた経験 ・アプリケーションまたは運用ツールの開発経験 【歓迎(WANT)】 SRE・基盤領域・SREまたはそれに準ずる立場での業務経験 ・クラウド環境における 設計・運用・変更管理の経験 ・Infrastructure as Code を用いた 構成管理・運用の体系化 ・可観測性基盤の設計・刷新・改善に関わった経験 AI・LLM活用 ・LLMやAIを用いた 業務改善・運用効率化の実践経験 ・運用データ(ログ・メトリクス等)を入力としたAI Agentの開発経験 ・分析・要約・判断支援の仕組みを設計・実装した経験 ・APIやSDKを用いて、AIを既存システムや運用フローに組み込んだ経験 【求める人物像】 1. SREとしての専門性・改善への姿勢 ・ 信頼性を運用作業ではなく設計課題として捉え、自ら手を動かして改善を進められる方 ・ 障害対応を一時的な対処で終わらせず、時間と労力をかけてでも構造的かつ再現可能な改善へ昇華できる方 ・ 過去の経緯や制約が積み重なった複雑で絡み合った運用課題に対しても、面倒さから目を背けず、状況を整理しながら向き合える方 ・ 「きれいに作り直す」前に、地道な調査や理解を厭わず、まずは現状を把握し、壊さずに改善していける方 2. オーナーシップ・粘り強さ ・ 与えられたタスクを待つのではなく、自ら課題を拾い、手を挙げ、責任を持って最後までやり切れる方 ・ 「やらない理由」を探すのではなく、多少の負荷がかかる状況でもどうすれば前に進められるかを考えられる方 ・ 不確実性の高い領域(運用 × AIなど)においても、短期的な成果に固執せず、腰を据えて仮説と検証を粘り強く反復できる方 ・ 課題解決の過程で一定の負荷がかかる局面においても、踏み込みを止めず、腰を据えて向き合い、最後までやり切れる方 ・「誰かがやるだろう」ではなく、「自分がやる」と決められる人 3. 柔軟性とチーム連携 ・ 技術やツールを目的化せず、状況に応じて試行錯誤を重ねながら冷静に選択・棄却を判断できる方 ・ 事業・開発と対話する中で、調整や合意形成の手間を惜しまず、相手の前提や背景を尊重しつつ現実的な落としどころを探れる方 ・ 知識や判断を個人に閉じず、時間を割いてでもチームや組織の資産として共有する姿勢を持つ方 |
| アピールポイント | 自社サービス・製品あり 20代管理職実績あり 従業員数1000人以上 シェアトップクラス 2年連続売り上げ10%以上UP 年間休日120日以上 産休・育休取得実績あり |
| 受動喫煙対策 | 喫煙室設置 |
| 更新日 | 2026/01/06 |
| 求人番号 | 1636715 |
採用企業情報
- 合同会社DMM.com
-
- 資本金100百万円
- 会社規模非公開
- インターネットサービス
- その他
-
会社概要
【設立】1999年11月17日
【代表者】最高経営責任者 亀山 敬司
【資本金】1億1円
【従業員数】2,584名
【本社所在地】東京都港区六本木三丁目2番1号
【その他事業所】加賀事業所、金沢事業所
【事業内容】
動画配信事業、ゲーム事業、証券事業、英会話事業等、約40種以上のサービス展開や、業界業種に限らず様々な企業のM&Aなどと、多角的な事業展開を進めております。
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です