転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
| 部署・役職名 | LLM推論基盤エンジニア(LLM新規事業)【フルリモート/自社LLM】超高速推論・分散学習基盤をリードするGPU最適化スペシャリスト |
|---|---|
| 職種 | |
| 業種 | |
| 勤務地 | |
| 仕事内容 |
【現状の課題】 国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。 既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。 研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。 【業務内容】 自社プロダクトで活用する大規模言語モデル(LLM)およびマルチモーダルモデル(VLM)の推論・学習の高速化を担当します。 製品開発チームやリサーチチームと協働しながら、実際のプロダクトに最適な形で技術を落とし込んでいただきます。 ■具体的な業務内容 ・LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理) ・モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装 ・推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング) ・推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用 ※変更の範囲:開発関連業務 【チーム構成】 PaaSユニット 事業責任者(CEO)1名 プロダクトマネージャー 1名 【開発環境】 [組織体制] <PaaSエンジニアチーム> ・プロダクトマネージャー1名 ・フロントエンドエンジニア1名 ・バックエンドエンジニア1名 ・機械学習エンジニア3名 [開発言語] TypeScript、Vue.js 、Node.js、Python [コンテナ] Docker [IaC] Terraform [クラウド] AWS, Azure 【ポジションの魅力】 ・国産LLMを自社でフルスクラッチ開発している希少な環境 ・研究成果を“動くプロダクト”として社会に届ける技術開発ができる ・OSSや論文に還元できるほどの技術的挑戦を実務で経験可能 ・LLM/VLM領域の先端研究者と密に協働できる |
| 労働条件 |
【雇用形態】 正社員 ※試用期間3か月(条件に変更なし) 【勤務地/就業場所】 本社または自宅その他リモートワークが行える場所(変更の範囲なし) ※フルリモートワーク可 ■リモートワークについて ・基本的にはフルリモート体制 居住地は日本国内に限ります(海外に居住してのフルリモート不可) ・本社への出社について 弊社の定める通勤圏(一都三県)居住者は、リモート/出社を回数制限なく自由に使い分けながら勤務可能です 一都三県以外の居住者は、月1回業務とは関係なく自由に出社可能です 仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています 【勤務時間】 フレックスタイム制 コアタイム:10:00~14:00 1ヶ月の標準労働時間:1日8時間×営業日数 時間外労働あり(平均10〜20時間) ・リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。 ・勤務時間の調整や中抜けなどで、子育てや介護との両立もしやすい環境です。 【給与】 ・想定年収:7,550,000円〜13,058,000円 ※月給×12ヶ月+リモートワーク準備一時金5万円 ・月給:625,000円〜1,084,000円 <内訳> 基本給:463,424円〜803,763円 固定残業代45時間分:161,576円〜280,237円 ※超過分は別途支給 ・昇給年2回(5月、11月) 【手当】 ・通勤交通費(リモートのため実費支給) ・リモートワーク準備一時金(初回給与にて一律5万円) 【休日休暇】 ・年間休日123日 ・完全週休2日制(土日祝休み) ・年末年始休暇 ・有給休暇(入社時付与、付与日数は入社月による) ・産前産後休暇 ・育児休暇 【保険】 各種保険完備(健康・厚生年金・雇用・労災) ※関東ITソフトウェア健康保険組合加入 【その他】 ・定期健康診断 ・インフルエンザ予防接種 ・希望のPC支給 ・月1回の研究日制度(自身の技術向上・学習目的) ・オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供 ・オフィスグリコ設置 ・屋内禁煙(屋外喫煙所あり) |
| 応募資格 |
【必須(MUST)】 ※いずれか必須・PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験 ・CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用したGPU最適化知識 ・モデル推論のパフォーマンス改善・メモリ削減の実務経験 ・分散学習・推論に関する基礎理解(Data Parallel, Model Parallelなど) ・Python/C++などでの性能チューニング経験 【歓迎(WANT)】 ・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験 ・Triton Inference ServerやRayなどの分散推論基盤の知識 ・GPUクラスタ環境での実運用経験(Kubernetes, Slurm, etc.) ・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見 【求める人物像】 ・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験 ・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験 ・Triton Inference ServerやRayなどの分散推論基盤の知識 ・GPUクラスタ環境での実運用経験(Kubernetes, Slurm, etc.) ・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見 <その他> ・日本国内に居住可能な方 ・開発に関する技術的な内容含め、日本語で円滑にコミュニケーション可能な方 目安:日常会話レベル |
| アピールポイント | 自社サービス・製品あり ベンチャー企業 2年連続売り上げ10%以上UP 年間休日120日以上 産休・育休取得実績あり 教育・研修制度充実 新規事業 完全土日休み フレックスタイム |
| リモートワーク | 可 「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります |
| 受動喫煙対策 | 屋内禁煙 |
| 更新日 | 2025/12/04 |
| 求人番号 | 5984245 |
採用企業情報
- ストックマーク株式会社
-
- 会社規模101-500人
- インターネットサービス
- ソフトウエア
-
会社概要
【設立】2016年11月15日
【代表者】林 達
【本社所在地】東京都港区南青山 1丁目12-3 LIFORK MINAMI AOYAMA S209
【事業内容】
テキストマイニング×生成AI技術を活用したビジネス意思決定サポートサービスの開発・運営
弊社が解決する社会課題は、日本の海外との競争力の低下です。
国内GDPの20%を占める最大産業である『製造業を中心に国内エンタープライズ企業』は、イノベーションのジレンマを抱えています。
イノベーションを作り出す最前線で働かれている、商品開発・技術開発・事業開発・R&Dの担当者は、イノベーションを生み出すために、自社の技術を活かす用途探索&技術分析、マートケット理解を進めるために市場調査を行われていますが、情報のスピードが速く膨大にある現代において、人間の力や、既存のツールでは、対応しきれない実態があります。
弊社は、社内外にある世の中にある膨大なテキストデータを自然言語処理AIで解析し、次世代のアイデア創出ができる仕組みを、自社のSaaSプラットフォームを通じて提供しています。
ぜひ、次世代のビジネスパーソンのプラットフォームを生み出し、人類にとってイノベーションの絶えない豊かな社会を実現していきましょう!
▼サービス紹介
弊社のサービスは、日英中の3.5万サイトもの膨大な情報網から、自然言語処理を活用して、ニュース/ IR / 特許 / 論文 / 社内資料を解析し、最適な形で情報をお届けし、次世代のイノベーション創出&アイデア創出の仕組みを提供し、新しくビジネスチャンスを発掘する支援を行っております。
▼Aconnect(エーコネクト)
製造業向けAIエージェントSaaS
業務に直結する情報をAIとヒトのナレッジから、個人/チーム/組織単位で収集が可能
組織全体の「暗黙知」を「形式知」に変えて、組織全体の情報感度を高め、
事業アイディアの着想と組織内での発展を促します
▼Stockmark A Technology(ストックマーク エー テクノロジー)
「社内に埋もれたあらゆるデータを構造化し企業の資産に変える」マルチモーダルLLM搭載プラットフォーム
図表を含む非構造データを整理してデータを作り、データを活用できるようにナレッジ化して、社内の業務で使えるようにします。
【ミッション】
価値創造の仕組みを再発明し、人類を前進させる
弊社は、2016年に設立したAIスタートアップです。
イノベーションを起こしたくても起こせない大企業を中心に、世の中にある膨大なテキストデータを自然言語処理AIで解析し、次世代のアイデア創出の仕組みを提供し、新しくビジネスチャンスを発掘する支援を行っております。
2024年2月には、経済産業省およびNEDOが推進する「GENIAC(Generative AI Accelerator Challenge)プロジェクト」に採択され、1000億パラメーターの自社LLM開発に着手し始めました。
2024年10月には、シリーズDの資金調達を行い、累計調達額が88億円超となりました。
従業員も100名を超え、更なる成長を目指すために人員を募集しております!
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です