転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
| 部署・役職名 | リサーチエンジニア - Audio |
|---|---|
| 職種 | |
| 業種 | |
| 勤務地 | |
| 仕事内容 |
・ユーザーとの自然なやり取りを実現するための、低遅延なEnd-to-Endの音声対話パイプラインの構築 ・音声情報と言語情報を高度に融合させ、音声のコンテキスト(話者の感情、周囲の環境音等)を深く理解するシステムの開発 ・将来的な視覚情報の統合を見据えた、マルチモーダルな表現学習(Embedding)の最適化および検証 ・(将来的には、音声信号をテキストに変換せず直接理解し、感情やニュアンスを含めた応答を生成するネイティブ音声モデルの研究開発もお任せしていく可能性があります) |
| 応募資格 |
【必須(MUST)】 ・音声対話領域でのAIシステムのEnd-to-End構築経験・Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識 ・音声信号処理、音声認識(ASR)、または音声合成(TTS)などの関連分野における深い専門性と研究・開発経験 ・最新の音声・マルチモーダル関連の論文(Speech-to-Speech, Audio-LLM等)を理解し、自律的に実装・検証できる能力 【歓迎(WANT)】 ・フロンティアモデルの開発・運用実績・英語による技術議論およびグローバルな開発体制における業務経験 ・国際的な技術コミュニティでの活動や、英語による高度な技術交渉およびドキュメンテーション能力 ・BigTech水準のHPCインフラストラクチャを、最高のパフォーマンスで利用するための最適化能力 ・C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化、またはAIアクセラレータ(ASIC など)に関する専門的な知識 ・大規模言語モデル(LLM)と音声モデルを統合したアーキテクチャの開発経験 ・リアルタイム性が要求されるシステムにおける推論エンジンの最適化 |
| リモートワーク | 可 「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります |
| 受動喫煙対策 | 屋内禁煙 |
| 更新日 | 2026/05/26 |
| 求人番号 | 8453535 |
採用企業情報

- 企業名は会員のみ表示されます
- 会社規模31-100人
この求人の取り扱い担当者
-
- ?
- ヘッドハンターの氏名は会員のみ表示されます
会社名は会員のみ表示されます
-
- IT・インターネット
-
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
