転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です
| 部署・役職名 | 【東大松尾研発AIベンチャー】AI/MLエンジニア(Vision Language Model・動画認識) |
|---|---|
| 職種 | |
| 業種 | |
| 勤務地 | |
| 仕事内容 |
【会社概要】 株式会社Ollo(オロ)は、2019年に東京大学 松尾研究室のメンバーを中心に設立された、製造業向けAIスタートアップです。 「ものづくりの仕事を、ワクワクで溢れさせる」をミッションに掲げ、作業分析AIソフトウェア「Ollo Factory」を開発・提供しています。 代表の川合は松尾研究室出身のエンジニアであり、いまもコードを書き続けています。 Ollo Factoryは、日産自動車・スズキをはじめとする国内最大手自動車メーカーに採用され、現在では世界30ヶ国・5,000現場以上で利用されるグローバルプロダクトへと成長しています。 【募集背景】 当社のコア技術である動画認識AIは、世界中の製造現場で日々膨大な作業映像を解析しています。このポジションでは、動画認識モデル(Vision Language Model、VLM)の開発・改善を中心に担っていただきます。 具体的には、以下のような方向でモデルを進化させていきます。 モデルの精度や実行スピードの向上 動画を対象としたRAG(Video RAG)による現場ナレッジの検索・活用 エッジデバイス上での大規模モデルの実行 製造ラインでのリアルタイム推論 研究と実装の両面で取り組むべきテーマが多く、中心メンバーとして関わっていただけるポジションです。 【業務内容】 ・製造現場の作業動画を解析するVision Language Modelの研究開発・改善 ・行動認識・姿勢推定・物体検出など、Computer Vision領域のモデル設計・学習・評価 ・多様な現場環境(照明・カメラ角度・作業内容)に対応するロバスト性の向上 ・エッジデバイス上での大規模モデルの最適化・デプロイ ・製造ラインにおけるリアルタイム推論パイプラインの構築 ・モデルの量子化・蒸留・プルーニングによる軽量化 【開発環境】 ・Webフロントエンド: TypeScript, Vue, Nuxt.js ・バックエンド: Go, GraphQL, Python(FastAPI) ・デザイン: figma ・データベース: MySQL ・コミュニケーションツール: Slack ・ドキュメント管理: Notion ・コード管理: GitHub ・laC: Terraform ・インフラ: AWS ・IDE: vscode ・CI/CD: GitHub Actions ・コーディング支援: Github Copilot 【エンジニアチーム】 アルゴリズム開発:5名 Webアプリ開発:5名 インフラ:1名 【仕事の魅力】 ・少数精鋭のチームで、立ち上がったばかりのサービス開発をするため、一人当たりの裁量や権限が大きい ・立場や役職に関係なく議論ができるフラットな社風のため、自身の考えや意見を主体的に提案することができる ・弊社プロダクトは大手企業への導入実績があり、今後のさらなる拡大フェーズを体験でき、同時にスタートアップの組織拡大フェーズのコアメンバーとして活躍できる ・エンジニアが、プロダクトが導入される工場に訪問する機会があるため、開発しているプロダクトがどのように使われ評価されているのかを自分の目で確かめられ、機能のアップデートや改善に直接繋げられる ・東大出身のAI技術者が会社のほとんどを占めており、AI技術についてハイレベルに学べる環境がある ・経験豊かな経営陣、ビジネスメンバーが多数在籍しているため、安定した取り組みが可能 ・日々の業務においては、エンジニアサイド・ビジネスサイド双方から質問/提案/顧客要望などがあればすぐコミュニケーションをとって解決を目指しているため、プロダクトグロースに関心が高いエンジニアにとってスムーズに業務推進ができる環境がある ・エンジニアチームは平均年齢28歳のメンバーで構成されている |
| 労働条件 |
【勤務条件・その他】 フレックスタイム制 標準労働時間:8時間‧休憩時間:60分 平均残業時間:平均30時間∕月 ・完全週休2日制(土‧日) ・祝日 ・年末年始休暇 ・夏季休暇 ・GW⻑期休暇 社会保険完備(健康保険‧厚生年金保険、雇用保険‧労災保険) 【待遇】 月給 583,000円 〜 833,000円 年収7,000,000円〜10,000,000円 ストックオプション制度あり 賞与1ヶ月分 業績に応じて変動 |
| 応募資格 |
【必須(MUST)】 以下のいずれか、または複数の実務経験(1年以上)もしくはそれに準ずる研究実績・動画・画像認識(物体検出、行動認識、セグメンテーション等) ・VLM / マルチモーダルモデル(Vision-Language系モデルの学習・活用) ・LLM(ファインチューニング、RAG、プロンプトエンジニアリング等) ・Python を用いたソフトウェア開発経験(1年以上) ・Deep Learningフレームワーク(PyTorch 等)の実践的な利用経験 【歓迎(WANT)】 ・Video Understanding / Action Recognition 分野の研究・開発経験・Vision-Language Modelの学習・活用経験 ・LLM / VLM の post-training 経験(SFT、instruction tuning、RLHF・DPO 等の強化学習ベースのアライメント) ・動画や画像を対象としたRAGシステムの設計・構築経験 ・エッジ推論の最適化(TensorRT、ONNX Runtime、量子化・蒸留等)の経験 ・リアルタイム映像処理パイプラインの設計・実装経験 ・製造業ドメインの知見 ・論文の執筆・国際学会での発表実績 ・英語でのコミュニケーション能力(グローバル展開に伴い活用機会あり) 求める人物像 ・最新のAI技術動向を積極的にキャッチアップし、プロダクトに応用できる方 ・技術で社会に貢献したいという意欲のある方 ・不確実性の高い環境でも自律的に仮説を立て、検証・改善を繰り返せる方 |
| アピールポイント | 創立5年以内 自社サービス・製品あり ベンチャー企業 20代管理職実績あり 2年連続売り上げ10%以上UP 年間休日120日以上 ストックオプション制度あり 教育・研修制度充実 新規事業 海外事業 完全土日休み フレックスタイム |
| リモートワーク | 不可 |
| 受動喫煙対策 | 屋内禁煙 |
| 更新日 | 2026/02/07 |
| 求人番号 | 7257454 |
採用企業情報
- 株式会社Ollo
-
- 資本金228百万円
- 会社規模1-30人
- その他
-
会社概要
【設立年月日】2019年2月20日
【代表者】川合 健斗
【資本金】2.28億円
【従業員数】20名
【本社所在地】東京都文京区本郷4-1-5
【事業内容】東京大学発画像認識ベンチャー
【代表プロフィール】
CEO 川合 健斗
2014年に筑波大学大学院コンピュータサイエンス専攻を修了。その後は東京大学松尾研究室にて共同研究のプロジェクトリーダーを複数経験。2019年にOlloを創業。
転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です