1. 転職サイト ビズリーチ
  2.  > 
  3. 求人検索
  4.  >  AIエンジニア(ドキュメント構造化 / LLM新規事業)【フルリモート/自社LLM】複雑ドキュメント構造化エンジンの開発をリードする

転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です

新規会員登録(無料)

AIエンジニア(ドキュメント構造化 / LLM新規事業)【フルリモート/自社LLM】複雑ドキュメント構造化エンジンの開発をリードする

年収:800万 ~ 1100万

採用企業案件

採用企業

ストックマーク株式会社

  • 東京都

    • 会社規模101-500人
  • インターネットサービス
  • ソフトウエア
部署・役職名 AIエンジニア(ドキュメント構造化 / LLM新規事業)【フルリモート/自社LLM】複雑ドキュメント構造化エンジンの開発をリードする
職種
業種
勤務地
仕事内容 【現状の課題】
2024年に立ち上げたLLM新規事業において、エンタープライズ企業が保有する膨大な「Excelドキュメント」の活用が急務となっています。しかし、Excel特有の複雑な仕様(セル結合、多段ヘッダ、視覚的なレイアウトなど)をLLMが解釈可能な形式に高精度に変換・構造化することは技術的難易度が高く、一般的なパーサーでは対応しきれません。

現在、この「Excel構造化」という重要かつ高難易度なテーマに専任で向き合い、仕様の深い理解に基づいたパージングロジックの実装と精度向上を担うエンジニアリソースが不足しています。

【業務内容】
LLMを用いた新規事業SaaSのバックエンドエンジニアとして、特にExcelファイルを中心としたドキュメント構造化エンジンの開発・実装をリードいただきます。

ML/データサイエンスの知見を活かしつつ、プロダクトレベルで堅牢なデータ処理パイプラインを構築するポジションです。

■具体的な業務内容
・Excel(Office Open XML等)の仕様を深く理解し、複雑な表構造を論理的に構造化するパージングロジックの開発
・構造化データの精度評価環境の構築と、継続的なロジック改善
・Pythonを用いたバックエンドAPIおよびデータ処理パイプラインの実装・運用
・MLエンジニアやデータサイエンティストと連携した、RAG向けデータ生成プロセス

【チーム構成】
<PaaS Unit>
事業責任者(CEO)1名
開発責任者 1名
プロダクトエンジニア 7名
RAGエンジニア 5名
機械学習エンジニア 3名
プロダクトマネージャー 1名
リサーチャー 1名
CS 1名
Biz 3名
新規事業企画 5名

【開発環境】
[使用言語/フレームワーク]
Python、TypeScript、Vue.js 、Node.js
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS, Azure

【ポジションの魅力】
・ファイル仕様の深淵に潜る、知的な技術挑戦:単なるライブラリ利用にとどまらず、Office Open XML等の仕様レベルまで掘り下げ「Deepな技術開発」に没頭できます。
・「アカデミアでのML経験 × 実務での実装力」が活きる:数理的思考をビジネスレベルの堅牢なコードとして昇華させることができます。
・エンタープライズRAGの「ラストワンマイル」を解決する:既存のLLMでは活用しきれないExcelデータに対し、ソリューションを提供し企業のDXを推進できます。
労働条件 【雇用形態】
正社員
※試用期間3か月(条件に変更なし)

【勤務地/就業場所】
本社または自宅その他リモートワークが行える場所(変更の範囲なし)
※フルリモートワーク可

■リモートワークについて
・基本的にはフルリモート体制
 居住地は日本国内に限ります(海外に居住してのフルリモート不可)
・本社への出社について
 弊社の定める通勤圏(一都三県)居住者は、リモート/出社を回数制限なく自由に使い分けながら勤務可能です
 一都三県以外の居住者は、月1回業務とは関係なく自由に出社可能です

仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています

【勤務時間】
フレックスタイム制
コアタイム:10:00~14:00
1ヶ月の標準労働時間:1日8時間×営業日数
時間外労働あり(平均10〜20時間)

・リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。
・勤務時間の調整や中抜けなどで、子育てや介護との両立もしやすい環境です。

【給与】
想定年収:7,008,000円〜11,004,000円 ※月給×12ヶ月

月給:584,000円〜917,000円
<内訳>
・基本給:433,023円〜679,935円
・固定残業代45時間分:150,977円〜237,065円 ※超過分は別途支給

昇給年2回(5月、11月)

【休日休暇】
年間休日123日
完全週休2日制(土日祝休み)
年末年始休暇
有給休暇(入社時付与、付与日数は入社月による)
産前産後休暇
育児休暇

【保険】
各種保険完備(健康・厚生年金・雇用・労災)
※関東ITソフトウェア健康保険組合加入

【その他】
通勤交通費(リモートのため実費支給)
定期健康診断
インフルエンザ予防接種
希望のPC支給
月1回の研究日制度(自身の技術向上・学習目的)
オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供
オフィスグリコ設置
屋内禁煙(屋外喫煙所あり)
応募資格

【必須(MUST)】

※すべて必須
・理工系大学院を修了、またはそれに準ずる数学・アルゴリズムの知識
・Pythonを用いたWebアプリケーションまたはデータ処理基盤のバックエンド開発経験(3年以上目安)
・複雑なデータ構造を扱うロジックの実装経験
ex) 社内データや実験データを生成してデータとして扱えるようにした経験


【歓迎(WANT)】

・大学・大学院時代に機械学習(ML)やデータサイエンスの研究・活用経験があること
・pandas, openpyxl などのライブラリを用いた高度なデータ処理経験
・Computer Vision(CV)の基礎知識(レイアウト解析の理解に役立ちます)
・データエンジニアとしてのETL処理の実装経験
・Office Open XML等のファイル仕様に関する深い知識

【求める人物像】
・ML/数理的なバックグラウンドを持ちつつ、職種としてはエンジニアリング(実装)にこだわりがある方
・仕様が複雑なデータやドキュメントに対し、構造を紐解きハックすることに面白みを感じる方
・研究開発的なタスクを、保守性の高いプロダクトコードに落とし込むことができる方
・ビジネスサイドと連携し、顧客価値につながるデータ構造化を追求できる方

<その他>
・日本国内に居住可能な方
・開発に関する技術的な内容含め、日本語で円滑にコミュニケーション可能な方
 目安:日常会話レベル
アピールポイント 自社サービス・製品あり ベンチャー企業 2年連続売り上げ10%以上UP 年間休日120日以上 産休・育休取得実績あり 教育・研修制度充実 新規事業 完全土日休み フレックスタイム
リモートワーク

「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります
受動喫煙対策

屋内禁煙

更新日 2026/01/09
求人番号 6417120

採用企業情報

ストックマーク株式会社
  • ストックマーク株式会社
  • 東京都

    • 会社規模101-500人
  • インターネットサービス
  • ソフトウエア
  • 会社概要

    【設立】2016年11月15日
    【代表者】林 達
    【本社所在地】東京都港区南青山 1丁目12-3 LIFORK MINAMI AOYAMA S209

    【事業内容】
    テキストマイニング×生成AI技術を活用したビジネス意思決定サポートサービスの開発・運営


    弊社が解決する社会課題は、日本の海外との競争力の低下です。

    国内GDPの20%を占める最大産業である『製造業を中心に国内エンタープライズ企業』は、イノベーションのジレンマを抱えています。

    イノベーションを作り出す最前線で働かれている、商品開発・技術開発・事業開発・R&Dの担当者は、イノベーションを生み出すために、自社の技術を活かす用途探索&技術分析、マートケット理解を進めるために市場調査を行われていますが、情報のスピードが速く膨大にある現代において、人間の力や、既存のツールでは、対応しきれない実態があります。

    弊社は、社内外にある世の中にある膨大なテキストデータを自然言語処理AIで解析し、次世代のアイデア創出ができる仕組みを、自社のSaaSプラットフォームを通じて提供しています。

    ぜひ、次世代のビジネスパーソンのプラットフォームを生み出し、人類にとってイノベーションの絶えない豊かな社会を実現していきましょう!


    ▼サービス紹介
    弊社のサービスは、日英中の3.5万サイトもの膨大な情報網から、自然言語処理を活用して、ニュース/ IR / 特許 / 論文 / 社内資料を解析し、最適な形で情報をお届けし、次世代のイノベーション創出&アイデア創出の仕組みを提供し、新しくビジネスチャンスを発掘する支援を行っております。

    ▼Aconnect(エーコネクト)
    製造業向けAIエージェントSaaS
    業務に直結する情報をAIとヒトのナレッジから、個人/チーム/組織単位で収集が可能
    組織全体の「暗黙知」を「形式知」に変えて、組織全体の情報感度を高め、
    事業アイディアの着想と組織内での発展を促します

    ▼Stockmark A Technology(ストックマーク エー テクノロジー)
    「社内に埋もれたあらゆるデータを構造化し企業の資産に変える」マルチモーダルLLM搭載プラットフォーム
    図表を含む非構造データを整理してデータを作り、データを活用できるようにナレッジ化して、社内の業務で使えるようにします。


    【ミッション】
    価値創造の仕組みを再発明し、人類を前進させる

    弊社は、2016年に設立したAIスタートアップです。
    イノベーションを起こしたくても起こせない大企業を中心に、世の中にある膨大なテキストデータを自然言語処理AIで解析し、次世代のアイデア創出の仕組みを提供し、新しくビジネスチャンスを発掘する支援を行っております。

    2024年2月には、経済産業省およびNEDOが推進する「GENIAC(Generative AI Accelerator Challenge)プロジェクト」に採択され、1000億パラメーターの自社LLM開発に着手し始めました。
    2024年10月には、シリーズDの資金調達を行い、累計調達額が88億円超となりました。

    従業員も100名を超え、更なる成長を目指すために人員を募集しております!

転職・求人情報の詳細をご覧になる場合は会員登録(無料)が必要です

新規会員登録(無料)

<< 検索結果に戻る