転職・求人情報の詳細をご覧になる場合は会員登録(無料) が必要です
部署・役職名 | MLOpsエンジニア【世界中のビジネスデータを収集/AI×SaaS/国内大手エンタープライズ企業に導入】 |
---|---|
職種 | |
業種 | |
勤務地 | |
仕事内容 |
私たちが目指すのは、Web上のあらゆるビジネス情報を再整理し、ビジネスシーンでのデータ活用業務を自然言語処理AIで総置換することです。そのために、世界中のニュース、企業情報、論文、特許などをWebから収集、抽出、加工して顧客に提供し、企業の製品化・事業化を加速させられるような「オープンデータリサーチサービス」を開発しています。 【ミッション】 Web上にある世界中のビジネスデータを機械学習を活用したプロダクトで提供できるようにデータ化するために必要となる、モデル開発以外の全てのエンジニアリングをお任せします。 【現状の課題】 ・コンテンツ抽出のノイズが多く、検索の適合率を下げてしまう要因になっている。 ・Webクローラーが時間経過とともにサイト側の構造変化によって劣化してしまうのを予測・自動復旧するシステムが存在しない。 【業務内容】 ・自然言語処理や画像処理を用いたコンテンツ抽出エンジンのMLパイプライン設計/運用 ・HTMLやPDFからコンテンツを抽出するMLアプリケーションのプロトタイプ開発 ・FaaS/CaaSによる分散処理のパフォーマンスチューニングと監視設計 ・数万オーダーのWebサイトから汎用的にクローリングするシステムの異常検知機構の構築 【ポジションの魅力】 ・顧客利用データ分析ではなく、実世界に存在するビジネスコンテンツを素材として、汎用的なデータ収集と構造化(Web2text)による価値創出に共に挑戦することができる ・これから本格開発するデータプラットフォーム構築に初期から携わることができる ・FaaSによる大規模データ収集分散処理、機械学習パイプラインの開発/運用を経験できる ・プロダクトチームやカスタマーサクセスと連携し、データで価値を創造するための企画/開発を行うことができる ・Webコンテンツ抽出エンジンの検証を通したリサーチ業務に携わることができる 【ポジションに期待する役割】 コンテンツ抽出のノイズ除去や、Webクローラーの異常検知などの機械学習システムのアーキテクチャ設計と実開発を行っていただきます。 【開発環境】 [開発言語] JavaScript(Node.js), Python, Rust [コンテナ技術] Docker [IaC] Terraform [AWS] Lambda, SQS, Step Functions, Fargate, S3, Aurora, DynamoDB, OpenSearch [GCP] Cloud Composer, Cloud Run, Cloud Functions 【当社の特徴】 ■完全内製の自社Saasプロダクト 受託開発が一般的なAI領域において、受託ではなく自社開発で汎用Saasプロダクトを構築しています。 ■高い技術力 自然言語処理✕AIの分野における日本でトップレベルランナーです。 直近、当社チーフリサーチャーが公開したモデルは、業界から注目を浴びました。 ■データ保有 オープンになっているニュースデータを最も豊富なバリエーションで有しています。 企業のクローズドデータも企業との連携により獲得しています。 ■優秀なメンバー 営業/マーケティング:伊藤忠/マクロミル/NSSOL/三井住友銀行などエンタープライズを知り尽くしたメンバーが戦略を立て実行。 エンジニア:Amazon/ヤフー/カカクコムなどのWEBアプリケーション開発に長けたメンバーがUXを重視したエンジニアリングを実施。 R&D:元東大准教授や東大博士課程修了のメンバーが最先端技術を研究。 |
労働条件 |
【就業時間】 ■裁量労働制(1日10時間) ■標準就業時間 10:00~19:00 ■リモートワーク可 ※時間にも場所にも縛られずに柔軟な働き方を実践しております! 【年間休日】 ■123日 ■完全週休2日制(土日祝) ■年末年始休暇 【有給休暇】 ■入社時付与 ※付与日数は入社月による 【その他】 ■産休取得実績有り 【試⽤期間】 ■あり(6カ⽉)※試用期間中の条件変更なし 【保険】 ■各種社会保険完備(関東ITソフトウェア健康保険組合加入) 【受動喫煙防⽌措置】 ■屋内禁煙(屋外に喫煙場所あり) |
応募資格 |
【必須(MUST)】 【すべて必須】①クラウド上でのPythonを用いたソフトウェア開発経験 ②以下の項目を1つ以上満たす方 ・機械学習など大規模データを扱うバッチ処理、ワークフローの開発/運用経験 ・MLOpsの企画/設計/開発/運用経験 【歓迎(WANT)】 ・顧客向け自社開発サービスのデータ基盤の開発、運用経験・サーバーレスおよびMLOpsに対する幅広い知見と業務経験 ・コンピュータサイエンスに関連する技術分野の修士号または博士号 ・リーダーなどの立場で事業背景を理解し自ら短期施策を立案/実行した経験 ・Elasticsearchの利用/運用経験 ・Terraformを用いた開発経験 【求める人物像】 ・コンピュータサイエンス、分散処理が好き ・最新の理論や事例をフォロー、検証するのが好き ・与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる ・ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる ・前向きなチャレンジ精神 |
アピールポイント | 自社サービス・製品あり ベンチャー企業 2年連続売り上げ10%以上UP 年間休日120日以上 産休・育休取得実績あり 新規事業 完全土日休み フレックスタイム マネジメント業務なし |
リモートワーク | 可 「可」と表示されている場合でも、「在宅に限る」「一定期間のみ」など、条件は求人によって異なります |
受動喫煙対策 | 屋内禁煙 |
更新日 | 2023/06/02 |
求人番号 | 1920393 |
採用企業情報

- 採用企業名は会員のみ表示されます
-
- 会社規模31-100人
- インターネットサービス
- ソフトウエア