コンテンツにスキップ
← 求人一覧
リサーチ

Research Engineer - Audio / 音声

Third Intelligence

勤務地

東京都千代田区

ハイブリッド

給与

¥15M - ¥50M

言語

日本語 / 英語

掲載日

2026年4月14日

必要スキル

PythonPyTorchDeepSpeedFSDP音声認識音声合成ASRTTSLLMマルチモーダル

職務概要

株式会社Third Intelligenceは、Transformerを超える次世代AIアルゴリズムの創出と、個々のユーザーに最適化・成長する「遍在型AGI」の実現を目指しています。2026年1月に初回ラウンドで100億円を調達し、共同創業者兼Chief Scientistとして松尾豊教授が参画。音声を中心とした知覚・理解能力の開発を担うResearch Engineerを募集します。

主な業務内容

  • 低遅延なEnd-to-Endの音声対話パイプラインの構築
  • 音声情報と言語情報を高度に融合させ、音声のコンテキスト(話者の感情、環境音等)を深く理解するシステムの開発
  • マルチモーダルな表現学習(Embedding)の最適化および検証
  • 将来的にはネイティブ音声モデルの研究開発

求める経験

  • 音声対話領域でのAIシステムのEnd-to-End構築経験
  • Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
  • 音声信号処理、音声認識(ASR)、または音声合成(TTS)などの関連分野における深い専門性と研究・開発経験
  • 最新の音声・マルチモーダル関連の論文を理解し、自律的に実装・検証できる能力

歓迎する経験

  • フロンティアモデルの開発・運用実績
  • 英語による技術議論およびグローバルな開発体制における業務経験
  • C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化
  • 大規模言語モデル(LLM)と音声モデルを統合したアーキテクチャの開発経験
  • リアルタイム推論エンジンの最適化や低遅延化の実装経験