← 求人一覧リサーチ
Research Engineer - Audio / 音声
Third Intelligence
勤務地
東京都千代田区
ハイブリッド
給与
¥15M - ¥50M
言語
日本語 / 英語
掲載日
2026年4月14日
必要スキル
PythonPyTorchDeepSpeedFSDP音声認識音声合成ASRTTSLLMマルチモーダル
職務概要
株式会社Third Intelligenceは、Transformerを超える次世代AIアルゴリズムの創出と、個々のユーザーに最適化・成長する「遍在型AGI」の実現を目指しています。2026年1月に初回ラウンドで100億円を調達し、共同創業者兼Chief Scientistとして松尾豊教授が参画。音声を中心とした知覚・理解能力の開発を担うResearch Engineerを募集します。
主な業務内容
- 低遅延なEnd-to-Endの音声対話パイプラインの構築
- 音声情報と言語情報を高度に融合させ、音声のコンテキスト(話者の感情、環境音等)を深く理解するシステムの開発
- マルチモーダルな表現学習(Embedding)の最適化および検証
- 将来的にはネイティブ音声モデルの研究開発
求める経験
- 音声対話領域でのAIシステムのEnd-to-End構築経験
- Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
- 音声信号処理、音声認識(ASR)、または音声合成(TTS)などの関連分野における深い専門性と研究・開発経験
- 最新の音声・マルチモーダル関連の論文を理解し、自律的に実装・検証できる能力
歓迎する経験
- フロンティアモデルの開発・運用実績
- 英語による技術議論およびグローバルな開発体制における業務経験
- C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化
- 大規模言語モデル(LLM)と音声モデルを統合したアーキテクチャの開発経験
- リアルタイム推論エンジンの最適化や低遅延化の実装経験