リサーチ

Research Engineer - Audio / 音声

Third Intelligence

勤務地

東京都千代田区

ハイブリッド

給与

¥15M - ¥50M

言語

日本語 / 英語

掲載日

2026年4月14日

必要スキル

PythonPyTorchDeepSpeedFSDP音声認識音声合成ASRTTSLLMマルチモーダル

Third Intelligenceで応募するthird-intelligence.com で詳細を見る

職務概要

株式会社Third Intelligenceは、Transformerを超える次世代AIアルゴリズムの創出と、個々のユーザーに最適化・成長する「遍在型AGI」の実現を目指しています。2026年1月に初回ラウンドで100億円を調達し、共同創業者兼Chief Scientistとして松尾豊教授が参画。音声を中心とした知覚・理解能力の開発を担うResearch Engineerを募集します。

主な業務内容

低遅延なEnd-to-Endの音声対話パイプラインの構築
音声情報と言語情報を高度に融合させ、音声のコンテキスト（話者の感情、環境音等）を深く理解するシステムの開発
マルチモーダルな表現学習（Embedding）の最適化および検証
将来的にはネイティブ音声モデルの研究開発

求める経験

音声対話領域でのAIシステムのEnd-to-End構築経験
Python, PyTorch, Distributed Training Frameworks (DeepSpeed, FSDPなど) の深い知識
音声信号処理、音声認識（ASR）、または音声合成（TTS）などの関連分野における深い専門性と研究・開発経験
最新の音声・マルチモーダル関連の論文を理解し、自律的に実装・検証できる能力

歓迎する経験

フロンティアモデルの開発・運用実績
英語による技術議論およびグローバルな開発体制における業務経験
C++/CUDAなどの低レイヤー言語を用いた計算グラフ最適化
大規模言語モデル（LLM）と音声モデルを統合したアーキテクチャの開発経験
リアルタイム推論エンジンの最適化や低遅延化の実装経験

Third Intelligenceで応募するthird-intelligence.com で詳細を見る