コンテンツにスキップ
← 求人一覧
エンジニアリング

LLM Inference Engineer(国産LLMサービング)

SB Intuitions

勤務地

東京都港区(フルリモート可)

リモート

給与

¥6.5M - ¥18M

言語

日本語

掲載日

2026年4月11日

必要スキル

Python分散システムLLM推論最適化AWS高性能サーバ

職務概要

ソフトバンク設立のSB Intuitionsにて、日本語特化型国産大規模言語モデルの高スループット・低レイテンシなサービング環境を実現するLLM Inference Engineerを募集しています。大規模分散システムの知見を活かし、AIモデルの本番推論基盤を構築するポジションです。

主な業務内容

  • LLM推論環境の設計・開発・最適化
  • 高スループット・低レイテンシなサービングアーキテクチャの構築
  • 大規模分散推論システムのコンポーネント設計
  • モデルサービングのパフォーマンスチューニング

応募要件

必須スキル

  • 実務経験5年以上
  • 大規模分散システムまたは高パフォーマンスサーバアプリケーションの設計・開発経験
  • 抽象化を伴うコンポーネント設計能力

歓迎スキル

  • LLM推論フレームワーク(vLLM, TensorRT-LLM等)の経験
  • GPU活用の推論最適化経験
  • KubernetesやGPUクラスタ運用経験