コンテンツにスキップ
← 求人一覧
エンジニアリング

MLエンジニア(SRE×MLOps・本番AI基盤)

スリーシェイク

勤務地

東京都(フルリモート可)

リモート

給与

750万〜1,500万

言語

日本語

掲載日

2026年4月11日

必要スキル

PythonPyTorchKubernetesKubeflowVertex AIMLflowNeMoNIMPrometheusGrafanaOpenTelemetryAWSGCPTerraformDocker

職務概要

SREドメインで国内トップクラスの実績を持つ株式会社スリーシェイクが、生成AI・機械学習モデルの開発・運用支援を本格化するにあたり、MLエンジニアを募集しています。NVIDIA Inceptionプログラムに採択され、最新GPU環境やDLI研修など、AI開発に特化したリソースを活用できる環境です。モデルを「作る」だけでなく「本番環境で動かし続ける」MLOps視点を持つエンジニアを求めています。

主な業務内容

  • NeMoを用いたLLM・画像・音声モデルのファインチューニング・カスタマイズ(LoRA・RAG・RLHF等)
  • NIMでの推論マイクロサービス設計・実装・パフォーマンス最適化
  • Python/PyTorchを中心としたモデル開発・評価・改良サイクルの推進
  • Kubeflow・Vertex AI・MLflow等を活用したMLパイプライン構築・自動化・継続的デプロイ
  • 本番モデルのパフォーマンス監視・ドリフト検知・再学習トリガーの設計・運用
  • モデルの推論品質・レイテンシ・コストのモニタリング基盤構築(Prometheus・Grafana・OpenTelemetry連携)
  • SREチームと連携したMLシステムの信頼性・可用性向上(SLI/SLO定義、インシデント対応)

応募条件

  • 機械学習モデルの開発・運用経験
  • Python/PyTorchを用いたモデル開発経験
  • MLOps基盤(Kubeflow、MLflow、Vertex AI等)の構築・運用経験
  • クラウド環境(AWS/GCP)でのインフラ構築・運用経験
  • Kubernetes環境での開発経験があれば尚可