エンジニアリング

MLエンジニア（SRE×MLOps・本番AI基盤）

スリーシェイク

勤務地

東京都（フルリモート可）

リモート

給与

750万〜1,500万

言語

日本語

掲載日

2026年4月11日

必要スキル

PythonPyTorchKubernetesKubeflowVertex AIMLflowNeMoNIMPrometheusGrafanaOpenTelemetryAWSGCPTerraformDocker

スリーシェイクで応募するhrmos.co で詳細を見る

職務概要

SREドメインで国内トップクラスの実績を持つ株式会社スリーシェイクが、生成AI・機械学習モデルの開発・運用支援を本格化するにあたり、MLエンジニアを募集しています。NVIDIA Inceptionプログラムに採択され、最新GPU環境やDLI研修など、AI開発に特化したリソースを活用できる環境です。モデルを「作る」だけでなく「本番環境で動かし続ける」MLOps視点を持つエンジニアを求めています。

主な業務内容

NeMoを用いたLLM・画像・音声モデルのファインチューニング・カスタマイズ（LoRA・RAG・RLHF等）
NIMでの推論マイクロサービス設計・実装・パフォーマンス最適化
Python/PyTorchを中心としたモデル開発・評価・改良サイクルの推進
Kubeflow・Vertex AI・MLflow等を活用したMLパイプライン構築・自動化・継続的デプロイ
本番モデルのパフォーマンス監視・ドリフト検知・再学習トリガーの設計・運用
モデルの推論品質・レイテンシ・コストのモニタリング基盤構築（Prometheus・Grafana・OpenTelemetry連携）
SREチームと連携したMLシステムの信頼性・可用性向上（SLI/SLO定義、インシデント対応）

応募条件

機械学習モデルの開発・運用経験
Python/PyTorchを用いたモデル開発経験
MLOps基盤（Kubeflow、MLflow、Vertex AI等）の構築・運用経験
クラウド環境（AWS/GCP）でのインフラ構築・運用経験
Kubernetes環境での開発経験があれば尚可

スリーシェイクで応募するhrmos.co で詳細を見る