MLOpsエンジニアになるための学習ロードマップ
MLOpsって最近よく聞くけど、どんな仕事なの?
まず最初に何を勉強すればいいの?
土台はPythonと機械学習の基礎だよ。scikit-learnで基本的な分類・回帰を学んで、PyTorchかTensorFlowでディープラーニングの流れを掴む。モデルを自分で作れる必要はないけど、学習の仕組みやデータの前処理は理解しておかないと運用で困るんだ
データパイプラインってどういうものなの?
生データを集めて、クレンジングして、特徴量を作って、学習データとして整えるまでの一連の流れだよ。Apache AirflowやPrefectでワークフローを組んで、毎日自動で最新データを処理する仕組みを作るんだ。MLの世界では「データの品質がモデルの品質を決める」って言われるくらい大事な部分だね
実験管理ってどうやるの?
モデルを実際にサービスとして動かすにはどうするの?
MLでもCICDって必要なの?
もちろんだよ。ただし普通のアプリと違って、コードだけじゃなくデータとモデルも含めたパイプラインになるんだ。新しいデータが来たら自動で再学習して、精度が基準を超えたら自動デプロイっていう流れを作る。GitHub Actionsと組み合わせてコードの変更でもパイプラインが走るようにするのが理想だね
モデルモニタリングって何を監視するの?
最近はLLMOpsっていうのもあるんだよね?