【とくちょうりょうすとあ】

特徴量ストア とは?

💡 機械学習の「食材倉庫」で使い回しと品質を管理
📌 このページのポイント
特徴量ストアの構成 データソース DB / DWH ログ / イベント 外部API 特徴量計算 変換・集計 エンコード 正規化 特徴量ストア Offline バッチ 履歴データ保存 Online 低遅延 最新値を即時提供 学習 パイプライン 推論API リアルタイム予測 特徴量ストアの役割 学習と推論で同じ特徴量を一元管理し、一貫性を保証する Offline(バッチ学習用) Online(推論用・低遅延)
特徴量ストアの構成
ひよこ ひよこ

特徴量ストアって何を保管しているの?

ペンギン先生 ペンギン先生

機械学習で使う「特徴量」を保管しているよ。特徴量というのは、生データを加工してモデルに入力する形にしたものだね。たとえば「ユーザーの過去30日の購入回数」「商品の平均評価」「直近1時間のアクセス数」など、計算済みの値をすぐに使える状態で保管しておくんだ。

ひよこ ひよこ

毎回計算すればいいんじゃないの?

ペンギン先生 ペンギン先生

2つの問題があるんだ。1つ目は効率。同じ特徴量を複数のチームが別々に計算するのはムダだよね。2つ目がもっと深刻で「学習時と推論時のズレ」問題。学習では過去データからバッチ計算、推論ではリアルタイム計算で、計算方法が微妙に違ってしまうことがある。特徴量ストアはこのズレを防ぐんだ。

ひよこ ひよこ

小さなプロジェクトでも必要?

ペンギン先生 ペンギン先生

個人やモデル1つだけなら、正直なくても困らないよ。でもチームで複数モデルを運用し始めると、「あの特徴量ってどうやって計算してたっけ?」問題が頻発するんだ。目安として、チームに3人以上のMLエンジニアがいたら導入を検討する価値があるよ。

ひよこ ひよこ

代表的な特徴量ストアのツールって何があるの?

ペンギン先生 ペンギン先生

Google CloudのVertex AI Feature Store、AWSのSageMaker Feature Store、OSSではFeast(Feature Store)が有名だよ。Feastはオフラインストア(バッチ学習用)とオンラインストア(リアルタイム推論用)を両方管理できて、学習と推論の一貫性を保証してくれるんだ。

ひよこ ひよこ

特徴量のバージョン管理ってする必要があるの?

ペンギン先生 ペンギン先生

非常に重要だよ。「先月まで精度が良かったのに急に落ちた」というとき、特徴量の計算ロジックが変わったのが原因だったりする。いつ・誰が・どの特徴量を変更したかの履歴を残しておかないと再現性がなくなる。MLOpsの世界では「データのバージョン管理はコードのバージョン管理と同じくらい重要」と言われているんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「特徴量ストア」って出てきたら「機械学習用の特徴データを整理して保管・共有する倉庫のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Feature Store」 = 特徴量の保管庫
💬 Feature(特徴量)をStore(保管する場所)に集約するという意味。データのスーパーマーケットのようなイメージだよ
← 用語集にもどる