ja

MandM:Dataikuで実現するデータサイエンスの迅速な価値創出

MandMは、Dataikuのデプロイメント基盤とMLOps機能を活用して、小規模なデータサイエンスチームの影響力を拡大し、全社でインパクトのあるユースケースを実現しています。

数百万

顧客生涯価値の予測を日次でスコアリング

10倍

コードのみのアプローチと比べて、より迅速な業務化を実現

数百

本番環境で監視されているモデル

 

2020年におけるMandMの急成長は、顧客の増加、ひいてはデータ量の増加を意味しました。この急成長により、MandMは2つの大きな課題に直面しました。

  1. すべての利用可能なデータをサイロから取り出し、統合された分析可能な環境に集約すること
  2. 追跡可能で透明性が高く、協働的な形でAIのデプロイを拡大すること

MandMの初期の機械学習(ML)モデルはPythonで記述され、データサイエンティストのローカルマシン上で実行されていました。そのため、機械学習モデルのデプロイが中断されたり失敗したりするのを防ぐ仕組みが必要でした。

2つ目の課題に取り組むために、チームはこれらのPythonファイルをGoogle Cloud Platform(GCP)に移行しました。しかし、本番環境で稼働するモデルの数が1つから3つ、さらにそれ以上に増えると、モデルの保守にかかる負担の大きさをすぐに実感することになりました。仮想マシン上では、切り離された多数のデータセットやPythonファイルが実行されており、チームには機械学習モデルのパイプラインを確認したり停止したりする手段がありませんでした。彼らには別の解決策が必要でした。

DataikuとGCPによるスケーラブルなデータサイエンスの探求

MandMは、2つの重要な課題を解決するために、DataikuとGCPという強力な組み合わせに目を向けました。Google BigQueryのフルマネージドでサーバーレスなデータウェアハウスを活用することで、MandMはデータのサイロを解消し、チーム全体でのデータアクセスの民主化を実現しました。同時に、Dataikuのデータパイプライン構築、データ準備、モデル学習、MLOpsのための視覚的かつ協働的なインターフェース(英語)により、MandMは透明性と追跡性を確保しながら、本番環境でのモデルのスケールアウトを容易に行えるようになり、中断や失敗を回避することができました。

MandMは現在、数百の本番稼働中のモデルを保有しており、それぞれについてモデルのパフォーマンス指標の可視化、開発環境と本番環境の明確な分離、そして多くのMLOps機能がDataikuプラットフォームに組み込まれています。

チームは現在、データ準備機械学習の両方の処理を容易にGCPにプッシュダウンし、オフロードできるようになりました。Dataikuを利用することで、この機能はMandM内のあらゆるユーザープロファイルにとって利用可能となり、基盤技術やその複雑さを理解していなくても活用できます。

チームはまた、MandMのビジネスに特化した400以上の特徴量を収録した特徴量ライブラリをDataikuで構築したことを特に誇りに思っています。現在では、この特徴量ライブラリは機械学習プロジェクトのショーウィンドウのような存在となり、まず最初に人々がアクセスする場所になっています。これにより、作業の単調さや繰り返しが解消されました。

Dataikuのようなプラットフォームがあることで、データサイエンティストたちは魅力的なものを構築することに集中でき、メンテナンスや稼働確認に何時間も費やす必要がなくなります。Dataikuでワークフローをデプロイすることで、私たちは毎月、実際に数日分の工数を削減できています。 Ben Powis氏 MandMのデータサイエンス部門責任者

MandMにおけるビジネスユースケース

MandMがDataikuとGCPを活用して得られたメリットは、面倒なメンテナンス作業によって節約できた時間だけにとどまりません。ビジネス全体に対するインパクトも拡大しています。データチームは現在、アドテクから顧客生涯価値に至るまで、さまざまな課題に対して、ダッシュボードや詳細な分析レポート、本番環境にデプロイされたMLプロジェクトなど、多様なビジネスソリューションを提供できるようになっています。

以下は、彼らのユースケースの一部を詳しく紹介したものです。

MandM x Dataiku: Improving Customer and Employee Satisfaction

See how MandM used customer lifetime value scores to understand inherent future value and deliver personalized experiences.

READ THE FRONTRUNNER AWARD

How MandM uses Dataiku MLOps

MandM leveraged sophisticated machine learning models to support business growth in international markets, getting products into a production state and solutions into market quickly.

READ THE FRONTRUNNER AWARD
Watch Video
Watch Video
Watch Video

顧客生涯価値を活用したパーソナライズされた体験の提供

MandMは、自社独自のPythonモデルを開発し、それをDataiku上に構築することで、顧客生涯価値の取り組みをスタートさせました。このモデルの稼働を開始して間もなく、MandMは「顧客生涯価値予測」のためのDataikuソリューション(英語)に出会い、彼らの言葉を借りれば「すぐに飛びついて、数分でインストールしました」。

MandMのデータサイエンティストたちは、Dataikuソリューションの多くの要素に感銘を受け、Dataiku上のすべてのコードにアクセスできることから、事前構築済みプロジェクトに含まれるベストプラクティスとDataiku固有の実装に、MandMのビジネスに適した独自の変更を加えたハイブリッドモデルを構築することを決めました。

このプロセスを経て完成したプロジェクトは、はるかに強力なものとなり、すぐにパッケージ化されて自動化ノードへデプロイ可能な状態となりました。現在では、このノード上で毎日数百万のMandM顧客に対してスコアリングを実行しています。

総じて、私たちはDataikuを非常に気に入っています。AutoMLやビジュアルツールを重視するメンバーもいれば、コードでの作業を好むデータサイエンティストもいます。しかし、それこそがDataikuの魅力であり、私たちが採用を決めた理由でもあります。数回クリックするだけで済ませてしまうようなローコードツールを求めていたわけではありません。いま、チームには柔軟性があります。内部構造を深く掘り下げて取り組みたいときはそれができ、すぐにモデルを作成したいときもそれが可能です。 Ben Powis氏 MandMのデータサイエンス部門責任者

国際市場でのビジネス成長を支えるための機械学習モデルの活用

英国に本社を置くMandMは、ヨーロッパ各地で7つのローカライズされたMandMサイトを運営しています。チームは通常、1つの市場向けにモデルを開発し、成果が得られた場合にはヨーロッパ全体への展開を検討します。しかし、英国の顧客ベースを対象に構築されたモデルは、そのままでは大陸ヨーロッパ市場に適用できない可能性があります。

MandMは、Dataikuの強力な機能を活用し、プラットフォームのプロジェクトおよびデプロイメントアーキテクチャーを用いて、かつてないスピードとスケールで国際市場向けに多数のモデルバージョンを迅速に展開することで、ビジネスの成長目標を支援したいと考えていました。

Dataikuのプロジェクト構造により、チームは機械学習モデルのプロジェクトを成功に導くためのさまざまなパッケージ化の手段を得ることができました。最終的に彼らは、すべての国際バージョンのモデルを1つのDataikuプロジェクト内にまとめ、それぞれを個別のシナリオを持つ異なるフローゾーンに分けて管理することに決めました。

さらに、Dataikuでは1つのプロジェクト内で複数のモデルをトレーニングすることが可能です。そのため、各市場向けにモデルを構築、最適化した後、MandMのチームはそれらを適切なフローに簡単に組み込むことができました。

チームは、ワークフローに多くのモデルを追加するとデータエンジニアリングへの依存が増す可能性があることを認識していたため、モデルはできる限り自律的であることを求めていました。そのために、すべてのフローを構築した後、各モデルに対して高度なドリフト監視ソリューションを導入しました。これにより、各モデルは実行のたびに自らを検証し、必要に応じて最新のデータで再学習することができ、運用コストを抑えつつ、人の介入を最小限にとどめながら高精度を維持することができます。

Dataikuの外でモデルを再構築しデプロイするには数週間かかる可能性がありますが、現在のソリューションではこれが数日に短縮され、同じモデルの複数バージョンを同時に扱うことでさらに短縮されました。さらに、デプロイ済みのすべてのモデルに対してMLOps(アラート、データドリブンな学習と予測、ドリフト監視)が整備されているため、データサイエンスチームはこれらのモデルが自律的に運用されることを前提に、新たなプロジェクトの構築に専念できるようになりました。

LVMH:一元化とパーソナライゼーション — AIへのハイブリッドアプローチ

LVMHが高級品ブランド向けAIアルゴリズムの展開を一元化およびカスタマイズした事例を紹介します。

Read more