MandM x Dataiku: Improving Customer and Employee Satisfaction
See how MandM used customer lifetime value scores to understand inherent future value and deliver personalized experiences.
READ THE FRONTRUNNER AWARD顧客生涯価値の予測を日次でスコアリング
コードのみのアプローチと比べて、より迅速な業務化を実現
本番環境で監視されているモデル
2020年におけるMandMの急成長は、顧客の増加、ひいてはデータ量の増加を意味しました。この急成長により、MandMは2つの大きな課題に直面しました。
MandMの初期の機械学習(ML)モデルはPythonで記述され、データサイエンティストのローカルマシン上で実行されていました。そのため、機械学習モデルのデプロイが中断されたり失敗したりするのを防ぐ仕組みが必要でした。
2つ目の課題に取り組むために、チームはこれらのPythonファイルをGoogle Cloud Platform(GCP)に移行しました。しかし、本番環境で稼働するモデルの数が1つから3つ、さらにそれ以上に増えると、モデルの保守にかかる負担の大きさをすぐに実感することになりました。仮想マシン上では、切り離された多数のデータセットやPythonファイルが実行されており、チームには機械学習モデルのパイプラインを確認したり停止したりする手段がありませんでした。彼らには別の解決策が必要でした。
MandMは、2つの重要な課題を解決するために、DataikuとGCPという強力な組み合わせに目を向けました。Google BigQueryのフルマネージドでサーバーレスなデータウェアハウスを活用することで、MandMはデータのサイロを解消し、チーム全体でのデータアクセスの民主化を実現しました。同時に、Dataikuのデータパイプライン構築、データ準備、モデル学習、MLOpsのための視覚的かつ協働的なインターフェース(英語)により、MandMは透明性と追跡性を確保しながら、本番環境でのモデルのスケールアウトを容易に行えるようになり、中断や失敗を回避することができました。
MandMは現在、数百の本番稼働中のモデルを保有しており、それぞれについてモデルのパフォーマンス指標の可視化、開発環境と本番環境の明確な分離、そして多くのMLOps機能がDataikuプラットフォームに組み込まれています。
チームは現在、データ準備と機械学習の両方の処理を容易にGCPにプッシュダウンし、オフロードできるようになりました。Dataikuを利用することで、この機能はMandM内のあらゆるユーザープロファイルにとって利用可能となり、基盤技術やその複雑さを理解していなくても活用できます。
チームはまた、MandMのビジネスに特化した400以上の特徴量を収録した特徴量ライブラリをDataikuで構築したことを特に誇りに思っています。現在では、この特徴量ライブラリは機械学習プロジェクトのショーウィンドウのような存在となり、まず最初に人々がアクセスする場所になっています。これにより、作業の単調さや繰り返しが解消されました。
Dataikuのようなプラットフォームがあることで、データサイエンティストたちは魅力的なものを構築することに集中でき、メンテナンスや稼働確認に何時間も費やす必要がなくなります。Dataikuでワークフローをデプロイすることで、私たちは毎月、実際に数日分の工数を削減できています。Ben Powis氏 MandMのデータサイエンス部門責任者
MandMがDataikuとGCPを活用して得られたメリットは、面倒なメンテナンス作業によって節約できた時間だけにとどまりません。ビジネス全体に対するインパクトも拡大しています。データチームは現在、アドテクから顧客生涯価値に至るまで、さまざまな課題に対して、ダッシュボードや詳細な分析レポート、本番環境にデプロイされたMLプロジェクトなど、多様なビジネスソリューションを提供できるようになっています。
以下は、彼らのユースケースの一部を詳しく紹介したものです。