DataikuのMLOps
機械学習プロジェクトを本番環境に展開し、モニター・管理します。
プロジェクトを本番に展開
Dataikuの統合デプロイーはDataikuデザイン(設計)ノードとプロダクションノード間でのプロジェクトファイルの動きを管理しバッチおよびリアルタイムでスコアリングします。プロジェクトバンドルは設計環境から、プロダクション環境で実行されるまで、プロジェクトが必要とするすべてをパッケージしています。
Dataikuを使用すれば、データサイエンティストは展開されたすべてのバンドルを確認することができます。ITオペレーション担当のエンジニアは新しいバンドルをいつテストして展開すべきかを素早く把握できます。
自動化ノードによるバッチスコアリング
Dataikuの自動化ノードは高度な自動化機能を備えたプロダクションノードです。モニタリング、データの更新、モデルのリトレーニングなどの日常的なタスクを、スケジュールまたはトリガーに基づいてスケジュールします。
自動化ノードを使用すれば、AIプロジェクトはスムーズに実行され、ユーザー部門は本番環境でのAIプロジェクトの数を拡張することができます。
APIノードによるリアルタイムスコアリング
リアルタイムアプリケーションの予測に基づく洞察の展開には、バッチスコアリングとは異なる一連の特性が求められます。それには、変化するニーズに対応するためのリソースのダイナミックな拡張が含まれます。
Dataiku APIノードは、拡張性のある高可用性のインフラストラクチャへのAPIエンドポイントサービスの展開を容易にし、リアルタイムスコアリングに対応します。APIノードを使用すれば、ユーザー部門はより多くのプロジェクトを展開し、AI駆動の下流アプリケーションやプロセスを構築することができます。
エッジを含むONNXでの展開
接続性、速度、費用、プライバシー上の理由で、 スマートフォンや処理装置などの同一小型デバイスにモデル、センサー、データを置く必要があるユースケースが増えています。
ONNXはFacebookとMicrosoftが共同で開発したオープンフォーマットであり、一般的な深層学習フレームワークの相互運用を可能にします。Dataikuはエッジを含む様々な環境での予測目的でONNXを使用するモデル展開に対応しています。
モニタリングとドリフト検出
AIプロジェクトが本番で起動し実行されると、実際の作業が開始されます。AIプロジェクトの操作ではパイプラインを使用してデータを処理し、 バッチおよびリアルタイムでスコアします。
Dataikuはパイプラインをモニターして、全プロセスが計画通りに実行されていることを確認し、問題がある場合はオペレーターに警告します。モデルにおいては、Dataikuはデータドリフト検出を行い、モデルが信頼できる結果を提供するように、スコアリングデータとトレーニングデータが類似していることを確認します。
自動モデルの再トレーニング
本番モデルは、より新しいデータ、 検出されたデータドリフト、または適切なスケ ジュールに基づいて定期的に更新される必要があります。
Dataiku AIプロジェクトには、スケジュールまたは有意なドリフトなどのトリガーをベースにした自動リトレーニングが含まれています。自動 リトレーニングを実装しておけば、オペレー ションチームはトラブルシューティングなどの 急を要する課題に集中し、新規プロジェクトをプロダクションに移行できます。
本番プロジェクトおよびモデル更新
本番にあるプロジェクトの手動更新は難しくてリスクがあるので、重要なAIイニシアティブに停止が生じてしまいます。
Dataikuは包括的なGit統合とバージョン管理で、モデルを含むプロダクションアーティファクトの更新を簡単にしました。Dataiku のプロダクションノードはまた簡単なテストおよび プロダクション環境に対応しているので、堅固な開発-テスト-プロダクションのアプローチを複数のプロダクションノードで更新することが できます。
DevOps用APIでの自動化CI/CD
DevOpsツールやプロセスはエンタープライズ・ソフトウェアプロジェクトでは標準てす。AIプロジェクトはいくつかの点で異なりますが、コードアーティファクトが含まれ、継続的統合とデプロイのアプローチから利益を得ることができます。
Dataikuは開発運用チームが使用する外部管理システムからプログラム可能なオペレー ションを実行するためのAPIを提供します。 DataikuはJenkins、GitLabCI、Travis CI、またはAzure Pipelinesなどの開発運用チームがすでに使用中のツールを一体化します。