ja
始める

Dataikuのアーキテクチャ

あらゆるクラウドやオンプレミスで大規模なデータサイエンス、機械学習、およびAIイニシアティブの結果を提供します。

 

クラウドまたはオンプレミスに対応

DataikuはAmazon Web Services (AWS)、Google Cloud Platform (GCP)、およびMicrosoft Azure対応のインスタンスを使用し、それぞれのクラウドのストレージや様々な計算レイヤーに統合することで、オンプレミスまたはクラウドで実行可能です。

 

プッシュダウン実行

多くのデータ分析システムおよびデータサイエンスシステムには計算用のインフラストラクチャーが含まれています。密接に結合しているので、システムのデータ容量不足または負荷のタイプにより、問題が生じる場合があります。

これに対するソリューションはジョブをSparkや Kubernetesなどの計算システムにプッシュダウンして大規模のワークロードを分散アーキテクチャで処理することです。

Dataikuはプッシュダ ウンアーキテクチャを使用しているので、ユーザー部門はSQLデータベース、Spark、Kubernetesなどのエラスティックで、高度に拡張可能な既存の計算システムを活用できます。

 

Kubernetesによるエラスティック・コンピューティング

クラウドサービスを使用するエラスティック・コンピューティングはしばしば、ビッグデータ分析や機械学習で作成された大量かつダイナミックな負荷を処理する最も費用効率の良い方法です。

Dataikuは包括的に管理可能なKubernetesソリューションを提供しています。これはAmazon EKS、Google Kubernetes Engine (GKE)、Azure Kubernetes Service (AKS) などの主要なクラウドコンテナーサービス、さらにオンプレミスのKubernetes/Dockerクラスターにも互換性があります。

 

CPUとGPU

GPU(グラフィカルプロセシングユニット)は特に深層学習モデルなどの特定のモデルトレーニングの種類を急激に加速する場合があります。

DataikuはモデルトレーニングにCPUとGPU両方の使用をサポートしています。複数のGPUが利用できる場合は、Dataikuはモデルトレーニングのワークロードを複数のGPUに分散して、トレーニング時間を急激に短縮します。

 

再使用可能なコンポーネント

プロジェクト全体で重複作業を避けるためには、オブジェクトの共有や再使用ができれば便利です。Dataikuにはその機能があるのでコーダーも非コーダーも作業を最大限再使用できます。

Dataikuプロジェクトフローの全てのビジュアルコンポーネントは再使用および持ち運びが可能です。個々の準備ステップ、または一つのフローのセクション全体(データセットとレシピ 共に)も他のプロジェクトに外部共有できるので、ユーザーはプロセスにあるオブジェクトの名前を変更したり、タグの付けなおしが可能で す。

 

プラグインによる拡張性

プラグインを使ってDataikuの性能を拡張できます。Dataikuのプラグインライブラリーには新規データソース、 チャート、プログラミング言語、アルゴリズムやモデリング技術、パートナー統合などへのアクセスを含む、既存のDataikuインスタンスを強化する100以上のプラグインがあります。

詳細情報

Dataikuを始めましょう

オンラインでのトライアルを開始し、無料版をダウンロード、
またはディスカバー版、ビジネス版、エンタープライズ版の機能を比較
する。

Let's go