ja
始める

Dataikuの機械学習(ML)

最新技術を使い、高度な機械学習モデルを構築します。

 

機能エンジニアリング

機能エンジニアリングを支援するために、Dataiku AutoMLは欠損値を自動的に充填し、安定したエンコード技術を使用し、非数値データを数値データに変換します。

ユーザーは、式、コード、または内蔵のビジュアルレシピを使用しながら新しい機能を作成し、追加の信号を提供してモデル精度を向上することができます。作成の後は、Dataikuが機能エンジニアリングステップをレシピに保存し、スコアリングやモデルの再トレーニングに再利用します。

 

AutoMLでより多くのモデルを提供

内蔵のガードレールを組み合わせたベストプラクティステクニックを使用し、モデルトレーニングプロセスを自動化することにより、ビジネスアナリストはすぐに利用可能なモデルを複数構築して比較することが 可能です。

Dataiku AutoMLは、Scikit-LearnやXGBoostなどの主要なアルゴリズムやフレームワークを利用し、全ビジネスユーザー向けの使いやすいインターフェースで最適なモデル結果を見つけます。

 

ノートブックML

DataikuはPython、R、およびJupyterベースのScalaを使用し、コードベースの実験やモデル開発向けの様々なノー トブックに対応しています。

また、統計、次元削減、時系列、およびトピックモデルなどのデータ分析用の構築済の8つのノートブックを搭載しています。

 

時系列の可視化と予測

Dataikuは、リサンプリング、ウィンドウイング、 極地抽出、および区間抽出などの時系列データ準備に対応しています。時系列の可視化により、折れ線グラフが作成され分析の時系列データを表示します。

データサイエンティストは予測プラグインを使用したり、あるいは、プロジェクトのデータ準備や可視化と組み合わせて、カスタムコードやノートブックを使用しながら予測モデルを作成し、自身の予測モデルがすぐに本番で利用できるかを確認できます。

 

KerasおよびTensorflowによる深層学習

DataikuはKerasおよびTensorflowでの深層学習に対応しています。これには、トレーニングやCPUや GPUへの展開も含まれます。

Dataikuでの深層学習モデルは、Dataikuで作成・管理されている他のモデルと同様に扱われるので、深層学習モデルはプロジェクトやビジネスアプリケーションの一部として簡単に展開されます。

 

PythonとScalaを使ったカスタムモデル

DataikuはユーザーにAutoML機能の一部であるアルゴリズムだけに限定しません。ユーザーはPythonまたは Scalaを使用するカスタムモデルも作成可能です。Dataikuでカスタムモデルは第一級オブジェクトであります。

プロジェクトに展開されると、カスタムモデルは他のモデルと同様に処理されます。カスタムコードされたモデルを使用できるこの強力な性能により、他の方法 (例えばAutoML)では簡単にはモデル作成できないユースケースが可能になります。

 

Sparkを使った大規模データセットでのトレーニング

Dataikuは、Spark MLLibまたはH2O Sparkling Waterを使用しているメモリにフィットしない大規模データセッ トでのモデルトレーニングを対応しています。

一度設定すれば、ユーザーはモデルトレーニングに Sparkを利用できるようになります。設定によって、 ユーザーはMLLibで利用可能なアルゴリズム、例えば回帰や決定木などを使用し、モデルをトレーニングしたり、あるいは深層学習、GBM、GLM、ランダムフォレスト向けのサポートと共にH2O Sparkling Waterを使用できるようになります。

Dataikuを始めましょう

オンラインでのトライアルを開始し、無料版をダウンロード、
またはディスカバー版、ビジネス版、エンタープライズ版の機能を比較
する。

始める