【Dataiku 14.7新機能】Dataiku Cobuildとは?自然言語でAIパイプラインを構築するエンタープライズ向けエージェントの全貌

はじめに

AI開発のスピードが加速する中、多くの企業が直面しているのが「プロトタイプから本番環境への移行」の壁です。 ソフトウェア開発のスピードを上げるためにAIコード生成ツールが急速に普及していますが、 出力されたコードは多くのビジネス部門やガバナンス部門にとってレビューが難しく、ブラックボックス化してしまいがちです。

そんな課題を解決するツールとして、AIサクセスプラットフォームを提供するDataikuから2026年6月18日より「Dataiku Cobuild」が一般提供されました。 本記事では、Cobuildの概要や具体的な対応範囲、使い方、他のAIツールとの違い、触ってみた感触についてまとめます。


1. Dataiku Cobuildについて

Dataiku Cobuildは、ビジネス上の課題を自然言語で入力するだけで、コードを一切書かずにAIプロジェクトを自動生成するエンタープライズ向けのAI構築エージェントです。

最大の強みは、解読不能なコードではなく「Dataikuのビジュアルフロー」を直接生成する点です。 これにより、ビジネス部門、IT部門、ガバナンス部門の全員が同じ画面を見て、本番移行前に処理の意図を検査・編集・承認することが可能になります。

対応している基盤とモデル

Cobuildは主要なエンタープライズインフラやLLMと安全に直結した状態で動作します。具体的には以下のプラットフォームやモデルに対応しており、企業の管理下にあるセキュアな環境で利用可能です。

  • Snowflake Cortex AI
  • Databricks AI Gateway
  • AWS Bedrock
  • Google Gemini
  • Microsoft Foundry
  • OpenAI
  • Anthropic

構築可能なレシピと成果物の範囲

Cobuildはデータ準備からML、生成AIまで非常に幅広いコンポーネントの構築に対応しています。

  • コアビジュアルレシピ
    Prepare, Filter/Sample, Sync, Group, Sort, Join (Fuzzy, Geo含む), Distinct, Top N, Pivot, Stack, Window
  • コードレシピ
    Python, SQL Query
  • 機械学習 (ML)
    モデルの学習 (Train), 予測 (Predict)
  • 生成AI (GenAI)
    データセットやドキュメントの埋め込み (Embed), 知識バンク (Knowledge Bank) の構築
  • フロー以外の成果物
    チャート、ダッシュボード、Jupyter Notebook、WebApp、Wikiの作成
  • 自動化
    上記すべてを組み合わせて自動実行するシナリオ (Scenario) の構築
  • 既存の成果物に対する操作
    抽出に失敗した行の特定、既存フローのリファクタリング、ジョブログの監査、エラーに対する解決策のガイダンス提示

2. Cobuildを使うには

Cobuildを実際にプロジェクトで活用するための手順と、知っておくべき仕様をまとめました。

導入方法

Cobuildの導入方法を紹介します。

Dataiku Version 14.7にバージョンアップすることで、Cobuildの利用が可能です。
Dataiku Cloudの場合、Launchpad「Settings」メニューからセルフアップグレードを実行できます。

「Upgrade and maintenance preferences」から即時アップグレードか時間指定が選べます。

Launchpad 設定画面

左が時間指定で右が即時アップグレードです。

アップグレード選択画面

事前設定

Cobuildを利用し始める前に、Dataikuの管理者によるいくつかの設定確認が必要です。

1. AI Servicesの有効化
アドミニストレーション設定

管理者がアドミニストレーション設定を開きます。
AI Servicesタブ

「AI Services」タブを開きます。
AI Assistant ON

AI Assistant機能を「ON」にします。(過去に設定済みの場合は再設定不要です)。
2. 利用するLLMの選択(自社モデルの持ち込み)
Bring your own LLM設定

同設定内の「Operation mode」「Bring your own LLM」を選択することで、Dataikuの「Connections」で事前に設定した自社のLLM(OpenAI、Anthropic、AWS Bedrock、Snowflake Cortexなど)をCobuildのバックエンドとして安全に利用することが可能です。
3. カスタムプロンプトの定義(任意)
Global custom instructions

同設定内の「Global custom instructions」から全社共通の前提指示を設定したり、プロジェクト設定から「このプロジェクト独自の命名規則」などのカスタムプロンプトを定義しておくことで、生成される成果物の品質を標準化できます。
4. Agent作成時のLLMの選択(任意)
Default LLM設定

同設定内の「Agent building by Cobuild」「Default LLM」「Default embedding LLM]「Default image generation LLM」からAIエージェント作成時に使う場合、埋め込みを行う場合、画像生成を行う場合それぞれのLLMを設定しておくことができます。
5. 高度な制御設定(任意)
Maximum dataset sample size

同設定内の「Maximum dataset sample size」でAIが一度に読み込んでいいデータの最大行数を指定します。また、「Maximum job log lines」でDataikuのジョブがエラーで落ちた際、AIがジョブログのファイルを下から何行まで遡って読んでいいかの最大値を決めます。
6. データ共有設定(任意)
Send sample values

同設定内の「Send sample values」で処理対象のデータセットから、いくつかのカラムの実際のデータのサンプル値をCobuildに送信する設定を行えます。また「Send job log lines」でジョブログツールを使用する際、ジョブの実行ログをCobuildに送信する設定を行えます。「Diagnostic Data」でリクエストに関するメタデータをDataiku側が保持することを許可するかどうかの設定を行えます。これらはデフォルトでチェックが入っています。
7. 保存
設定の保存

保存を忘れずにしてください。

使用手順

準備が整えば、非常に直感的に操作できます。

1. Cobuildの起動
Dataikuのプロジェクト画面を開き、ヘッダー右上にある「Cobuildマーク」をクリックします。
Cobuildマーク

すると、画面右側にチャットウィンドウが展開されます。
チャットウィンドウ
2. 自然言語での指示出し
「適当なフローを作って」「機械学習を利用したものを作りたい」など、達成したいことを自然言語で入力します。以下の機能を活用すると、より正確な指示が可能です。
指示出し画面

コンテキスト(文脈)の自動認識
現在開いているページや、フロー上で選択しているオブジェクトをAIが自動的に把握するため、「このデータセットを〜」といった会話的な指示が通じます。
「@」メンション
チャット内で「@」を入力すると、Dataiku内の特定のオブジェクト(データセットやレシピなど)を明示的に指定できます。
3. 提案の確認と承認(Human-in-the-Loop)
Cobuildが関連データを自ら探し出し、処理の計画(プラン)をチャット上に提示します。
プラン提示

特にデータの削除など重要なアクションを実行する前には明示的な確認(Approve Plan)が求められるため、 人間が意図をチェックしてから安全に構築を進めることができます。
Approve Plan

知っておきたいTips・注意点

AIが作った箇所の可視化
プロジェクト画面左上のビュー機能で「Cobuildにより作成」を選択すると、Cobuildが自動生成したオブジェクトがフロー上で緑色にハイライトされ、どこをAIが作ったのか一目で識別できます。
可視化画面
言語設定
日本語で利用可能です。右上のプロファイル設定から、Cobuildの応答言語を「自動検出」や「日本語」に変更できます。
言語設定
クレジット(利用枠)の管理
クレジット管理1

Cobuildの利用には、ユーザー単位(Designerプロファイル)で月毎に割り当てられる「クレジット」を消費します。このクレジットは、Cobuildだけではなく、すべての「AIサービス」で共通して利用され、枯渇すると新規の構築処理が停止します。
さらに利用したい場合にはクレジットの追加が必要になります。また、CobuildのデフォルトではDataikuが提供するLLMを利用していますが、管理者画面の設定にて、自社利用のLLMをフロー生成エンジンに指定することが可能で、これを利用する方法があります。
利用状況は管理者設定の 「Usage」 から確認可能です。
クレジット管理2
ネットワーク接続
Ver. 14.7ではDataikuとのネットワーク接続が可能な環境でのみ利用可能です。
閉鎖環境でのご利用については今後サポート予定です。

3. 実践

データ分析でおなじみのTitanicデータを用いて簡単な検証をしてみました。

データ処理と生存予測モデル作成をお願いしてみました。
5分ほど待つと以下のようなフローが出来上がりました。
Snowflake接続が「トライアル終了でWarehouse停止」になっていたため、出力先をファイルシステム(managed)に切り替えてビルドしてくれました。
Prepareレシピによる前処理を行い、生存予測モデルを作成してくれました。
Titanicフロー

行った内容と次にやるべきことをわかりやすく提示してくれます。
次のステップ提示

行った内容をさらに詳しく知るにはアクティビティを表示させます。
アクティビティ画面
Cobuildの提示に従ってモデルデプロイからスコアリングさせます。
1分ほどでフローが更新されました。
フロー更新

デプロイされたモデルはRandom forestが選ばれていました。
Random Forest選定

MLレシピにも対応していることが確認できました。
スコアリングしたデータを整形してもらい、Kaggleで提出したスコアを見てみます。
データ整形

提出用にPassengerID, Survivedの2列に整形したデータセットをKaggleで提出します。
Kaggle提出結果

結果をみると、初回の自動構築でスコア0.77511をマークしました。Cobuildにおける自然言語の指示だけで数分である程度のクオリティの予測モデルを作ることができました。データの中身を解釈してモデルを構築していることが実証されました。

4. ほかのAIエージェントとの比較

Cobuildがなぜエンタープライズ環境において実用的なのか、他のAIツールと比較してみます。

  • vs AIコーディングエージェント(GitHub Copilotなど)
    一般的なツールはコードを生成しますが、専門知識がないとレビューできず属人化を招きます。Cobuildは「ビジュアルフロー」を生成するため、ビジネス部門でも処理の意図がわかり、ガバナンス管理が容易です。
  • vs スタンドアロン型エージェント
    外部で動くエージェントは、本番環境への接続が難しくプロトタイプ止まりになりがちです。Cobuildは「企業インフラの上」で動き、既存のエンタープライズデータ基盤やLLMと安全に直結した状態でプロジェクトを生成するため、作った瞬間から本番環境に耐えうる(Production-readyな)クオリティを持ちます。
  • vs 一般的なAutoML
    多くのAutoMLツールはモデルを構築して終わりですが、Cobuildは「既存のデータパイプラインのリファクタリング(綺麗に修正)」や「ジョブログを監査してエラー原因を提示する」など、運用・保守フェーズの相棒としても機能します。

5. まとめ

Dataiku Cobuildは、自然言語の指示からデータパイプライン、機械学習、Webアプリまでを一気通貫で構築し、プロトタイプ作成の速度を劇的に向上させる革新的なツールです。対応しているレシピやモデルの幅も広く、コンテキストを理解した直感的な操作が可能です。

ただ作業を自動化するだけでなく、ブラックボックス化を防ぎ、運用・保守までをガバナンスの効いた状態でサポートしてくれます。

ShtockData

お問い合わせフォーム

お問い合わせ項目を選択してください