1. はじめに
ここ最近、AIエージェントという言葉がはやっています。AIエージェントとはインプットに基づいて自律的にAIが意思決定を行いタスクをこなすシステムのことを指します。
例えば、従来では人間がコードを書き、試行錯誤しながらモデルを作ってきました。一方でAI エージェントはユーザーの指示(プロンプト)を理解し、自ら分析計画を立て、タスクを実行することができます。
今回はGoogle Cloud が提供する Data Science Agent(DSA)について紹介しようと思います。この機能は現在プレビュー機能ですが、ユーザーのプロンプトから自律的に分析のためのタスクを実行することができます。
参考リンクhttps://cloud.google.com/colab/docs/use-data-science-agent?hl=ja
https://cloud.google.com/bigquery/docs/colab-data-science-agent?hl=ja今回はKaggleのtitanicのデータを用いてBigQuery Notebookでデータ分析を行ってみました。
2. Data Science Agent(DSA)とは?
Data Science Agent はデータ分析の一連の作業を自動化する AI エージェントです。
主な特徴は次の通りです:
- プロンプトから分析計画を立てる
- BigQuery や CSV ファイルなどからデータを取得
- 探索的データ分析(EDA)の実行と可視化
- 機械学習モデルの構築・評価
- 実行中のエラーや改善点を自己修正(self-healing)
ユーザーは指定したデータを提示し、プロンプトで指示するだけで、DSAが分析計画を立案し、必要なコードを生成し、結果を可視化します。
3. 実例:BigQuery データを用いてBigQuery Notebookで分析
実際にチャット形式でデータ分析を進めてみようと思います。今回はBigQuery Notebookで分析を進めてみようと思います。
BigQuery へのデータの投入は以下を参考にしてください。
https://cloud.google.com/bigquery/docs/batch-loading-data?hl=ja#loading_data_from_local_files
BigQuery Notebookの始め方は以下を参考にしてください。
https://cloud.google.com/bigquery/docs/create-notebooks?hl=ja
BigQuery Notebookの 画面下側にGeminiのマークがあるのでそこから、DataScienceAgentを利用することができます

まず、指定したテーブルを読み込んで機械学習モデルの作成をおこないます。プロンプトとして以下を使用しました。所定のデータセットに目的のテーブルがある前提で進めます。
データセットから’titanic_train’を読み込み機械学習モデルを作成してください
上記のようなプロンプトを設定すると以下のように対話形式でエージェントが分析を進めてくれます。
データの読み込みからデータ分析、前処理、モデルの作成と、分析計画を立ててくれます。

承認して実行を選択すると、各タスクに沿ったPythonコードがNotebookのセルとして生成され、そのまま実行されます。

エージェントが勝手にモデルを選択して、コードを生成し実行してくれます。
このような形でインタラクティブにコードを書くことなく、データ分析を行うことできます。
人間が実際に行うような機械学習モデルをつくるまでの細かなタスクも遜色なく、自動で行ってくれています。
またモデルの評価に関しても、特に問題のない精度で作成できてるようです。分類タスクで必要な
評価指標も網羅的に表示されています。

4. おわりに
今回はBigQuery Nootebookから自然言語を用いたデータ分析が出来るData Science Agentついて紹介しました。この機能を使えば、だれでもプロンプトだけでデータ分析を行うことができます。
これまで SQL の知識や機械学習の知識が必要だった機械学習も、簡単な文章で指示するだけで結果を得られるため、データ活用のハードルを大きく下げることができるでしょう。
株式会社キーウォーカーでは本記事で紹介した内容をはじめとする生成AIの実装支援を行っています。
PoC(概念実証)から導入企画、独自モデルの開発、データ基盤の整備まで、AI活用における幅広いニーズに対応可能です。事業課題に応じたご相談も承っておりますので、ぜひお気軽にお問い合わせください。
