はじめに
Dataikuでは定期的にアップデートがありますが、気づけば知らない機能が追加されていることがしばしばあります。多機能なプラットフォームだからこそ、標準的な操作以外にも、知っておくと劇的に効率が上がる機能が数多く隠されています。
そんな中で、日々の業務効率を向上させるために個人的に便利だと思った機能を厳選して共有します。初心者から上級者まで、データ分析の現場ですぐに役立つTipsをお届けします。
この記事で紹介する便利機能
- Editable Dataset:DSS上でサンプルデータを直接作成・編集する方法
- Libraries:コードを共通化し、保守性の高い開発を実現するテクニック
- Version Control:Gitベースの履歴から誤操作をロールバックする方法
- Application Designer:分析フローを非エンジニアでも使える「アプリ」へ変換
- 番外編:イースターエッグ
1. Dataiku DSS上でサンプルデータの作成(Editable Dataset)
「ちょっとしたサンプルデータが欲しい」というとき、これまではExcelを開いてデータを入力し、保存してからDSS上にアップロードしていませんでしたか?実は、その作業をDSS上で完結させる「Editable Dataset(編集可能データセット)」という機能があります。
この機能の最大の特徴は、10万行までのデータをスプレッドシートのようなGUI画面で直接編集できることです。空の状態からデータを作成するだけでなく、既に存在するデータセットをベースに値を編集したり、カラムを追加したりすることも可能です。機械学習用の手動ラベル付けや、少量のマスタデータ修正に非常に便利です。
2. ライブラリの活用(Libraries)
PythonレシピやWebappでコーディングをする際、ついつい1つのファイルに全ての処理を書き込んで「スパゲッティコード」になっていませんか?ローカル開発でフォルダ構成を意識するように、DataikuでもLibraries機能を使うことでスマートな構成を実現できます。
例えば、pythonフォルダー内によく使う関数を記載したPythonファイルを配置します。
これをDataikuのNotebooksやレシピ上でインポートすれば、定義された関数を再利用できます。共通処理をパッケージ化して共有することで、コードの重複を防ぎ、プロジェクト全体の保守性が向上します。
3. プロジェクト内のロールバック(Version Control)
Dataikuには作業を即座に取り消す「Ctrl + Z」のような機能はありませんが、プロジェクトごとにGitベースでログ管理が行われています。そのため、「誤った作業を保存してしまった」「ファイルを削除してしまった」という危機的な状況でも、既存の機能を使い元の状態に戻すことが可能です。
https://knowledge.dataiku.com/latest/collaborate/project-version-control/index.htmlプロジェクト上部のタブ「[…]」からVersion Control画面に移動することで、履歴の確認とロールバックが可能です。コーディングやフロー構築中に「やってしまった!」と思ったときは、まずここを確認しましょう。
4. 操作のアプリ化(Application Designer)
Application Designerは、データ分析や機械学習の処理を、専門知識のないユーザーでも使える「アプリ」としてパッケージ化する機能です。Webappよりも構築が容易で、Flow内の処理を直感的にアプリケーションに落とし込めます。
https://doc.dataiku.com/dss/latest/applications/index.htmlあらかじめ設計したフローをアプリとして公開することで、利用者はボタン操作や入力フォームを通じて「データの更新」「ワークフローの実行」「予測の実行」などを安全に行えます。これにより、通常の開発権限を持たないユーザーでも必要な処理だけを実行できるセルフサービス環境が実現します。
番外編:効率化と少しの遊び心(イースターエッグ)
Dataikuには、一見地味ですが実用的なショートカットや、遊び心のある隠しコマンド(イースターエッグ)が存在します。これらは、検索バー以外の場所でコマンドをすべて小文字で入力することで有効化されます。
- G + F:一瞬でフロー画面へ遷移(非常によく使います!)
- disco:フロー画面がライトアップされる遊び心のあるエフェクト
https://community.dataiku.com/discussion/31821/3-more-easter-eggs-in-the-dataiku-flow
エフェクト系のコマンドは、ブラウザを更新するだけで元の状態に戻ります。作業の合間のリフレッシュや、素早い画面遷移に役立ててください。
まとめ
いかがだったでしょうか?今回紹介した機能はDataikuの膨大な機能のほんの一部ですが、知っているだけで日々の作業効率は大きく変わります。
- Editable Datasetでデータ準備を迅速に
- Librariesでコードを共通化し管理を容易に
- Version Controlで万が一のミスを救出
- Application Designerで分析を「価値あるツール」として共有
知らない機能が一つでも見つかっていれば幸いです。ぜひ皆さんのプロジェクトでも深掘りして試してみてください。直近では生成AIに関するアップデートも加速しているので、今後の進化にも注目していきましょう!











