primeNumberさんと勉強会を開催しました!
初めまして。データサイエンティスト1年目の君島です。
先日、弊社が協業させていただいているprimeNumber社と合同勉強会を行ったので、そちらの様子を報告させていただきます!
この日、私たちは目黒にあるprimeNumberさんのオフィスにお邪魔させていただきました。
primeNumberさんは、データ統合自動化サービスであるtrocco®の提供やデータ活用に関する課題解決のコンサル・ソリューションサービスの提供を行っている会社さんです。
訪問経験のあるメンバーもいましたが、私は初めてオフィスに訪問させていただきました。 駅直結のとても開放感のあるオフィスに感動したり、直接社員の方にお話を伺えて業務の理解も深まりました。
はじめに
実際の勉強会は、以下の流れで進んでいきました。
- オープニング
- 会社紹介(primeNumberさん)
- 会社紹介(Keywalker)
- 発表(primeNumberさん)
- trocco®により変わるデータ分析 ~Tableau Prepとの比較から考える~
- データ基盤におけるアーキテクチャ/サービス選定
- データ基盤構築の進め方
- 発表(Keywalker)
- Tableau案件の進め方
- Tableauダッシュボード事例紹介
- ダッシュボードデザインガイドライン
- クロージング
- 発表会後:現地でダッシュボードデザインレビュー、懇親会
バーカウンターのあるコミュニケーションスペースで、プロジェクターを使って勉強会を行いました。
データテクノロジーカンパニーであるprimeNumberさんからは主にデータアナリスト・データエンジニアの方々にご参加いただき、主にデータの統合・蓄積のお話を聞かせていただきました。
ビッグデータの収集・解析を行うKeywalkerからは数名のデータサイエンティストが現地で参加し、主に可視化に関連する話をさせていただきました。クロージングまではオンライン参加も可能で、リアクション機能でコミュニケーションを取りながら進めました。
発表(primeNumberさん)について
trocco®により変わるデータ分析 ~Tableau Prepとの比較から考える~
過去に独学でTableauを習得したことのある方(すごい!)にお話しいただきました。
Data Engineering Lifecycleをベースに、データエンジニアリングの基礎概念やtrocco®とTableau Prepの活用領域をお話ししていただき、両者の特性について比較しながら理解を深めていきました。
「trocco®」は、分析基盤の構築・運用を助けてくれるデータ統合自動化サービスであり、データ転送の設定・データマートの定義・ワークフローの定義などデータエンジニアリングの領域をカバーしています。
よくExcelとTableauが比較されるように、trocco®とTableau Prepも一見似ているように見えますが、カバーしている領域が異なるということを知ることができました。どちらの強みも理解した上で、お客様の課題や現状のフェーズに合わせて使い分けできると、データ活用が進むということも仰っていました。
比較の部分で言及していただいた「Prepは依存関係の定義が難しい」などのTableau Prepを使っていたら少し困ることに参加者が強く頷いていたことが印象に残っています。業務でよく議論になる点についても言及されていて、最近の業務であったことを思い出して微笑んでしまいました。
データ基盤におけるアーキテクチャ・サービス選定
AIやML周りに興味のあるデータエンジニアの方にお話しいただきました。
データ基盤を構築するためのサービス・ツールの選定について持っておくべき視点と、データエンジニアリングに必要なリテラシーについて知ることができ、可視化前のデータ環境について想像を広げることができました。
Red Hot: The 2021 Machine Learning, AI and Data (MAD) Landscape
データを溜め、加工や処理を行うことに特化したサービスだけ見ても、BigQueryやSnowflake、Amazon Redshiftなど様々なサービスが存在しています。選択肢が沢山ある中で、どのような視点を持ってサービスやツールを選定しているのかという貴重なお話しを聞くことができました。また、構築したデータ基盤を使い続けていただくために必要なリテラシーについてもお話しいただきました。
データ基盤もダッシュボードも使い続けていただくことが大切だと強く感じました。 使い続けていただくためにデータ周りの知識をつけ、お客様の困っていることに対してどこの知識が必要なのか伝えられるようになりたいと思いました。
データ基盤構築の進め方
普段プロジェクトマネージャーをされている方に、データ基盤構築プロジェクトの全体像と実際の進め方についてお話ししていただきました。
具体的な業務の期間やスケジュール、情報整理について教えていただきました。 ここで、データエンジニアの方がデータの基盤構築を進め、データアナリストの方がBIツールを使ってモックアップのようなものを作成するという業務のイメージを掴むことができました。
データアナリストの方々の業務と私が主に行なっているデータサイエンティストとしての業務が似ていると感じました。
発表(Keywalker)について
Tableau案件の進め方
ダッシュボード構築のプロジェクトマネージャーが話しました。
まずは、KWにどんなサービスがあるのかお話した上で、実際のプロジェクトの進み方について触れていきました。プロジェクトの進め方のポイントを何点かお話ししましたが、このポイントは特に取り入れていきたいなど良い反応を頂けました。
Tableauダッシュボード事例紹介
こちらもTableau案件の進め方と同じチームリーダーが、マスク化を行った実際の案件のダッシュボードと作る際の課題や工夫した点についてお話ししました。
中にはレイアウトに拘ったマーケティングダッシュボードや回帰モデルをTableauと連携させた不動産物件分析ダッシュボードもあり、角丸をどのように実装したのかや処理にどのくらい時間がかかるのかなど沢山のご質問をいただきました。
ダッシュボードデザインガイドライン
デザインチームに所属しているデータサイエンティストが話しました。
デザインチームのミッション・活動について触れた上で、Dashboard Interface Guidelinesの内容を抜粋して発表させていただきました。
DIG:Widgetについて
特に、BackgroundとWidgetの色についてや資料作成のコツについてご質問をいただきました。
ダッシュボードデザインレビュー・懇親会
メインの発表が終わった後にお食事とアルコールをいただきながら、ダッシュボードデザインレビューと懇親会を行いました。
ダッシュボードデザインレビューに関しては、事前に頂いたダッシュボードのスクリーンショットに対してデザインチームがレビューを行なった結果をお伝えしました。こちらは、デザインチームに所属している別のデータサイエンティストが話しました。
デザインレビュー資料
ダッシュボードを作った方と対面でのレビューだったので、レビュー内容に関する議論が活発に行われました。スクリーンショットだけでは判断できなかった意図を伺って、その場で改善案をお伝えすることもできました。
おわりに
普段は可視化の業務をメインで行なっているので、その前段階である分析基盤に関するお話しが聞けてとても勉強になりました。
データ検証を行う中で、作ろうと思っていたグラフが実現できないこともあるので、分析基盤の構築はとても重要だと感じています。個人的にもデータエンジニアリングの領域はまだまだ勉強が足りていないので、これから知識を付けていこうと思いました。
Keywalkerからは主に可視化の際のポイントについてお伝えしました、実際にBIツールなどでダッシュボードを作成する際に参考にしていただけると嬉しいです。
お互いの業務内容や視点について知り、悩み事や業務での課題感を共有できた勉強会になりました。 今後もprimeNumberさんとの合同セミナーや勉強会の企画をはじめ、実際のビジネス協業の場で交流する日を楽しみにしています!