クラウドDWH企業Snowflake(スノーフレーク) ~独自アーキテクチャとビジネスモデルを解説~

先日データ分析企業PalantirがIPOのための目論見書を提出したことを伝えましたが、同時期に先んじて新規株式公開(IPO)したもうひとつのビッグデータ企業が米Snowflake(スノーフレーク)です。

米国時間2020年9月16日にニューヨーク証券取引所に上場したSnowflake社はが、取引初日に株価が倍増し、時価総額が700億ドル(約7兆3500億円)を超え、投資家の評価の高さを証明しました。

日本では、Palantirと同様あまり馴染みがない企業でしたが、2019年に日本支社を設立して以降、エンタープライズ分野において同社のことを耳にする機会が増えています。 そこで今回は、クラウドDWH企業であるSnowflakeの技術とビジネスモデルがなぜこれほどの大きな注目を集め評価されているのか、その理由に迫ります。

世界最大の投資持株会社であるバークシャー・ハサウェイが評価したSnowflakeとは

同社は、Oracle社のデータアーキテクトであったBenoit Dageville氏とThierry Cruanes氏、そして分析やBIに特化した高速データベースを持つVectorwise社の共同創業者であるMarcin Zukowski氏の3人により、2012年に創業されました。

同社の設立の背景となったのは、クラウドに対応したDWHは多数存在するものの、いずれもオンプレミスで稼働していたものをクラウド環境へ適用したもので、古いデータベースの思想を取り入れており、またスケーラビリティが低いことに課題を感じていたことです。

そこで同社では、クラウド環境でDWHを稼働させるメリットを最大に生かせるよう、クラウド環境に特化した独自のデータベースアーキテクチャを構築し、コストを抑えつつも高性能を実現するクラウドDWHの「Snowflake」の提供を開始しました。
2020年9月現在、SnowflakeはAmazon Web Service、Microsoft Azure、Google Cloud Platformにて利用することが可能です。

同社のIPO目論見書によると、2020年7月31日現在で3,117社の顧客があり、Fortune10のうちの7社、Fortune500のうちの146社が顧客であることから、同社のDWHを利用することが米国ではスタンダードになりつつあると考えられます。

Our platform is used globally by organizations of all sizes across a broad range of industries. As of July 31, 2020, we had 3,117 customers, increasing from 1,547 customers as of July 31, 2019. As of July 31, 2020, our customers included seven of the Fortune 10 and 146 of the Fortune 500

引用:FORM S-1 Snowflake Inc. p.1

同社では四半期ごとに収益を大幅に拡大しており、2019年2月からの2020年1月の収益(1月末決算)が2.65億ドルに対して、既に今年度は半期で2.42億ドル上げており、Q2の昨年対比の数字だけを見ても、昨年度から121%の成長を遂げていることが分かります。

STRONG MOMENTUM

引用:FORM S-1 Snowflake Inc.


同社は、米国のニュース専門放送局CNBCが未上場のイノベーション企業50社をリスト化した「2020 CNBC Disruptor 50 companies」において、世界40位となっており、上場前からグローバル規模で高い評価を得ていました。


CNBC Disruptor 50 companies

引用:CNBC These are the 2020 CNBC Disruptor 50 companies
https://www.cnbc.com/2020/06/16/meet-the-2020-cnbc-disruptor-50-companies.html


満を持して、米国時間2020年9月16日にニューヨーク証券取引所に上場した同社ですが、IPO時には120ドルだった株価が、最高で319ドルまで値上がりし、初日は253.93ドルを付けて取引を終えました。
Bloombergによると、10億ドル以上のIPOにおいては、過去3番目のIPO価格に対する初値の上昇率となったそうです。

元々注目されていたIPO株ですが、ここまでの伸びを記録した背景には、著名投資家であり、世界最大の投資持株会社であるバークシャー・ハサウェイの会長兼CEOを務めるウォーレン・バフェット氏の存在があります。

同氏は1956年にFord社のIPO株へ投資して以来、上場したての株へ投資することはリスクが高いという観点から、64年間もの間IPO株への投資を行っていませんでした。

しかし、バークシャー・ハサウェイがSnowflakeのIPO発表直後に、IPO株へ投資するというリリース発表が行われ、投資家から注目されたことが株価高騰の要因の一つになりました。

このようにして、世界規模で注目を集めることになったSnowflakeですが、なぜここまで評価されるようになったのかを、同社が持つテクノロジーの観点から説明します。

Snowflakeが持つ独自のアーキテクチャ

冒頭でもお伝えした通り、同社のクラウドDWHは、オンプレミスで構築されたデータベースをクラウド化したものではなく、クラウド上で使用することを前提としてフルスクラッチで開発した独自技術を利用しています。

従来のクラウドDWHは、オンプレミスで利用されたものが土台となっているために、次のような課題が生じていました。

  1. 構造化データ用の設計であるため、半構造化データの管理が困難である
  2. コンピュートリソースとストレージリソースを自由に拡張できない
  3. マルチクラウドにおける、リージョンを跨いだデータ管理がサポートされていない

Snowflakeでは、これらの課題を解決する独自のアーキテクチャを構築することができており、最も特徴的なのは、コンピュートとストレージを独立したリソースへ分離しているところです。

シェアードディスクとシェアードナッシングの両方のアーキテクチャを組み合わせており、個別のアプリケーションごとにコンピュートクラスターを用意し、複数のクラスタでひとつのデータを共有するアーキテクチャをとります。

Service Overview

引用:FORM S-1 Snowflake Inc. p.84

これにより、多数のユーザーから同時にリクエスト処理が発生した場合でも、パフォーマンスを低下させることなく実行することを可能としています。
さらに、コンピュートリソースとストレージを自由に拡張できるため、大量データを処理する時はコンピュートリソースを増やし、処理が少ないときはリソースを減らすといった調整が可能です。

また、Amazon Web Service、Microsoft Azure、Google Cloud Platform全てのパブリッククラウド基盤でサービスを提供していることから、クラウドをまたがってデータ連携させることができるため、特定のクラウドプロバイダーに障害が発生した場合であっても、サービスを継続して利用することが可能です。

Snowflakeのもう一つの特徴は、「エコシステム」を採用していることです。顧客が利用しているBIツールや、分析ツールをそのまま接続することができ、snowflakeで利用可能です。

次の図は、同社のパートナー企業が持つ技術であり、これらを利用することで、新たなツールを導入することなく、データソリューションを実現することができます。

例えば、BIツールであればTableauとの接続ができることから、Snowflakeで分析したデータをTableauのダッシュボードを使って可視化することができます。

このエコシステムの活用と、自由度が高いスケーラビリティにより、従来よりも低コストでクラウドDWHの導入が可能です。

ecosystem-overview

引用:snowflake DOCUMENTATION
https://docs.snowflake.com/en/user-guide/ecosystem.html

コロナ禍で活用されたSnowflakeのデータマーケットプレイス

ここまで、Snowflakeのアーキテクチャについて説明してきましたが、同社が競合優位性を持つ理由に挙げられるのが、Snowflakeのサービスの一つであるデータマーケットプレイスの存在です。

サードパーティがデータマーケットプレイスへ公開したデータを、Snowflakeのユーザは自由にアクセスすることができ、自社のDWHへ蓄積することが可能です。

サードパーティとしては、データを公開することによって、ユーザ間において新たなビジネスを創出することに繋がり、利用者側としては、生の最新データを即座に取得することが可能です。

このサービスは、複数のパブリッククラウド上でDWHを構築できる同社ならではの特徴であると言えます。

なお、2020年9月時点では、Google Cloud PlatformとMicrosoft Azure Governmentにおいては利用できず、今後のサポート拡大を予定しているとのことです。

Snowflakeの公式サイトにおいて、次のように様々なデータセットを検索することが可能であり、目的に沿ってデータを取得することができます。

snowflake datasets

引用:Snowflake Inc.
https://www.snowflake.com/data-marketplace/

データマーケットプレイスは昨今のコロナ禍においても有効活用されました。

サードパーティであるStarschema Inc.が、2020年3月に世界中から報告された新型コロナウイルスの発症率と死亡率に関するデータをデータマーケットプレイスで公開しました。
現在に至るまでにSnowflakeの数百もの顧客がこのデータを利用しており、自社で保有するデータと結びつけて、業務や販売、サプライチェーンに対する影響分析をリアルタイムで実施しています。

ここで、Snowflakeから出された興味深いグラフをご紹介します。

network graph

引用:FORM S-1 Snowflake Inc. p.81

このグラフは、Starschema Inc.の提供した新型コロナウイルスに関するデータが、Snowflakeアカウント間でどのように共有されたのかを示しています。 中央にある青い円は、Starschema Inc.のデータセットを使用したSnowflakeユーザーを表しています。
そして、1つの組織によって公開されたデータが、その後どのような領域で役立っているのかを可視化しています。

Starschema Inc.のデータセットだけでのこれだけの広がりを見せていることから、より多くの企業が、データマーケットプレイスを通じてデータを公開することによって、ビジネスのネットワークが広がっていくことを示唆しています。

Snowflakeの今後の成長戦略

同社は、今後の成長戦略をIPO目論見書において次のように述べています。

  1. Innovate and advance our platform.
  2. Drive growth by acquiring new customers.
  3. Drive increased usage within our existing customer base.
  4. Expand our global footprint.
  5. Expand data sharing across our global ecosystem.
  6. Grow and invest in our partner network.

引用:FORM S-1 Snowflake Inc. p.81 – 82

大きく分けると3つの戦略を立てており、新規顧客の獲得、既存顧客へのサービス拡大、パートナー企業の開拓です。

新規顧客獲得については、同社のグローバル戦略では、EMEAとアジア太平洋地域のマーケットを重点的に拡大しており、現在では収益の12%が米国以外となっています。
今後は同社の強みでもある、リージョンを跨いだクラウド環境上でのデータ共有技術を基に、海外収益を更に拡大していく方針を立てています。

既存顧客拡大については、snowflakeのプラットフォームを利用するメリットを伝えていき、より多くのデータをプラットフォーム上で処理、保存、共有するしてもらえることを目指しています。
同社のビジネスモデルが、従量課金制度を採用していることから、プラットフォームを利用する機会が増えるほどに収益拡大に繋がります。

また同社が掲げている”Expand data sharing across our global ecosystem.”とは、データマーケットプレイスの利用拡大を意味しており、個々の企業がデータ処理をするためにプラットフォームを利用するのではなく、各企業がデータを共有し、協業することによって、新たなイノベーションを生み出す取り組みを目指しています。

まとめ

Snowflake(スノーフレーク)は、クラウド環境に特化した独自のデータベースアーキテクチャを持ち、今後はデータマーケットプレイスの創出により、鮮度の高いデータをリアルタイムで取得・提供するビジネスを計画している企業です。

日本市場においてもSnowflakeのサービスは浸透しつつあり、国内ITベンダーにおいてもクラウドDWHの強力な選択肢となっていくことが予想されます。

ShtockData

お問い合わせフォーム

お問い合わせ項目を選択してください