「この商品を買った人は、こんな商品も買っています」
ECサイトでよく見かけるこのフレーズ、実はあなたのショップの利益を劇的に変えるポテンシャルを秘めていることをご存知でしょうか。
多くの運用担当者が「関連がありそうな商品」を経験や勘でセット販売していますが、顧客の行動心理は想像以上に複雑です。そこで鍵となるのが、データマイニングの手法である「バスケット分析」です。
本記事では、AIを用いることで従来の分析では見えなかった「意外な組み合わせ」を発見し、戦略的に「ついで買い」を誘発する方法を詳しく解説します。客単価の伸び悩みを感じている方は、ぜひ最後までご覧ください。
1. なぜ今、ECに「科学的なついで買い」が必要なのか
かつてのECは、広告費を投じて新規顧客を呼び込めば利益が出る「獲得モデル」が主流でした。しかし、市場の成熟と競争激化により、そのモデルは限界を迎えています。今、求められているのは、一度の訪問で顧客の満足度と購入単価を最大化させる「科学的なついで買い(クロスセル)」の設計です。
新規顧客獲得コスト(CPA)の高騰とLTVの重要性
現在のEC市場において、最も深刻な課題はCPA(顧客獲得単価)の高騰です。
- 広告効率の低下: プライバシー保護の強化によるターゲティング精度の低下や、競合の増加により、1人の顧客を呼ぶためのコストは年々上昇しています。
- 「売れば売るほど赤字」からの脱却: 初回購入時の利益が広告費で相殺される現代では、1回あたりの購入単価を上げること、そして継続的な関係(LTV=顧客生涯価値)を築くことが企業の存続に直結します。
単なる「おまけの提案」ではなく、顧客の心理やデータに基づいた「ついで買い」を誘発することは、CPA高騰に対する最も有効な防衛策と言えます。
「勘」によるレコメンドの限界
多くのECサイトでは、いまだに「担当者の経験」や「売れ筋ランキング」に基づいたレコメンドが行われています。しかし、これら「勘」に頼った施策には限界があります。
- 文脈(コンテキスト)の欠如: 「この商品を買った人はこれも買っています」という一律の表示だけでは、今まさにその瞬間の顧客の悩みや欲求(インサイト)に応えることはできません。
- パーソナライズの壁: 顧客の行動履歴、時間帯、デバイス、さらには検討のフェーズによって「次に欲しいもの」は刻一刻と変化します。
これからのECには、単なる関連商品の提示を超えた、統計学や心理学、AIアルゴリズムを駆使した「科学的な裏付け」のある提案が不可欠です。
2. バスケット分析の基礎:3つの重要指標
データから「意味のあるついで買い」を導き出すには、以下の3つの数値を多角的に評価する必要があります。
- 支持度 (Support):その組み合わせはどのくらい出現するか?
- 信頼度 (Confidence):商品Aを買った人が商品Bを買う確率は?
- 期待リフト値 (Lift):その組み合わせに本当に相関関係はあるか?
以下、それぞれを簡単に解説します。
① 支持度 (Support)
「その組み合わせは、全決済の中でどのくらい出現するか?」
② 信頼度 (Confidence)
「商品Aを買った人が、商品Bも買う確率はどのくらいか?(条件付き確率)」
③ 期待リフト値 (Lift)
「その組み合わせに、本当に相関関係はあるか?」
- リフト値 > 1: 商品Aを買う人は、一般客よりも商品Bを買う確率が高い(有効な相関)
- リフト値 = 1: 商品Aと商品Bの購入は独立している(偶然の一致)
- リフト値 < 1: 商品Aを買う人は、むしろ商品Bを買いにくい(相性が悪い)
言葉だけでは少しわかりにくいので、実例を交えて説明します。ここでは以下の条件を想定します。
全決済数(レシート総数):1,000件
① 支持度 (Support)
「全体の中でそのセットがどれくらい売れているか」を表します(同時確率)。
計算:60 / 1,000 = 0.06 (6%)
解釈:この例では全顧客の6%がこの組み合わせで購入しています。この数値が極端に低い場合、どんなに相性が良くても売上全体へのインパクトは小さいと判断します。
② 信頼度 (Confidence)
「商品Aを買った人が、どのくらいの確率でBも買うか」を表します(条件付き確率)。
計算:60 / 200 = 0.3 (30%)
解釈:この例ではコーヒー豆を買った人の3割が、フィルターを一緒に買っています。レコメンドの「的中率」にあたりますが、これだけでは「フィルターが元々人気なだけ」という可能性を排除できません。
③ 期待リフト値 (Lift)
期待リフト値は「商品Aをきっかけに、Bの購買率がどれだけ跳ね上がったか」を表します。
言葉で表現すると以下の通りになります。
計算式は以下の通り変換した方が分かりやすいです。
解釈:分子はAとBを同時に買う確率で、分母はAとBが「全く無関係(独立)」だとした場合に、偶然同時に買われる確率です。
今回のケースでは、分母はコーヒー豆を買う確率(200÷1000=0.2)と、フィルターを買う確率(100÷1000=0.1)をかけて0.02、つまり2%となります。これがコーヒー豆の購入とフィルターの購入が偶然重なる確率です。
実際は、コーヒーとフィルターを同時に購入したのは1000件のうち60件あったので、同時購入の確率は60÷1000=0.06、つまり6%です。この6%を2%で割った「3」がこのケースにおける「期待リフト値」となります。
期待リフト値が「3」ということは、「コーヒー豆を買う人は、そうでない人に比べて3倍もフィルターを買いやすい」ことを意味します。これは非常に強力な相関であり、科学的に「ついで買い」を促すべき組み合わせだと言えます。
なお、AとBが全く無関係(独立)であれば分子は分母と同じ形になるのでリフト値は「1」となります。
3つの指標を統合的に判断することで、初めて実効性のある施策へと昇華します
バスケット分析において、最も戦略的な発見とも言えるのが「低信頼度× 高期待リフト値」の組み合わせです。
一見すると見落とされがちなこの数値が、なぜECの売上を支える「隠れたお宝」になるのか、その理由を解説します。
低信頼度× 高期待リフト値は「隠れたニッチな相関」
このパターンは、一言で言えば「知る人ぞ知る、こだわりのセット」です。
- 低信頼度(的中率は低い) 商品Aを買う人のうち、Bを一緒に買う人はまだごくわずか(例:5%程度)しかいません。そのため、単純な「売れ筋順」の集計ではレコメンドの候補から外れてしまいがちです。
- 高期待リフト値(購買確率は数倍に跳ね上がる) しかし、リフト値を見ると「3(3倍)」や「5(5倍)」という驚異的な数字を叩き出します。これは「一般の顧客はほとんどBを買わないが、Aを買った人に限っては、面白いくらいBに反応する」という特異な相関を示しています。
具体例をいくつか挙げてみます。
具体例①:キャンプ用品ECの場合
具体例②:ワインとクセ強チーズとの場合
クロスセル強化の切り札
この「隠れたニッチな相関」を見つけ出し、意図的に露出を増やすことで、以下のような「攻め」のクロスセルが可能になります。
- 「ついで買い」の習慣化 まだ一部の層しか実践していない「こだわりの組み合わせ」を、コンテンツやキャッチコピーで言語化(例:「実は、通の間ではこれが常識です」)することで、信頼度を底上げし、新たな定番セットへと育て上げることができます。
- 専門性の高いファンを掴む 「どこにでもある売れ筋」ではなく、「自分のこだわりを見透かしたような提案」をすることで、顧客はサイトに対して「この店は分かっている」という深い信頼を寄せるようになります。
- 利益率の改善 ニッチな関連商品は比較検討されにくく、価格競争に巻き込まれにくい傾向があります。これらをセット提案に組み込むことで、客単価だけでなく利益率の向上にも寄与します。
3. AIが変えるバスケット分析の精度
膨大なSKUの中から手作業やExcelで「お宝の組み合わせ」を掘り起こすのは、まさに砂漠でダイヤモンドを探すような作業です。
そこで、多くのデータサイエンティストやEC担当者に支持されているデータ分析プラットフォーム「Dataiku(データイク)」を活用した、スマートなアプローチをご紹介します。
膨大なデータから「お宝」を自動で掘り起こす:Dataikuによるアプローチ
SKU(商品数)が数万件を超えるECサイトでは、組み合わせのパターンは億単位に膨れ上がります。Dataikuを使えば、この複雑なプロセスをシンプルかつ強力に自動化できます。
Dataikuを使う3つのメリット
- 効率的なデータ処理 Dataikuの最大の強みは、データ分析のボトルネックとなる「前処理」を圧倒的に効率化できる点にあります。マウス操作を中心とした直感的なインターフェースにより、複雑な結合やフィルタリング、表記ゆれの修正といった作業を、ノーコードの「ビジュアルレシピ」として構築できます。データの欠損や異常値も自動で検知・可視化されるため、専門知識がなくてもパズルのピースを組み合わせるような感覚で、誰でも素早く正確にデータを整えることが可能です。
- 「ローコード」で高度な分析が可能 プログラミングの知識がなくても、比較的簡単なコードでバスケット分析のワークフローを構築することができます。複雑な「支持度・信頼度・リフト値」の計算も瞬時に実行。また、豊富なテンプレートと柔軟なインターフェースにより、膨大なデータから導き出された法則をダイナミックに可視化します
- 分析から「自動レコメンド」への直結 見つけた「高期待リフト値」の組み合わせを、そのままAPIとして書き出し、自社ECサイトのレコメンドエンジンに連携させることが可能です。「分析して終わり」ではなく、即座に売上に貢献する仕組みを作れます。
4. まとめ
「なぜこれが売れるのか」に明確な答えを持つことは、顧客満足度と利益率を同時に高める最短ルートです。 特に、的中率は低くてもリフト値が高い「ニッチな相関」は、競合には真似できない独自のファンを生むチャンス。AIを活用して分析を自動化・高度化することで、運用担当者は「作業」から解放され、よりクリエイティブな「施策」に集中できるようになります。データに基づく提案で、顧客に「この店は分かっている」と言わせる体験を届けましょう。
「データはあるが、活用できていない」という課題を解決します。
本記事で紹介したDataikuによるバスケット分析は非常に強力ですが、その真価を引き出すには、適切なデータ構造の設計と運用のノウハウが不可欠です。
キーウォーカーでは、Dataikuの導入支援から、貴社固有のSKU・顧客データに最適化したアルゴリズムの構築まで、一気通貫でサポートします。「膨大なデータを売上につなげたい」という方は、ぜひ一度、データ活用のプロ集団であるキーウォーカーへご相談ください。
