156 サンプリングへの対処

サンプリングが発生する状況と原因を理解する

サンプリング」とは調査対象となる母集団から標本(サンプル)を抽出することを指し、統計解析において広く行われます。Googleアナリティクスにおけるサンプリングもこれと同様で、レポートがユーザーによるサイト利用状況のすべてではなく、一部のデータに基づいて生成されることを指します。

標準レポート(メニューのクリックで表示できる最初から用意されたレポート)をそのまま表示した状態では、集計対象となるセッション数がどれだけ多くても、サンプリングは発生しません。しかし、以下のような状況で、集計対象となるセッション数が50万を超えているとサンプリングが発生します。

  • 標準レポートにセカンダリディメンションやセグメント、フィルタを適用した
  • 標準レポート以外のディメンションと指標を組み合わせたカスタムレポートを表示した

サンプリングが発生する状況と原因を理解する - できる逆引き Googleアナリティクス 増補改訂2版

統計解析においては、適切にサンプリングが行われれば、母集団のすべてのデータを使用した場合と同様の結果が得られるとされています。ただ、Googleアナリティクスでは、セカンダリディメンションの適用などで細かくセグメントしたときにサンプリングが発生すると、実際には発生しているコンバージョンがレポートでは0件と表示されるといった、Web担当者にとってストレスとなる問題が起こることがあります。

データのサンプリングについて

セカンダリディメンションやセグメントを適用したあとは、レポートの対象がデータ全体になっていない場合があることを覚えておきましょう。