156 サンプリングへの対処
サンプリングが発生する状況と原因を理解する
「サンプリング」とは調査対象となる母集団から標本(サンプル)を抽出することを指し、統計解析において広く行われます。Googleアナリティクスにおけるサンプリングもこれと同様で、レポートがユーザーによるサイト利用状況のすべてではなく、一部のデータに基づいて生成されることを指します。
標準レポート(メニューのクリックで表示できる最初から用意されたレポート)をそのまま表示した状態では、集計対象となるセッション数がどれだけ多くても、サンプリングは発生しません。しかし、以下のような状況で、集計対象となるセッション数が50万を超えているとサンプリングが発生します。
- 標準レポートにセカンダリディメンションやセグメント、フィルタを適用した
- 標準レポート以外のディメンションと指標を組み合わせたカスタムレポートを表示した
統計解析においては、適切にサンプリングが行われれば、母集団のすべてのデータを使用した場合と同様の結果が得られるとされています。ただ、Googleアナリティクスでは、セカンダリディメンションの適用などで細かくセグメントしたときにサンプリングが発生すると、実際には発生しているコンバージョンがレポートでは0件と表示されるといった、Web担当者にとってストレスとなる問題が起こることがあります。
セカンダリディメンションやセグメントを適用したあとは、レポートの対象がデータ全体になっていない場合があることを覚えておきましょう。
本コンテンツは、インプレスの書籍『できる逆引き Googleアナリティクス 増補改訂2版 Web解析の現場で使える実践ワザ 260』を、著者の許諾のもとに無料公開したものです。記事一覧(目次)や「まえがき」は以下のリンクからご覧ください。
- 本書発行時点(2017年11月)の情報に基づいています。
- 本書は2色刷のため、画面はグレースケールとなります。