Google アナリティクスのレポートでサンプリングがかかった事がある方も多いのではないでしょうか?
上記のレポートでは1ヶ月間のデータにも関わらず、セグメントを1つかけただけで、「7.69%のセッションに基づいて作成されています。」というメッセージが表示されてしまいます。
これは名前の通りで、該当期間のセッションの内、7.69%のデータを使い、それを割りかえして100%にしているということになります。そのため、1回のセッションが約13回分の重みをもってしまいます。キーワードレポートを見ると、下記のような不自然な数値が並んでしまいます。
これでは分析の精度が落ちてしまいます。
サンプリング問題を解決する方法は主に2つあります。
有料版のGoogle アナリティクスを導入出来る場合はよいのですが、それが難しい場合はAPIを利用することになります。しかしAPIの利用に馴染みがない方も多いのではないでしょうか?APIを活用するのであれば、以下の記事が手順を詳しく非常に参考になります。
初心者でも分かる!なGoogle Analytics APIの使い方
しかし、欲しいデータを取得するためには、やはり最低限のコーディングが必要です。決まったデータを日付だけ変えて出す場合は良いですが、分析の時やいろいろ試したい時にはやはり大変かもしれません。そのため敬遠してしまう人も出てくるのではないでしょうか。
そこで今回紹介するのが、米国のウェブコンサルティング会社「Blast」が提供している「unSampler」というサービスです。こちらのサービスを利用することで、Googleアナリティクスの画面上ではサンプリングが発生するデータも、サンプリングされていない状態で取得出来るようになります。英語のサービスですが、無料で大半の機能が利用でき、コーディングなども必要ありません。
それでは登録からデータ取得方法まで見てみましょう。
1:「unSampler」のサイトにアクセスし、右の「TryIt」ボタンを押して下さい。
2)上部にある「Sign in with Google」を選んで、Google アナリティクスのプロパティが紐付いているGoogleアカウントでログインをしましょう。
3:「抽出したいデータの設定」を行う画面で取得するデータを設定します。
Authorized Google Analyticsの最初の3行で、アカウント、プロパティ、ビューを選択、その後の2行で「ディメンション(Select Dimensions)」と「指標(Select Metrics)」を選びます。以下のように名称の一部入力すると、候補が現れます。
英語での表示となります。主なディメンションと指標の日本語訳は、筆者の以下の記事をご覧ください。
Googleスプレッドシートの公式Googleアナリティクスプラグインを活用して楽にデータ取得&レポート更新!(準備&データ取得編)
下から2行目はセグメントを設定する部分です。Google アナリティスのデフォルトセグメントと、該当アカウントに紐付いているカスタムセグメントも利用出来ます。一番下の行はフィルタを設定する部分になります。
右上のカラムでは作成するダウンロード用ファイルと画面表示用のファイル名を記入し、最後にプルダウンでデータ取得期間を選んでください。
以下が実際に記入を終えた状態の例です。
4:最後にGenerate Reportを押すとデータ取得が開始します。
データ取得まで、ディメンションや指標の数、サイト規模などによって数分~数時間かかります。作成が完了したら、ログインしているGoogle アカウントにメールが送られてきます。またページ上部にある「Request History」で進捗を確認できます。
「Request History」では取得が完了したデータのダウンロードなどが行なえます。1行ごとにリクエスト内容が記録されています。右側にある4つのアイコンは左側から、
となっています。
「画面上でレポートを確認する」は名前の通り、画面上で集計結果を見ることが出来ます。ただし行数が極端に多い場合は、画面では表示されずダウンロードをする必要があります。
「取得条件をコピーする」は、リクエストしたデータの条件を再設定した状態で「Request Data」のページが表示されます。期間やセグメントを変えて同じデータを出したい時に便利です。残りの2つのメニューは名前の通りの意味です。
それではGoogle アナリティクスの画面データと、unSamplerのデータを比較してみましょう。先程の画像と同じリクエスト内容をGoogle アナリティクスで見てみましょう。
サンプリングがかかっているため数値が近しいものの、やはりズレが起きています。
例えば5位のイベント カテゴリであれば、Google アナリティクスの画面上では合計イベント数が「2731」、unSamplerでは合計イベント数が「3044」となっており、5%~10%程度ずれています。サンプリングが数値に影響を与えていることがわかります。サイト規模が大きい、データの種類が多く細かいデータを見る必要がある場合は、ぜひこのサービスを使ってみて下さい。
無料版と有料版が本サービスには用意されていますが、基本的な機能は変わりません。作成出来るレポートの数などにも特に制限がありません。違いは以下の3点です
1)無料版は登録してから最初の1ヶ月は1年前までの期間を選べるが、30日目以降は過去6ヶ月までしか取得出来ない
2)無料版はスケジュリング機能(自動で定期的にデータを取得する)が無い
3)有料版はTDE形式(Tableauに取り込むためのファイル拡張子)が利用できる
となります。詳しくは以下URLをご覧下さい。
http://www.unsampler.io/pricing
簡単な集計や分析で利用するのであれば、無料版でまずははじめて全く問題ないでしょう。興味がありましたらぜひ有料版も検討してみましょう。$149/月となっています(2017年5月時点)。
サンプリングはGoogle アナリティクスを活用する上で課題となるケースが多いのではないでしょうか。全体の数値を見る分には問題ないのですが、セグメントなどを活用して深掘りを行うと直面することが多いです。「1ヶ月分のデータを週別に出して足し上げる」など面倒な作業で迂回出来なくは無いですが、このようなサービスを使うことで分析の精度を一段上げることができます。
サンプリングに困っている方は、ぜひ使ってみてはいかがでしょうか。
【著者プロフィール】
小川 卓(おがわ たく)
ウェブアナリストとして、マイクロソフト・ウェブマネー・リクルート・サイバーエージェント・アマゾンで勤務後、フリーに。複数社の社外取締役やデジタルハリウッド大学院の客員教授として活動.。コンサルティング・勉強会・執筆に従事。
主な著書に「ウェブ分析論」「ウェブ分析レポーティング講座」「漫画でわかるウェブ分析」「Webサイト分析・改善の教科書」「あなたのアクセスはいつも誰かに見られている」など。
※KOBITブログでは、毎月1~2本程度、小川卓さんに記事を寄稿いただいております。
どれも興味深い記事となっておりますので、ぜひ他の記事もご覧下さい。
→小川卓さんによる寄稿記事を読む