情報科学屋さんを目指す人のメモ

方法・手順・解説を書き残すブログ。私と同じことを繰り返さずに済むように。

参照元が「cdn.ampproject.org」ドメインのURLになっているアクセスの原因

AMP (2) Google (159) Google Analytics (22)

Google Analyticsを見ていたところ、参照元(Referer)が「***.cdn.ampproject.org/v/***」となっているアクセスがあることに気が付きました。

そのリファラとなっているページにアクセスしても、「Google 404. That's an error. The requested URL ... was not found on this server. That's all we know.」という404ページが表示されるのみでした。

この流入元サイトについて調べたことをメモしておきます。

リファラの例

後の実験から取り出したRefererですが、今回話題にしたいのは、次のようなReferer URLです。

https://www-asahi-com.cdn.ampproject.org/v/www.asahi.com/amp/articles/ASK544TZ6K54PTFC009.html?amp_js_v=9

特徴は、前半部分に「www-asahi-com」後半部分にも「www.asahi.com」という、生地そのものを表しそうなドメインがあ瑠ものの、その間に「.cdn.ampproject.org/v/」という部分が挟まっている点です。

リファラから推定されるURL

このような形式のURLを見ると、「/v/」より後ろの部分「www.asahi.com/amp/articles/ASK544TZ6K54PTFC009.html」が、これ単独でページのURLになっていることが分かります。

つまり、「http://www.asahi.com/amp/articles/ASK544TZ6K54PTFC009.html」にアクセスして、内容を読むことはできます。

しかし、それとGoogleのドメインとの関連性は、これだけでは分かりません。ただ、ここでポイントとなってくるのは「/amp/」という部分です。これは、そのページが「AMP対応ページ」であることを表しています。

GoogleのAMPサーバページ

AMPは、ページを高速に表示するためのフォーマットで、Google検索からこのようなAMPページがHITした場合は、「www.google.co.jp/amp/(元のAMPページのURL)」というURLに配置されたAMPページのGoogleサーバ上のコピーへアクセスすることになります。

参考:「食べログ」などGoogleのサイトじゃないのにアドレスバーに「google.co.jp」と表示される理由

どうやら、このURLが関係あるようです

GoogleのAMP版ページを見てみる

そこでひとまず、Google上のAMPページにアクセスしてみました。先ほどのURLの場合は、「https://www.google.co.jp/amp/www.asahi.com/amp/articles/ASK544TZ6K54PTFC009.html」となります。

このページについていろいろ見ていると、そのページから外部リンクへアクセスした際のRefererに、「https://www-asahi-com.cdn.ampproject.org/v/www.asahi.com/amp/articles/ASK544TZ6K54PTFC009.html?amp_js_v=9」が入るということが分かりました。

まとめると

つまり、リファラが「cdn.ampproject.org」のユーザーはおそらく、「Google検索」→「AMPページを開く」→「AMPページはgoogleサーバ上に展開される」→「そこからあなたのウェブサイトがリンクされており、そこを踏んで飛んできた」という経路でページにアクセスしてきたユーザー、ということになります。

ひとこと

だんだんAMP対応ページが増えてきたことを感じます。とはいえそこまでは増えていませんし、実際にAMP対応してしまうことはかなりトレードオフが激しいので、まだ早いかな、と思っています。

コメント(0)

新しいコメントを投稿