日々のコンピュータ情報の集積と整理

Dr.ウーパのコンピュータ備忘録

2015年4月3日金曜日

検索技術:Bloggerにて、各月に投稿された、全ユーザの記事数を調べる

イントロダクション

以前、検索エンジンを使用して、Googleのブログサービス「Blogger」にてブログを運用しているブログを発見する方法について記載しました。


検索技術:Bloggerでブログを運営しているブログを発見する方法
http://upa-pc.blogspot.com/2015/03/find-blogger-blog-by-search.html
Dr.ウーパのコンピュータ備忘録


今回は、その方法を応用して、Blogger にて、任意の年・月に投稿された、全ユーザの記事数を調べる方法について考えてみます。


検索技術:Bloggerにて、各月に投稿された、全ユーザの記事数を調べる


この方法で行えないこと

  • Blogger のドメインではなく、独自ドメインで運用しており、Blogger のドメインの方は検索エンジンにインデックスされないように設定されている場合には、そのブログを見つけることができません。

  • 検索エンジンにインデックスされてないページの数を知ることはできません。

  • 得られる数はあくまで概算です。正確な数までは分かりません。


検索エンジンを使用して、Bloggerにて、各月に投稿された、全ユーザの記事数を調べる

前提として、検索エンジンとしてGoogle 検索を用います。


Blogger にて、運営されているブログのページを見つけるときに使用した、検索キーワードは以下のようでした。

検索のキーワード:
site:http://*.blogspot.com/


そのキーワードを使用すると、Blogger の標準のドメインである blogspot.com のサブドメインとして運用されているブログのページを検索エンジンを使用して見つけることができます。


ここで、Blogger の URL 構造を見てみましょう。


Bloggerユーザなら知っておきたい、BloggerブログのURL構成まとめ
http://upa-pc.blogspot.com/2015/02/blogger-url-summary.html
Dr.ウーパのコンピュータ備忘録


Blogger の投稿された URL は、次の構造をもちます。

http://*.blogspot.com/yyyy/mm/post-name

yyyy : その投稿を公開した 4 桁の年
mm : その投稿を公開した 2 桁の月
post-name : 投稿の名前([自動で設定された名前、または手動で設定した名前].html)


従って、検索エンジンを使って、URL を基に検索する場合には、yyyy の部分に年を、mm の部分に月を指定すれば、任意の年・月に投稿された記事を列挙できることになります。


例えば、2014年1月に投稿された Blogger の記事を列挙するには、次の検索キーワードを用います。

2014年1月に投稿された Blogger の記事を列挙するための検索のキーワード:
site:http://*.blogspot.com/2014/01/*


なお、普通に検索すると世界中の Blogger のページが検索結果として表示されます。
日本語のページに限定する場合には、検索ツールから「すべての言語」を「日本語のページを検索」へ変更します。


試しに 2014年1月から2015年3月までの日本語のBloggerの投稿のページ数を調査

上記の方法で調査した2014年1月から2015年3月までの日本語のBloggerの投稿のページ数をグラフと、表にしてみました。

図:2014年1月から2015年3月までの日本語のBloggerの投稿のページ数(検索キーワード:site:http://*.blogspot.com/yyyy/mm/* による結果) 横軸:Blogger へ記事を投稿した年・月 縦軸:検索でヒットしたページ数
図:2014年1月から2015年3月までの日本語のBloggerの投稿のページ数
(検索キーワード:site:http://*.blogspot.com/yyyy/mm/* による結果)
横軸:Blogger へ記事を投稿した年・月
縦軸:検索でヒットしたページ数

表:2014年1月から2015年3月までの日本語のBloggerの投稿のページ数(検索キーワード:site:http://*.blogspot.com/yyyy/mm/* による結果)
ページ数
2015 3 392,000
2015 2 347,000
2015 1 316,000
2014 12 292,000
2014 11 286,000
2014 10 305,000
2014 9 281,000
2014 8 268,000
2014 7 270,000
2014 6 266,000
2014 5 279,000
2014 4 261,000
2014 3 253,000
2014 2 233,000
2014 1 253,000


1 か月あたり、数十万単位でページが増えていっているということでしょうか。


なお、上記の数字は「この方法で行えないこと」の制約を受けた数字であることに注意してください。

あくまで、目安と考えてください。
※ 上記のデータを Blogger を利用したページのアップロード数とは考えないでください。「この方法で行えないこと」にあるように、独自ドメインで運用している Blogger ブログなどの集計は行えません。また、検索エンジンに大きく依存します。


注意点

上記の検索を Google 検索で何度も短期間に繰り返し行うと、Google 検索からロボットによる自動的な検索の疑いをかけられて、人であることの証明をするように求められることがあります。

実際私も、この内容を記載するために、上記の検索キーワードで何度も検索を行っていたら、Google 検索より指定された画像内の文字列を入力することで、人であることを証明するように求められました。


これは、Google が自動化されたクエリ(検索要求)を禁止しているためです。

自動化されたクエリ - ウェブマスター ツール ヘルプ
https://support.google.com/webmasters/answer/66357


そのため、そのような自動化されたクエリと似た行動を行うと、そのような自動化されたクエリの阻止のために、認証が必要になります。


上記の点に注意してください。
また、検索を利用する上で、検索エンジンの利用規約を厳守して利用してかつ、常識の範囲内で使用しましょう。


参考文献

検索での句読点、記号、演算子 - ウェブ検索 ヘルプ
https://support.google.com/websearch/answer/2466433?hl=ja


まとめ

Blogger にて、任意の年・月に投稿された、全ユーザの記事数を調べる方法について考えてみました。


自分自身が認知できる範囲で情報を見ていると、記事を投稿している人が全然見えてきませんが、このような方法で検索すると、他にも大勢の人がブログ記事を投稿している様子を可視化することができます。


ただし、この方法で得られた数値には、様々な要因が絡んでいます。
その値をうのみにせず、どのような数値なのかしっかりと考えるようにすることが大切です。



新品価格
¥2,592から
(2015/4/3 19:29時点)




関連記事

関連記事を読み込み中...

同じラベルの記事を読み込み中...
Related Posts Plugin for WordPress, Blogger...