日々のコンピュータ情報の集積と整理

Dr.ウーパのコンピュータ備忘録

2015年3月31日火曜日

検索技術:各ブログサービスで運営しているブログを発見する方法

イントロダクション

検索技術:Bloggerでブログを運営しているブログを発見する方法」にて、検索エンジンを使用して、Blogger で運営されているブログを発見する方法について記載しました。

今回は、その方法を拡張して、各ブログサービスで運営されているブログを発見する方法について考えてみます。


各ブログサービスで運営しているブログを発見する方法


この方法で行えないこと

  • 各ブログサービスのドメインではなく、独自ドメインで運用しており、各ブログサービスのドメインの方は検索エンジンにインデックスされないように設定されている場合には、そのブログを見つけることができません。

  • 検索結果には、ブログのトップページ以外のページの検索結果も含まれています。そのため、ブログの数を把握する目的では使用できません。


発見方法(共通の考え方)

ブログを公開すると、標準ではブログサービスのドメインにて、ブログの URL が提供されます。

ブログサービスにて、運用するブログの URL には、主に次の 2 つの法則があります。

[1] サブドメイン方式
ブログを識別する任意の文字列.ブログサービスのドメイン/
例)ブログを識別する任意の文字列.blog.fc2.com/


[2] サブディレクトリ方式
ブログサービスのドメイン/ブログを識別する任意の文字列/
例)ameblo.jp/ブログを識別する任意の文字列


従って、発見したいブログサービスの URL の規則を基に、検索のキーワードを考えます。


そのため、独自ドメインのブログは見つけることができません。

また、site: で指定した URL は、その URL にマッチングするページが列挙されるので、その site で指定した URL に完全一致する URL のみならず、その配下のページも検索結果として列挙されます。


では、実際に各ブログサービスごとに、そのブログサービスで運営しているブログを見つける方法を考えていきましょう。

なお、ブログサービスはたくさんあるため、すべては記載できていません。
以下のページに記載されている、ブログの勢力図でシェアが多いブログについて記載しています。

ブログ検索 皆声.jp
http://minakoe.jp/


(1) Ameblo

検索キーワード:
site:ameblo.jp/*


解説:
Ameblog の場合には、ブログサービスのサブディレクトリに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブディレクトリの部分に、ワイルドカード(*)を指定して検索を実行します。


(2) FC2

検索キーワード:
site:*.blog.fc2.com/
site:*.blog1.fc2.com/
site:*.blog2.fc2.com/
 ・
 ・
 ・

または、
site:*.*.fc2.com/


解説:
FC2 の場合には、ブログサービスのサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


なお、FC2 のサブドメイン方式は、

http://blogID.blogX.fc2.com

blogID : 任意の文字列
X : サーバ番号(現在、新規に登録する場合にはサーバ番号の付与なし)

という形式によって与えられます。


すべての FC2 のブログを列挙する場合には、

site:*.blog*.fc2.com/

というフォーマットにて検索したかったのですが、それだと検索結果に何も表示されませんでした。

そのため、

site:*.*.fc2.com/

というフォーマットで検索した場合には、二つ目の * の部分に、blog 以外の文字列が指定されるようなページがある場合には、そのページもリストアップされます。


詳しいことは、以下の公式の仕様をご覧ください。

FC2ヘルプ | FC2ブログ | FC2ブログの仕様 FC2ブログでできること
http://help.fc2.com/blog/manual/Home/touroku/fc2blogspec.html


(3) Goo

検索キーワード:
site:blog.goo.ne.jp/*

解説:
Goo の場合には、ブログサービスのサブディレクトリに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブディレクトリの部分に、ワイルドカード(*)を指定して検索を実行します。


(4) Livedoor

検索キーワード:
site:blog.livedoor.jp/*

site:*.blog.jp/
site:*.doorblog.jp/
site:*.ldblog.jp/
site:*.dreamlog.jp/
site:*.publog.jp/

更に、その他有料プランのドメイン


解説:
Livedoor の場合には、ブログサービスのサブディレクトリまたはサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブディレクトリまたはサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


サブドメイン部分にブログの識別子が付与される形式の URL の場合、無料版の場合に上記の 5 種類があります。

更に有料版には、それらに加えて 23 種類のサブドメイン部分にブログの識別子が付与される形式の URL があります。


詳しくは以下のページをご覧ください。

URL・ドメインの設定をする - livedoor Blog ヘルプセンター
http://help.blogpark.jp/archives/52240385.html


(5) Seesaa

検索キーワード:
site:*.seesaa.net/


解説:
Seesaa の場合には、ブログサービスのサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


詳しいことは、以下の公式のページをご覧ください。

独自ドメイン: ブログ・ヘルプ
http://faq.seesaa.net/article/261346882.html


(6) So-net

検索キーワード:

site:*.blog.so-net.ne.jp/


解説:
So-net の場合には、ブログサービスのサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


詳しいことは、以下の公式のページをご覧ください。

ブログの初期設定:使い方 マニュアル:So-netブログ
http://blog-help.blog.so-net.ne.jp/reg3


(7) Cocolog-nifty

検索キーワード:
site:*.cocolog-nifty.com/

解説:
So-net の場合には、ブログサービスのサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


詳しいことは、以下の公式のページをご覧ください。

プラン比較表/プラン変更(ココログフリー向け有償オプション):ココログとは?:@nifty
http://www.cocolog-nifty.com/about/free.htm


(8) Hatena

検索キーワード:
はてなブログ
site:*.hatenablog.com/
site:*.hatenablog.jp/
site:*.hateblo.jp/
site:*.hatenadiary.com/
site:*.hatenadiary.jp/

はてなダイアリー
site:d.hatena.ne.jp/*


解説:
Hatena の場合には、はてなブログというサービスと、はてなダイアリーというサービスがあります。

はてなブログは、はてなダイアリーを使いやすく進化させたサービスです。


はてなブログは、ブログサービスのサブドメインに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブドメインの部分に、ワイルドカード(*)を指定して検索を実行します。


はてなダイアリーの場合には、ブログサービスのサブディレクトリに、各ブログの識別子が付与される形式の URL が付与されています。

そのため、ブログサービスのサブディレクトリの部分に、ワイルドカード(*)を指定して検索を実行します。


詳しいことは、以下の公式のページをご覧ください。



その他便利な使い方

(2) 各ブログサービスで運用されている日本語のブログを発見する

通常の設定では、全世界のすべてのページに対して検索を行っています。

そのため、日本以外でも展開されているブログサービスについては、日本語以外の言語のページも大量にヒットします。
日本語だけのページを見つけたい場合には、検索結果に対して「日本語のページ」のみを表示するためのフィルタを適用します。


フィルタの適用方法は、検索を実施したうえで、パソコン版のGoogle検索では、検索結果の上部にある検索ツールをクリックして、「すべての言語」となっている部分をクリックして「日本語のページを検索」に変更します。


すると、 日本語のブログを発見することができます。


(3) 各ブログサービスで運用されている最近更新されたブログを発見する

最近更新されたブログを見つけたい場合ってありますよね。

そんなときは、検索を実施したうえで、「検索ツール」をクリックして、検索ツールを表示させます。

そして、「期間指定なし」となっている部分をクリックして、ページの更新日の期間を指定します。

ページの更新日の期間は、
  • 1時間以内
  • 24時間以内
  • 1週間以内
  • 1か月以内
  • 1年以内
という固定された期間のほかに、
  • 期間を指定
にて、任意の期間内に更新されたページを発見することもできます。


また、「検索ツール」の「関連度順」を「日付順」に変更することで、更新時間が新しいもの順に並び替えることもできます。


注意点

上記の検索を Google 検索で何度も短期間に繰り返し行うと、Google 検索からロボットによる自動的な検索の疑いをかけられて、人であることの証明をするように求められることがあります。

実際私も、この内容を記載するために、上記の検索キーワードで何度も検索を行っていたら、Google 検索より指定された画像内の文字列を入力することで、人であることを証明するように求められました。


これは、Google が自動化されたクエリ(検索要求)を禁止しているためです。

自動化されたクエリ - ウェブマスター ツール ヘルプ
https://support.google.com/webmasters/answer/66357


そのため、そのような自動化されたクエリと似た行動を行うと、そのような自動化されたクエリの阻止のために、認証が必要になります。


上記の点に注意してください。


参考文献

検索での句読点、記号、演算子 - ウェブ検索 ヘルプ
https://support.google.com/websearch/answer/2466433?hl=ja


まとめ

このように、検索エンジンの「特定のサイトまたはドメインの検索(site: 演算子)」とワイルドカード(*)、および検索オプションを使用することで、各ブログサービスで運営されているブログページを見つけやすくなります。

他の人が 各ブログサービスのブログでどんなことを書いたり、どんなデザインを適用していたりするのか、いろいろと見て回ったりするのも面白いですね。


なお、上記の各ブログサービスの URL の形式に関して、見落としがあるかもしれません。
もし、見落としに気づかれた方は、コメント欄等で指摘して頂ければ幸いです。









関連記事

関連記事を読み込み中...

同じラベルの記事を読み込み中...