日々のコンピュータ情報の集積と整理

Dr.ウーパのコンピュータ備忘録

2015年3月13日金曜日

はてなブックマーク:人気エントリーや新着に表示されているページが見つからない場合 - 長いURLが原因かも?

イントロダクション

ブラウザ版のはてなブックマークの、人気エントリーや新着が記載されているページにて、ごくまれに存在しているはずのページにアクセスすると、ファイルが見つからない(404)場合があります。

いままではてっきり、元のファイルが消されただけだと思っていたのですが、そうではない場合もありました。


はてなブックマーク:人気エントリーや新着に表示されているページが見つからない場合 - 長いURLが原因かも?


長いURLを持つページをブックマークした場合には、一定文字数以上の URL が切り取られて、はてなブックマークに登録されるようです。

はてブとページ名の長いWikiの、登録URLの長さ問題 - Togetterまとめ
http://togetter.com/li/132027


そのため、はてなブックマークの Web ページで、その長い URL を持つページにアクセスしようとすると、当然ファイルが見つからないわけです。


今回私が遭遇したページも、254 文字で URL が途切れていました。
そのページの正しい URL は、300 文字近くありました。

その正しい URL にアクセスしたところ、正常にページが表示されました。


最近は、Webサイトやブログの記事のファイル名として、日本語の文字列をエンコードしたものが付与されるところも増えてきました。

たいてい、そのWebサイトやブログの記事のファイル名として使用される日本語の文字列をエンコードしたものは、その記事のタイトルが元になっています。

そのため、タイトルの文字数が多すぎる場合には、このような現象に遭遇します。


対策

そのようなページに遭遇した場合に、そのページにアクセスするにはいくつかの方法があります。

ページタイトルで検索する

検索エンジンにそのページが登録されていれば、検索エンジンでそのページタイトルで検索することで、そのページへアクセスすることができます。

しかし、今しがたアップロードされたような情報や、検索エンジンとうまく連携が取れていないようなページでは、検索エンジンで見つけることができません。


そこで、次の方法を用います。


URL の一つ上のディレクトリや、サイト(ブログ)トップへアクセスし、その記事を探す

URL が途中で途切れているだけ(たいてい最後のファイル名の部分が途切れている)ですから、そのファイルの一つ上のディレクトリや、サイト(ブログ)トップのURL は見て分かります。

そのため、そのファイルの一つ上のディレクトリや、サイト(ブログ)トップへアクセスすることで、そのページを探すことが出来る場合があります。


まとめ

はてなブックマークに登録されているページにアクセスできない(404 Not Found)場合には、URL が長いというケースが挙げられます。


閲覧者は、そのページのファイル名やURLの上位ディレクトリにアクセスすることで、そのページを見つけることが出来る可能性があります。

Webサイトやブログの管理者は、管理しているWebサイトやブログのアクセスログで、意図しないページへのアクセスによって404 エラー(ファイルが見つからない)が発生している場合には、このような現象を疑ってみると良いかもしれません。


場合によっては、URL を短くするという対処をとる必要があるでしょう。

ただし、一度公開したページの URL を変更すると、今度はいままでの長い URL を保持していたところで、404 エラー(ファイルが見つからない)が発生してしまいます。

そのため、公開後すぐに気が付いた場合を除き、元の URL と短くした URL の両方を保持し、どちらかのページを正式なページとして、正式ではないページからアクセスをリダイレクトするような対策が必要となるケースもあるでしょう。




ただし、本当にそのファイルが消えている場合もあります。







関連記事

関連記事を読み込み中...

同じラベルの記事を読み込み中...