ブログ検索(仮2)

http://www.moonmile.net/blog/?p=239 の続き

にほんブログ村
http://www.blogmura.com/

からぽちぽちと手動で検索した結果をまとめたもの。

cci20090608_00000

 

ブログ検索の場合、2つの検索があって、

a) 新しいもの(流行りもの)を検索する場合
b) 過去の詳しいデータを検索する場合

がある。a) の新着記事の場合は、各ブロガーが書いた途端に ping サーバーに飛ばし、その時点で検索できる必要がある。アニメやらテレビの批評やらがそれ。あとニュースとか。

もうひとつは一人のブロガーがコツコツためた記事を検索する場合で、過去の書評とかプログラミングの記事とか、なんかのFAQとかがそれにあたる。

で、google とか他のブログ検索と似たようなことをやると、似たような結果しか出てこないので(社会学/資本主義としてはそれでいいのだが)、所謂ニッチなところ、所謂「進化の谷間」を狙わないとだめなので、google 検索やにほんブログ村の逆をやらないといけない。

ということは(仮定として)

1) ページランキングを付けない。
2) カテゴリ分けをしない。

ことになる。

ページランキングをすると、ランキングの上位に来るように SEO 対策を行われる。他からのリンクが多い(参照が多い)ほうが他の人は参照するだろう、というランキングは、たくさんのところからリンクされるようにするという手法が発生してしまう。なので、そもそもランキングを付けないのが正しい、と思われる。
仮定としてだが、検索結果をパッと見て100件あれば十分だろう。また具体的なものを探すのであれば、10件あれば十分。逆に言えば、10件以外は目的に沿わない、検索者にとってゴミデータということになる。

カテゴリ分けをしない、のは、カテゴリを分けると探すのが大変だから。また、カテゴリを分けるのであれば、大手のものをそっくり真似してしまうと良い。
たとえば、トップからのカテゴリを10個作って、その中にカテゴリを10個作ると、全体で100個のカテゴリができる。こんなに分けても検索者には覚えきれないし、最初に「カテゴリ」を見つけることは不可能。
ならば、逆に数で分けてカテゴリを分けるか(100個にならないとカテゴリに昇格しないとか)、そもそも「何故カテゴライズが必要なのか?」を考え直す必要がある。

で、それが2枚目の思考で。

ccf20090608_00001

・新刊が出たとき
・子育てでアトピーについて調べたいとき
・新しいパソコンが発表されたら

と3つ試してみると、それぞれ行き着きたいサイトが異なる。
# 日記ブログの場合は社会コミュニケーションの一環として行われるので、この検索には当てはまらない。

こうなると、google で書評を検索しようとして amazon や bk1 がトップに来るのは「困る」ってのはどうしてなのかが見えてくる(と思う)。それは、google や amazon に取っては、(当たり前だが)モノを売るという商業主義が前面に出てくるのに対し、検索する人の第一目的は「モノを買わない」という場合もあるためだ。

本を買うときは「書名 amazon」なんてやると大抵は一番最初に出てくる(site: を使ってもいいけど、面倒なので)。が、書評なんてのは難しい。価格.com を含めたい場合は「製品名 価格」なんかでトップに出てくるからいいけど、比較したりスペックを調べてるときはちょっと手間だ(最近は価格.com から仕様でジャンプするのが早いことが分かった)。

だから、モノを調べるときに、最終的にその人が「買う」のか「比較したい」のか「興味だけがあるのか」、「もっと安いものを知りたい」のか、「買いたくない」理由を探しているのか、あるいは、対処法を探しているのか、類書を探しているのか、なんて具合に、最終的に何がしたいのか?を思い遣らないと、うまく検索結果をその人にマッチさせることはできない。
という訳で単純な全文検索(マッチングとランキング)だけでは、目的に辿りつかないことが分かった(納得できた)ので、次の手を考える。

情報検索入門ハンドブック 

books.or.jp
http://www.books.or.jp/ResultDetail.aspx?IdString=0%2cMAIN%2cNODE%2c430687&scode=&searchtype=0&title=%8f%ee%95%f1%8c%9f%8d%f5%93%fc%96%e5%83n%83%93%83h%83u%83b%83N&writer=&syuppansya=&showcount=20&startindex=0&SyuppanCode=7621
amazon
http://www.amazon.co.jp/dp/4585071245
勉誠出版
http://www.bensey.co.jp/book/2036.html
bk1
http://www.bk1.jp/product/03036231
google ブログ検索
http://blogsearch.google.co.jp/blogsearch?hl=ja&ie=UTF-8&q=%E6%83%85%E5%A0%B1%E6%A4%9C%E7%B4%A2%E5%85%A5%E9%96%80%E3%83%8F%E3%83%B3%E3%83%89%E3%83%96%E3%83%83%E3%82%AF&btnG=%E3%83%96%E3%83%AD%E3%82%B0%E6%A4%9C%E7%B4%A2&lr=lang_ja

な感じにまとめてくれるといい。
# ちなみに↑のリンク先に有用な情報は少ない…。

この本は図書館で借りてきた。結局のところ、検索技術ってのは図書館で館員に「こんな本がありますか?」と尋ねるのと同じなので、いくつか図書館に関する本を読んでいる。
この本は多少書籍検索に偏ってはいるけれど、特許の検索とか政府刊行物とか。
おまけ、
地図閲覧サービス(ウォッちず)
http://watchizu.gsi.go.jp/index.html
電子国土
http://portal.cyberjapan.jp/index.html

国土地理院が「試験的」に出しているサービスで、電子国土webシステムってのがある。
google map に押されている(って当たり前か)けど、電子国土ってのは、ロゴを表示すれば自由に利用できる模様。

# 地図の出来としては、google map に提供しているゼンリンのほうが格段に上。

カテゴリー: 雑談 パーマリンク