ブログ検索(仮3)

至高×技の原稿書きに苦戦中…SQL ServerとOracleとMySQLとAccessと同時にSQL書くのは辛い…と愚痴をこぼす。

閑話休題

どうやら他に興味を発散/拡散させていないと煮詰まってしまうらしい(本当?)ので、少しブログ検索(仮)を考えてみる。

イーストプレスの「Google誕生」を図書館で借りて読んでいるのですが、会社のスタートアップの資金面で参考になるところあり、ビジネスのモデルとしての参考になるところもあり、そしてGoogle検索の弱点も見えてきたような気もし(本当?)。

Google誕生 —ガレージで生まれたサーチ・モンスター

Googleの「検索」をするときには

1.キーワードを入れる。
2.「検索」ボタンを押す。
3.検索結果が表示される。
3.1 検索結果にプレビューが含まれる。
4.検索結果のリンクからジャンプする。

ってのを繰り返す。
最近は先のSQL関係で調べものをすることが多いので、IEのタブ機能を使ってあらかじめぽちぽちと4,5個ぐらいクリックして開いておく。そしてざっとみて閉じる、を繰り返してたりします。

これを繰り返しているうちに、いくつか気づいたことを書きだすと、

1) 検索先は、IT技術系とIT技術系以外の2つに分けられる。
2) プログラミング系はリファレンスが最初なはずなのだが、サンプルを含めると探すのが大変。
3) サンプルコードは色々なレベルが混じっている。
4) (当たり前だが)検索結果はカテゴリ化されない。
5) 考えてみれば、まとめサイトを検索した後、他のブログを検索するほうがよい。
1)は乱暴な話だけど、仕事用の検索と、それ以外の検索では求めるものが違うということ。あるいは、IT技術系の話がインターネットに溢れかえっている(その他のページとの比率はどのくらいなのだろう)ということ。これは、技術的な発端がIT系であることだし、パソコンを使う頻度が一番高いのがIT系だろうし、ということで仕方がないところもある。あるいは、IT系のもののほうがインターネットに載せるのが楽ということもあり、逆に言えばIT以外の技術はインターネットに載りにくい、という傾向もある。

何かの商品を検索してみるとわかるのだが、大抵はamazonか楽天に引っ張られる。比較サイトだと価格.comとか、Yahoo!の口コミサイトとか。何かを「買う」ときはそれでいいのだけど、あるいは何かを「比較」するときはそれでいいのだけど、

a)その商品がどんなものなのか?
b)いつ頃発売されたものなのか?
c)代替するものはあるのか?
d)どの位の人が買っているのか?
e)使いごこちはどうなのか?

というような、「買う」いわゆるビジネスに直結しないものは検索しにくい。

が、何処で検索すればいいかは大体わかってきている。
インターネット検索の黎明期(インターネット黎明期ではない)の2000年頃、つまりはGoogleやYahoo!の検索が本格的に使われた頃には、ネットワークを縦断して検索したほうが当たりが多いのだが、今はあれこれサイトが多すぎて(広告だけブログとか、アダルト系とか)検索結果にゴミが混じる率が高くなってきている。おそらく今後も高くなると思う。

これをGoogle側の検索技術に頼ってもいいのだが(一方で頼るわけだけど)、

a)のような商品の写真、プレス記事、なんてのはプレス記事のサイトを先に検索したほうが早い。
おそらくITの日常化ができているからだと思うんだけど、日々私が見るサイトは限られている。余り新しいものには当たらない。これはGoogleで検索していても同じで、同じ技術サイトや同じブログに突き当たる。

ということは、人は何かを「検索」するときには何かを「目的」としているわけで、検索自体を楽しんでいる訳ではない(楽しむ場合もあるけど)。それが、自然言語で検索できる アスクジープスだったわけだけど、日本のask.jpは最近閉じられている。日本語の検索が難しかったのか、自然言語で検索するのが難しかったのか、はたまたgoogleと競合してしまったのか(協調しているはずなんだけど)。

幸いにしてask.comは生きているので検索するのだが、自然言語で検索するのは難しい。

というか、一発で検索するのは無理があるのでは?と思った次第。

例えば「Oracleの初心者が使うような本でいいものは無いか?あるいはネットでいいサイトはないだろうか?」という質問に対して。

「Oracle 入門書 評判 良い」
「Oracle サイト 初心者向き」

でGoogleを検索してもよいのだが、これを人に問い合わせるときは

A「Oracleを知りたいんだけど?」
B「Oracleのどんなことを知りたい?」
A「ああ、初心者なんでいまいちよくわからなくて」
B「インストールの方法?それとプログラミング?」
A「プログラミングの方かな?」
B「他のデータベースは触ったことはある?」
A「いや、まったくない。そもそもデータベースがなんだかよくわからない」
B「じゃあ、Oracleの簡単な解説の本と、簡単なプログラムの本がいいかな」
B「プログラムは何を使っている?」
A「一応、Javaを使っているけど」
B「なら、このJavaでアクセスできる本がいいんじゃない?」
A「本じゃなくてサイトもあると売れしいんだけど」
B「JavaでOracleにアクセスする解説をしているサイトがあるから、ここを読むといいよ」

な感じで会話が進んでいるハズ。
当然、Aは問いかけるのだが、一発で喋れるわけではない。そもそも何が分かっていて何が分かっていないかが分からない。無知の無知というやつだ。
これを専門家のBに聞くと、

 ・初心者なのか上級者なのか?
 ・システム屋なのかプログラマなのか?
 ・プログラマならばどんあ言語を使うのか?
 ・本が欲しいのか、ネットでサイトを知りたいのか?

ぐらいは質問を返してくるハズだ。
(いわゆる、Aがメーリングリストで言われていた「教えて君」状態だったり)

だから、Googleの一発検索あるいは検索した結果を絞り込み、という方法ではなくて、なんらかの示唆が途中で必要になる。実は図書館員の質問の受け答えが先の問い掛けになる。

これを「カテゴリ」→「検索」という先にカテゴリがが来ては駄目で(これは後日理由を書こう)、Aが何かを発したときに、Bが何かを示す、という順番でなくてはいけない。

という訳でブログ検索(仮)の話はまだ続く。

カテゴリー: 雑談 パーマリンク