ちと問題があれば、消すのですが、妄想&メモ書きということで、参考まで。
■前提
google のランキング対策として、キーワードや文章校正、タイトルタグなどの調節があるが、基本「人力」で行われている(と思われる)。それぞれ SEO 会社(あるいは Web サイトの製作会社)のノウハウがあるだろうから、そのあたりは企業秘密ということ、にしておく。
で、まともに人力でSEO対策をしても面白くないし、労力がかかるので(イコール人件費がかかる)SEO 対策自体を「自動化」する。
この「自動化」に際して、いくつかの前提条件(仮定も含む)があって、
- google のランキングは、ロボットで行われている。
- ランキング アルゴリズムは、多変数解析に解ける、という仮定をする。
とする。複雑な(実は単純かもしれない)と言われる、google のランキングアルゴリズムを直接解くワケではなく、「多変数解析」として未知ものを解析するように動く、という方法である。
■変数と評価関数
変数は、一般的に言われているものを含めてみる。もちろん、適当な隠れ変数を入れても ok なのだが、HTML タグなどで表しにくいので、表現しやすいものがよい。ただし、「自動化」を目指すので、人力で HTML のタグ打ちや、文章校正をするのではなく、ノウハウ自体を自動化させて、文章自体を自動生成する。
文章の自動生成は、対 google ranking アルゴリズムになる、イコール ロボットとなるので、文章の「文法が正しいかどうか」は問題ならない(と思われる)。人が見たら明らかに「文章ではない」ものであっても、google アルゴリズムに対しては、「ランキングアップに値する文章のようなもの」であれば ok というこだ。
変数の候補としては、
- キーワードの挿入
- キーワード同士の近さ
- キーワードの頻度
- 被リンクの数
- 外部リンクへの数
- 更新頻度
- HTML 的な正しさ
- H1 等の利用
となる。被リンクに関しては、後述する、複数のドメインを確保して実験をする。
評価関数は、純粋に google のランキングとなる。ログインをしない様にしてランキングを調べる。商用化する際には、yahoo のランキングも含めるとよいかもしれない。
■検索キーワード
最終目的としては、ビックキーワードと呼ばれる検索キーワード(「化粧品」や「ダイエット」など)での、ランクアップを目指す(自動化でねw)のであるが、最初の試行錯誤としては、2語ぐらいのキーワードの組み合わせがよかろう。
全く、独自のキーワードで実験をすることも可能であるが、実用性が低くなる可能性が高いので、実際のキーワードを使う。
■実験環境
多変数解析と、遺伝子アルゴリズム(単に変数を少し変えて実験を繰り返すという方式)を組み合わせるので、検索対象となる独自ドメインは最低10以上は欲しい。最終的には、100ぐらいのドメインで実験するのがよいのだが、金額的に 1,000円 x 100 = 10万円程度になるので、ちょっと遊びで出すには痛いかなぁと。投資的にはこれぐらいやってもいいんですけどね。
当面は、20 ドメインを取得して評価関数で、上位2,3までを抽出(上位10%を抽出)するのがよかろう。
実験ドメイン自体は、使い捨て(1年で廃棄)なので、gmo で、.com を 480円で取得するか、.info を 180円で大量に買うという方法もある。ただし、.com のほうが、google に有利ではないか(という仮定)があるので…と思ったけど、いいかなぁ、.info でも。
サブドメインを使う方法もあるのだが、google の場合、サブドメインはまとめられてしまう傾向にあるので、独自ドメインで実験をしたい。
お名前.comとロリポップとGoogle Appsで格安サーバ構築 | ひろぶろぐ(Hiro Blog)や お名前.comの独自ドメインをロリポップサーバーで使う: アフィリエイトで月10万円計画 僕と『こびっと』とIRCモバイル無料塾の365の物語 にあるように、お名前.com で安いドメインを取得して、ロリポップで運営というのがよさそうだ。そうすると、100 ドメイン使っても、.info の 180円ならば、18,000円で、ずっと経済的である。実際は、ロリポップのチカッパ 月額515円が加わるので、 年間 3万円というところ。ホスティングを別途借りるのは、googleからのアクセス数も含めて、自前のホストには影響を与えたくないから。
さて、これで机上の空論ではないことは確認できたので(金額的に)、ちとアルゴリズムを考えますか。