2007年10月2日火曜日

MSN / Live Search 日本語版、検索アルゴリズムとインデックスを刷新

米Microsoftは2007年10月1日より、Live Search / MSN のインデックス及び検索アルゴリズムの刷新を開始した模様だ。日本語版(Live.jp)も2日未明から大幅な更新が確認されている。


これは先月26日に発表された、Live Searchの大幅バージョンアップを受けてのもの。同社は10月末までに順次、新機能をリリースしていくとアナウンスしていた。

とりわけ日本語版Live Searchの変更点は次の通り。発表どおりウェブインデックスが拡大されたほか、検索アルゴリズムに抜本的な着手を行った模様。

これまでLive Searchは、キーワード繰り返しや隠しリンク、単純なリンクファーム、スパム用リンクページの設置といった、10年前に流行した古典的な検索エンジンスパムにも十分に対応できていなかった上、本来評価すべきでないリンクに過剰な加点を与えていたことから、単ワードはもちろんテールワードでも満足いく検索結果を提示できたとはいえない状況だった。例えば、SEO会社がランキングを上昇させる目的で作成したと思われる、ほんとど内容のないウェブサイトであったり、画面フッター付近に47都道府県 x キーワードの全組み合わせを背景同色で埋めているサイトが上位に表示されていた。

今回のアルゴリズム刷新では、不特定多数のページ上に同一パターンで貼り付けられているリンクのスコアリング無効化、ページ(ソースコード)の特定箇所に出現するリンクのスコアリング無効化、ランキングを故意に上昇させようとする多種類のリンクパターンに対するスコアリングの調整、リンク元ページとリンク先ページ間のレリバンシー評価の改良などの変更が実施された模様。結果として、Yahoo!やGoogleで長きに渡り上位に表示されているサイトの大幅な順位下落が多数確認されている一方、自然リンク(あるいは、"自然な形態を持つ"多数のリンク)を受けるサイトが検索上位に表示されるようになっている。これまで米国版Live Searchのレリバンシーが改善されるという発表は何度かあってもそれが日本語サイトでも対応されることは皆無だったが、今回は本腰を入れて検索品質改善に着手したのだろう。

マイクロソフトのLive Searchは、一般に"PageRank"と呼ばれるリンクのスコアリングのほか、ニューラル・ネットワーク(神経回路網)を応用したRankNetといったアルゴリズムを導入していると言われている。

0 件のコメント: