*2.1.2. Intuitive justification (直感的な有効性検証)
PageRankはユーザーの振舞いのモデルであると考えられ得る。Webページをランダムに与えられ、links 上でクリックし続け、決して反抗しないが、結局うんざりして、別な行き当たりばったりのページをクリックする、そんなRandom surferがいると想定する。Random surferがある1ページを訪れる確率、それこそがPageRankである。そして、減衰係数(damping factor) dは、Random surferがうんざりして次の別な行き当たりばったりのページを望む各ページの確率である。一つの重要な変動は、減衰係数dを一つのページ、あるいは一つのページ群に与えるだけ、である点だ。これにより個人化(personalization)を可能にし、さらに高い評価ランクを得るためにシステムにわざとミスリードさせる事をほぼ不可能にする。
他の直感的な正当性は、そのページを指し示す多くのページがあるか、またはいくつかのページがそのページを指し示し、かつそれらが高いPageRankを持っていれば、その指し示されたページは高いPageRankを持つ事である。直感的に考えると、Web上のの多くの場所からよく引用されるページは見るべき価値がある。同様に、Yahooの様な何者からのたった一つの引用をされるページは、大概見るべき価値がある。そのページが高い品質を持っていなかったり、リンク切れだったら、Yahooはそれとリンクを張らない可能性は大きい。PageRankはそのいずれのケースにも、またWebのリンク構造を通じて繰返し重みを伝播する事でその中間にある全てを扱う。
なぜ2人がGoogle にこの様な仕組みを組込んだのかについては、その当時の時代背景を知ると良いと思います。私は「SEOとは? 初心者向け完全ガイド」、「検索エンジンとSEOの歴史」を参考にしました。なお、減衰係数を0.85にセットした理由は、2人が大学のデータベースに構築したシュミレーション・システムで、色々な値を試した結果の最適値ではないかと考えます。
参照資料 :
- The anatomy of a large-scale hypertextual Web search engine. Stanford University Sergey Btin、Lawrence Page (発表に際してFull versionと配布用のShorter versionが用意されていた様だ。)
- SEOとは? 初心者向け完全ガイド 向井 拓真
- 検索エンジンとSEOの歴史 戸栗 頌平