IT News > トピックス > SEO対策 > ページランクコラム

ページランクの通説と真相
〜グーグルとスパマーのイタチごっこ

ページランクとは何か?

前回と同様に、グーグルのサイトから解説をしてもらおう。

Google の人気の秘密

(中略)

PageRankについて PageRank は、Webの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリンクをページAによるページBへの支持投票とみなし、 Googleはこの投票数によりそのページの重要性を判断します。しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。

Google 会社情報: Google の理念

(中略)

4.ウェブでも民主主義は機能する。 
Google が機能するのは、どのサイトのコンテンツが重要かを判断する上で、どのウェブ サイトの重要度が高いかを決定するために投票してくれる数百万のユーザーを頼りにしているからです。少人数の編集者が決定したり、用語の出現頻度だけを基準に決定するのではなく、PageRankという画期的な技術を使用して各ウェブ ページにランクを付けています。PageRank は、そのページにリンクしているすべてのサイトを評価して数値を割り当てます。評価の際、それらのサイトにさらにリンクしているサイトも考慮に入れます。ウェブの構造全体を分析することで、Google は、どのサイトがそのコンテンツに興味を持つユーザーから最高の情報源として "投票" されたかを判断します。この方法では、新しいサイトが増えるたびに情報ポイント、しいては票数が増えるため、ウェブが拡大するにつれて効率が上がります。
 つまり、原則として人手を介さず、ウェブページ同士でお互いを評価し合う民主的なシステムがページランクであり、リンクが多ければページランクが高くなる(リンクの量)と同時に、さらにリンクを多く集めたページからリンクを受けても高くなる(リンクの質)ということである。

 なお、「ページランク(PageRank)」とは、「ウェブページのランク」ではなく、グーグル創業者の一人である「ラリー・ペイジ(Larry Page)が開発したランキングアルゴリズム」という意味である(そういう意味では、「ペイジランク」とするのが正しいカタカナ表記なのかもしれない)。

 ページランクの特許は、スタンフォード大学が2001年9月に取得している。といっても、ページランクそのものは、ラリー・ペイジがスタンフォード大学在学中に開発した数学アルゴリズムである。グーグルは、2011年まで独占的に利用できるライセンス契約を、スタンフォード大学と結んでいる。

ページランクの実際の値

 ツールバーで見えるページランクは、ゼロと、1から10までの11段階である。しかし、本当はもっと複雑な計算式と数値になっている。そして、もちろん順位に影響しているのは、11段階にはしょってあるツールバーで見えるページランクではなく、実際の複雑な値の方であることは言うまでもない。実際の数値は、下記の表のようになっているらしい。

ツールバー ページランクの実数値
0/10 0.15 - 0.9
1/10 0.9 - 5.4
2/10 5.4 - 32.4
3/10 32.4 - 194.4
4/10 194.4 - 1,166.4
5/10 1,166.4 - 6,998.4
6/10 6,998.4 - 41,990.4
7/10 41,990.4 - 251,942.4
8/10 251,942.4 - 1,511,654.4
9/10 1,511,654.4 - 9,069,926.4
10/10 9,069,926.4 - 0.85 × N + 0.15

 よって、ページランクは、0から10の11段階の「ツールバー値」と、順位決定の大きな要因となる「実数値」のニ通りあることになる。上表のツールバーにおけるページランク(以下、「PR」と記述)、PR4では、実数値の幅が約194から1,166まであり、同じPR4でも、実数値が200ほどでは限りなくPR3に近く、1,100ほどでは限りなくPR5に近い。当然、同じPR4でも後者の方が上位表示につながる可能性が大である。

Google の秘密 - PageRank 徹底解説
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html

グーグルページランク早見表
http://www.pagerank-jp.thebest25sites.com/pagerank.html/

BuildtoLearn - View Single Post - ESTIMATE YOUR PAGE RANK, step by step
http://www.buildtolearn.com/51367-post1.html

Google Page Rank
http://ewwws.com/pr/implement.php

ページランクの値の仕組み

ページランクの値がどのようにして決まるのか、非常に簡単に、何もかも省略して、要点だけ絞って解説してみよう。

下図の、「PR5」などとあるのはページランクランクのツールバー値、(5,000)などの括弧内はページランクの実数値である。

PR5で実数値が5,000のページから、10個のリンクが張られていた場合、リンク先のページは他にリンクの出し入れがないのであれば、それぞれページランク実数値500を受け取る。つまり、「5,000÷10=500」ということである。このページランク実数値500は、ツールバー値の4に位置するので、リンク先の各ページはPR4となる。単純に、「PR5÷10=PR0.5」ではないことに注意しよう。

 よって、50個のリンクがあれば、渡す実数値は100、ツールバー値は3ということになる。リンク先が受け取るページランク実数値は「割り勘」ということである。もちろん、PR5のページにリンクがひとつしかないのであれば、独り占めであるから、リンク先のページもPR5になることは言うまでもない。

PR5(5,000)÷10のリンク=PR4(500)
PR5(5,000)÷50のリンク=PR3(100) 念のためであるが、もし上図のリンク元が実数値1,200のPR5の場合は、

PR5(1,200)÷10のリンク=PR3(120)
PR5(1,200)÷50のリンク=PR2(24) となる。

ページランクを高くするには

 リンク先が増えるごとに、ページランクの分け前が減っていくのだから、なるべく1ページあたりに張るリンクを少なくする方がいいだろう。また、自サイト内の全ページからトップページへリンクを戻して、リンクを集中させるべきである。モラルは別として、外部へのリンクはなるべく控えるに越したことはない。

 よって、ページランクの高いところからリンクをもらえないのであれば、よくあるようなトップページ相互リンクなどは、慎まなければならない。こちらはトップでリンクを受けても、出すのはサブのリンク集ページにするべきだ。ということで、ページランクは上がり、その代償として信望が下がる。

 なお、最高のPR10にランキングされているサイトの一覧は、下記ページをご覧いただきたい。

2006-07-14グーグル更新 PageRank10のサイト一覧 :グーグル
 グーグルはともかく、アドビやアップルなどアメリカのサイトばかりである。日本では、慶應義塾大学のサイトだけがPR10となっている。

ページランクの更新

 さて、ツールバーのページランクであるが、最近は3ヶ月に1回ほどのページでしか更新されなくなっている。ところが、順位は毎日のように変化している。ページランクが順位付けの重要な要因のひとつであるにもかかわらず、なぜ、年に4回程度の更新なのか?

見えるページランクと見えないページランク

 アメリカには、ウェブマスターやSEOスペシャリストが集うフォーラムがたくさんある。そこでGoogleGuy(グーグルガイ)と名乗るグーグルの中の人が、時たま重大な書き込みをすることがある。そのGoogleGuyがページランクについて、とても驚くべきことを発言したことがある。

PageRankは、常にスナップショットを使い、現在の順位付けのデータにとっては過去のものにすぎない。
PageRankは、毎日のように計算しているが、3〜4ヶ月ごとに目に見えるPageRankを送り出すだけだ。
 これが、前編の最後で問題提起した謎への回答である。

つまり、ページランクは毎日のように再計算されていて、ユーザーのキーワード検索では順位付けのベースとなっている。これに反して、ツールバーで見えるページランクは、何ヶ月か前のものを表示しているに過ぎないのである。

何のための見えないページランク?

 さて、なぜ見えるページランクと見えないページランクというように、グーグルは二重帳簿にしたのだろうか?

 前編で解説したものより、もっと詳しいページランクの計算式は広く知れ渡っていて、これに「アンカーテキストマッチ」を組み込むと、狙ったキーワードの順位アップの可能性が非常に高まる。グーグルは、検索結果のノイズとなるスパムや、過剰なSEOを非常に嫌っているので、見えないページランクは、スパマーの活動を制限するためのものに違いないと私は考えている。これによって、ページランクが高いページからリンクを張ってみても、リアルタイムでページランクを知ることができないので、確証が持てなくなる。しかし、これだけではアンチスパムは不十分である。

見えるリンク元と見えないリンク元

 ページランクよりも順位アップの即効性が期待できるのは、「アンカーテキストマッチ」をしこたま仕込むことである。これは、キーワードを含むテキストのリンクをたくさんのページで準備して、SEO対象ページに集中させることである。この過剰SEOを不完全にするために、グーグルはある時からリンク元のインデックスを見せないようにした。ここでも、見えるリンク元と見えないリンク元があるのである。

しかも、このリンク元はページランクよりも複雑である。例えば「link:ページURI」という検索式で、そのページのリンク元のインデックスを一覧することができる。ところが、これが、3ヶ月ほど前のスナップショットであり、しかも一部分だけなのである。つまり、見えるリンク元は常に古くかつ部分的なものに過ぎないことになる。

SEOとしてのリンクは、リンク元がインデックスされていることを前提とする。リンク元がインデックスされていなければ、SEOにはならない。アンカーテキストマッチは成立しないのである。

グーグルは、このようにリンク元のデータを、古いものでかつ部分だけ見せるという手法を採ることによって、スパマーの活動を著しく制限できたことになる。今や、勘や行き当たりばったりでSEOをやるしかなくなった、といえるかもしれない。キーワード検索の結果として順位は出てくるのだが、SEOのバックグラウンドをリアルタイムで確認することができなくなったのである。

ツールバーのページランクはお遊び

 以上のような状況で、グーグルは、現在のツールバーに表示されているページランクは、娯楽程度に考えなさいよ、と言っている。つまり、ツールバーのページランクは、数ヶ月前のものを見せているだけであり、キーワード検索の時に使われているページランクとは別物なのだからと。

見えるページランクと見えるリンク元の制限下のSEO

 約3ヶ月前のページランクとリンク元という状況は、特に新規に立ち上げたサイトや、新しいページには辛いことである。逆にスパムや過剰SEOは、新設サイトや新規ページに仕込まれれることが多いので、そういった不正の手口に精通しているグーグルは、SEOデータをベールで覆ったのだろう。

 とにかく制限された見えるSEOデータによって、サイトやページの最適化を進めるしかない。まず、ページランクは数ヶ月前のデータとはいえ、その昔の正しいページランクのはずである。ページランクが極端に乱高下することはないので、新規ページ以外はツールバーのページランクを情報として受け取っても大差はないだろう。

 問題はリンク元である。とりわけ競合サイトのSEOを解析するうえで非常に制約があって、今では「およそこの程度かな」という曖昧な見極めをするしかなくなっている。そうなると、見えるものだけを情報収集して、ライバルサイトがあんなことをやって順位が上がっているのに、自分はこんなことをやって順位を落としたようだから止めよう、気を付けよう、といった枝葉末節の摘み食いSEOをやっても効果は期待できないと思われる。勝負は、見えるものではなく見えないもので決着しているのだから。

 ということで、見えるものに惑わされず、不正ではない適正なSEOでサイトやページを作り込んでいくことこそ、大正解と言えるのではないだろうか。