vzorec, vysvětlení a odpovědi
PageRank je číslo, které si Google přiřazuje ke každé stránce (přesněji řečeno ke každému URL). Vyjadřuje něco jako věrohodnost nebo důležitost stránky. Někdy se píše zvlášť jako "Page Rank" a zkracuje se do zkratky PR.
Vzorec PageRanku - A teď česky - Jak zjistit PageRank své stránky - Jak zvýším svým stránkám PR - PageRank FAQ - Co to znamená PageRank
Pagerank v klasickém pojetí dosahuje hodnot od nuly do jedné. Google si Page Rank počítá (zjednodušeně řečeno) podle toho, kolik a jak důležitých stránek na tu počítanou stránku odkazuje. Existuje na to vzoreček. Je to trochu matiky, tak to případně přeskočte, není nutné to chápat detailně.
PageRank stránky A označím jako PR(A). Vypočítá se z PageRanků stránek, které na ni odkazují. To jsou stránky T1 až Tn.
PR(A) = (1-d)/m + d * ( PR(T1)/C(T1) + ... + PR(Tn)/C(Tn) )
kde d je dampening faktor (nastavený pravděpodobně na 0,85),
m je celkový
počet zaindexovaných stránek.
C(T) je počet odkazů vedoucích ze stránky T.
Jako vstupní hodnoty PR(Ti) se berou hodnoty PageRanku stránek z minulé iterace výpočtu. Vzoreček po několika iteracích dobře konverguje (tím lépe, čím je nižší d). Hodnoty PageRanku všech stránek se pohybují těsně nad nulou.
Originální dokumentace uvádí vzoreček trochu chybný:
PR(A) = (1-d) + d * (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
je to špatně, chybí tam to m.
Pro zasvěcené zdůrazňuji, že PageRank je veličina skalární, tedy pro každou stránku (URL, dokument) jde o jediné číslo. (V rámci některých pojetí se o PageRanku mluví jako o vektoru v n-rozměrném prostoru, kde n je počet dokumentů. To je pouze složitější pohled na jednoduchá čísla.)
Vzorec se dá zjednodušeně přetlumočit tak, že stránka předává část svého PageRanku stránkám, na které odkazuje. Čím víc obsahuje odkazů (hodnota C), tím méně každé stránce předá.
Tím, že stránka obsahuje odkazy, o svůj PR nepřichází. Spíše než o "předávání" bych měl mluvit o "kopírování" nebo "přeposílání" PageRanku. Čím méně má stránka odkazů, tím víc Page Ranku se každým odkazem přeposílá.
PageRank nijak nezávisí na hledaném slově (je to veličina skalární). Page Rank má každá jednotlivá stránka (URL), nikoliv celý web dohromady (site, doména).
Čím má stránka vyšší PageRank, tím bude pravděpodobně výše ve výsledcích. Pozor! Page Rank zdaleka není jediné kritérium pro nalezení stránky v Google. Poslední dobou kolem Page Ranku vypukla na webu doslova hysterie. Page Rank je jistě velmi důležitý, ale jeho význam je podle mého názoru přeceňován.
Moje výzkumy jednoznačně svědčí o tom, že Google používá PageRank zejména pro řízení robota (crawlera). Stránky s nízkým rankem navštěvuje zřídka. Některá nová URL ani nenavštíví, dokud jejich PR nedosáhne určité hodnoty (PR se dá počítat i pro ještě nenavštívené stránky).
Aktualizace 2016: níže uvedené zjišťování PR už nefunguje. Google přestal poskytovat přibližnou hodnotu PageRanku přes API, takže žádný nástroj, který slibuje zjištění PageRanku, nemůže fungovat. Ani ten můj.
Přibližně se dal PR zjistit přes Google Toolbar, doplněk prohlížeče dostupný na Google (již nedostupný).
Na toolbaru se objevovalo zelené měřítko Page Ranku od 0 do 10.
Vyčerpávající článek o Google Toolbar PageRanku jsem napsal pro Lupu. V rychlosti jenom nejdůležitější věci:
Na zobrazování ikonky aktuálního pageranku jsem provozoval malý webík http://pagerank.yuhu.cz. Již také nefunguje.
Koncem roku 2007 se Google nechal slyšet, že uměle snižuje toolbarový pagerank webům, které masivně prodávají odkazy. U nás se to stalo například Lupě (lupa.cz), které spadnul pagerank ze sedmičky na čtyřku, Navrcholu (8 -> 6), Nettravelu (6 -> 4) a dalším. Podle různých symptomů tohoto snížení se dá soudit, že snížení postihuje pouze ukazatel na Google Toolbaru (a ostatní odvozené ukazatele), ovšem na hodnocení stránky ve výsledcích Google nemá vliv.
Postarejte se, aby na stránku vedlo co nejvíc odkazů ze stránek, které mají vysoký PR. Jinak to nejde.
Odkazům, které vedou na moji stránku, se říká zpětné odkazy (asi jako protějšek k dopředným odkazům, které jsou na mé stránce a míří pryč). Zpětné odkazy se získávají špatně, zejména pokud máte stránky horší nebo průměrné kvality.
Nejsnáze se základní zpětné odkazy získávají v katalozích. Stačí si vyhlédnout tematickou stránku nějakého katalogu a zaregistrovat do ní ručně URL a popisek stránky. Čím více registrací v různých katalozích, tím lépe. Jakmile ale nemá vyhlédnutá stránka katalogu na toolbaru PR alespoň 3, je otázka, zda má cenu mít na takové stránce odkaz.
Dobrý nápad je oslovovat spřízněné weby se žádostí o výměnu odkazů. Čím méně je na zdrojové stránce odkazů, tím je odkaz hodnotnější.
Existují matematické modely, které ukazují, jak se dá vzájemným prolinkováním stránek na určitých stránkách webu koncentrovat PR z jiných stránek. Nejčastěji se doporučuje mít na každé stránce odkaz na domovskou stránku. Je to jedna z mnoha metod a rozhodně není univerzální, někdy je dokonce kontraproduktivní (to když je na hlavní stránce málo hodnotného obsahu).
Jednoduchým výsledkem modelů je to, že by se na stránky mělo dávat co nejméně "odkazů pryč" mířících na cizí stránky ven z webu, aby se na stránkách koncentroval Page Rank. Podle mých výpočtů to ale není zas tak podstatné. Je to zbytečné škudlení. Mnohem lepšího výsledku než odstraněním vnějšího linku se dá dosáhnout přidáním další stránky s hodnotným (nejlépe unikátním) obsahem.
Ano a ne. Spíše ne. Je to spíše "přerozdělení" než zvýšení.
Tím, jak se stránky jednoho webu prolinkují mezi sebou, se dá změnit rozložení celkového součtu PageRanku v celém webu. "Mělké weby", jejich stránky odkazují na hodně svých sousedních stránek ze stejného webu, mají PR rozložený rovnoměrněji.
Naopak hluboké weby s více úrovněmi mají větší rozdíly mezi PR jednotlivých stránek. Záleží ale na konkrétní odkazové struktuře.
Dobrý nápad je, aby na každé stránce byl aspoň jeden odkaz, typicky na hlavní stránku webu. Tím zabráníte efektu "rank sink", kdy se rank nepředává dál.
Osobně považuji za dobrý nápad mít na každé stránce webu odkaz na hlavní stránku. Kromě toho, že to je dobré pro uživatele, tím můžete trochu zvýšit rank své hlavní stránky. Pro přesné pochopení toho, jak to funguje, musíte pochopit výše zmíněný vzorec.
Je otázka, zda je dobré mít koncentrovaný PageRank na hlavní stránce. To se vyplácí pouze pro vysoce konkurenční obory s malým počtem klíčových slov. Pro většinu projektů je naopak lepší PageRank široce rozložit na více konkrétních stránek.
Ne. PageRank se počítá pouze z odkazové sítě. Google v rámci výpočtu PR vůbec nesleduje, o čem stránka je.
Celá tato stránka pojednává o PageRanku, kterému někdy říkám "klasický PageRank". Veřejnost je už natolik zblblá různými fantastickými teoriemi PageRanku (přestože je jeho výpočet přesně popsán), že mi takový termín (klasický pagerank) přijde užitečný.
Je vysoce pravděpodobné, že Google používá další ranky, jejichž výpočet je narozdíl od PageRanku neveřejný, a které mohou být pro řazení výsledků vyhledávání důležitější (a podle mého názoru i jsou). V případě těchto dalších ranků pak už na tématu stránky záležet může.
Ne. V klasickém PageRanku nikoliv.
Obecně řečeno ano. Není to ale výrazné. Funguje to nepřímo. Princip je tento:
Pokud ze stránky A odkazuji na svou stránku B, předávám rank své stránce B. Je vysoká pravděpodobnost, že na stránce B bude další odkaz na nějakou mou stránku a případně odkaz zpět na stránku A. Tím se mi část předaného PR jakoby vrací.
Když ovšem ze své stránky A odkážu na cizí stránku C, pravděpodobnost zpětného odkazu na nějakou mou stránku je tam mnohem nižší, takže se mi PR nevrací.
Přímo tedy odkazem na cizí stránky o žádný rank nepřijdete, pouze máte menší pravděpodobnost, že se vám to vrátí. Obecně je ovšem dobrý nápad odkazovat na cizí hodnotné stránky, protože jiné algoritmy než PageRank to naopak mohou počítat stránce k dobru. Zejména se to také líbí uživatelům.
Můžete v odkazu použít atribut rel="nofollow", např.
<a href="http://www.seznam.cz/" rel="nofollow">Seznamu nic nedám</a>
Google takovéto odkazy nezapočítává do zpětných odkazů. Ten, na koho odkazujete, vás za to ale asi nebude mít moc rád.
Druhý způsob, jak nepřeposlat moc ranku, se dá odvodit ze vzorečku. Množství ranku přeposílaného každým odkazem je nepřímo úměrné počtu odkazů na stránce (ve vzorečku jde o proměnou C(T)). Budu-li tedy mít na stránce hodně odkazů (spousta jich může vést ke mně), budou přeposílat málo ranku.
Jestli chcete znát můj názor, tak já na tyhle věci nehraju. Co stojí za odkaz, na to odkážu, rank nerank. I tak má Google moje stránky moc rád.
Takže Page Rank je to vlastně "Hodnocení pana Page".
Často se uvádí výklad Page = angl. stránka, takže PageRank = stránkový rank. To je špatné vysvětlení.
Poslední hrubá aktualizace stránky (smazání nefunkčních věcí): 14. 1 2017
Jak psát web píše Yuhů, Dušan Janovský. Kontakt.