Hlavní navigace

SEO v roce 2021: Co je to „passage indexing/ranking“

1. 2. 2021
Doba čtení: 7 minut

Sdílet

 Autor: Depositphotos
Google vrhá do boje za lepší výsledky vyhledávání umělou inteligenci a strojové učení. Jedním z výsledků bude tzv. „passage indexing“, tedy zpracování (dílčích) textových pasáží tak, aby vyhledavač lépe pochopil jejich obsah a mohl je uživateli nabídnout jako relevantní odpověď na jejich dotaz.

Než se podrobněji podíváme na indexaci pasáží, připomeňme si to, co nynější situaci předcházelo.

Prolog: Malý historický exkurs

Dokud vyhledavače jen málo chápaly obsah textu, vše se točilo kolem klíčových slov. Kdo chtěl získat dobré pokrytí pro nějaký obor, byl motivován publikovat více samostatných stránek zaměřených specificky na dané klíčové slovo nebo slovní spojení. A to často i pro synonyma nebo i různé gramatické tvary.

S pochopením obsahu textu se situace změnila a bylo možné se orientovat na specifické téma nebo obor a naopak bylo žádoucí v textu uvést synonyma a příbuzné související termíny tak, aby obsah stránky obor či téma pokrýval. Tím bylo jednodušší publikovat sice menší počet jednotlivých textů, zato ale mohly být obsáhlejší. Ukazovalo se, že Google upřednostňoval delší texty, které byly schopné poskytnout komplexní informaci. Obecné doporučení na délku textu se z 300 slov zvýšilo řádově. Upřesnila to ale nedávná studie založená na analýze výsledků vyhledávání (SERP). Ta ukázala, že je tu dostatečně silná korelace mezi obsáhlostí a detailností textu a jeho umístěním na předních místech v SERP. Neuvažovala se samotná velikost html textu, obsáhlost byla  o rozsahem informací (měřená nástrojem Clearscope) a ne mechanicky počtem slov, samotný počet slov se ukázal jako nerelevantní.

Hlavním cílem ale, ke které mu Google směřuje, je zjistit záměr uživatele, který měl při pokládání dotazu, tedy „search intent“ tak, aby mu výsledky vyhledávání poskytly co nejlepší odpověď. A to nemusí být vždy nejobsáhlejší dokument. Někdy se žádaná informace – pasáž textu – může skrývat v rozsáhlejším dokumentu jako příslovečná jehla v kupce sena.

Passage indexing/passage ranking

Tím, jak vývoj směřoval k preferenci delších a komplexnějších textů, vyvstal pro Google úkol správně najít i malou pasáž textu, která poskytuje přesnou odpověď na požadovaný dotaz. Google v polovině října 2020 na svém blogu oznámil, že pro to zapojil umělou inteligenci a strojové učení (AI/ML). Tuto schopnost označil jako „passage indexing“ a ta není samozřejmě jediným cílem pro nasazení AI/ML.

Název „passage indexing“ je možná poněkud zavádějící, o „indexaci“ se hovořilo dosud ve vztahu k celým stránkám, a to tak svádí k předpokladu, že do vyhledavač bude zpracovávat pasáže, tedy části stránek, samostatně podobně jako stránky. Navíc i v tomto směru mohlo vyznít výše citované oznámení na blogu Googlu, které učinil jeho viceprezident Prabhakar Raghavan.

Později to v on-line rozhovoru pro web SEJ upřesnil Martin Splitt, Developer Advocate z Googlu. Podle jeho sdělení, zatím bude stále základní zpracovávanou a klasifikovanou entitou celá stránka, „passage indexing“ má sloužit k lepšímu pochopení a zpracování obsahu, což se projeví ve výsledcích vyhledávání. Proto je možná trefnější obrat „passage ranking“. Vlastně to znamená, že Google bude schopen porozumět určité textové pasáži a analyzovat/vyhodnotit ji nezávisle na zbylém obsahu stránky, na které je tato textová pasáž obsažena.

Vysvětlení funkce passage indexing/ranking“ na příkladu
Vysvětlení funkce passage indexing/ranking“ na příkladu: Google je nyní schopen poznat, že konkrétní pasáž (vpravo) je pro určitý dotaz relevantnější než šířeji pojatá stránka na dané téma (vlevo). 
[Zdroj: blog.google/products/search/search-on/]

Jak velká je pasáž?

Odpověď na tuto otázku mimo jiné ukáže, jak zapojení umělé inteligence a strojového učení změní technologie. Google totiž vlastně neví, jak bude přesně pasáž vypadat (resp. na začátku to nevěděl a teď je možná odpovědi blíž). To, jak identifikovat a ohodnotit pasáž (a určit její velikost), to vlastně bude jedním z výsledků strojového učení a v čase se může měnit, jak upozornil Martin Splitt.

Komu to pomůže?

S dobře tematicky členěnými a (technicky) strukturovanými texty Google patrně nemá problém již nyní. Paradoxně by tak mohlo passage indexing/ranking pomoci právě textům, které dosud mohly být pro zpracování méně přehledné a představují z hlediska SEO horší vstupní materiál na zpracování.

„...je to jen menší změna, kterou se snažíme pomoci těm, jež nejsou obeznámeni se SEO nebo neumějí strukturovat svůj obsah nebo obsahovou strategii. Spousta lidí totiž nakonec vytvoří předlouhé stránky, které jen stěží získají hodnocení pro určitou věc, a to ve skutečnosti proto, že všechno je při takto dlouhém obsahu zředěno. Těm pomáháme,“ upřesnil Martin Splitt.

Podobně se vyjádřil i jiný zástupce Googlu John Mueller v odpovědích na otázky SEJ. Připomněl, že Google dělá řadu esenciálních změn proto, že si uvědomuje, že existují webové stránky, které jsou chaotické a nestrukturované. Cílem je pochopit obsah i takového webového obsahu a dát mu šanci ve výsledcích vyhledávání (pokud je informace relevantní). 

Jak velký bude dosah?

Google předpokládá, že „passage indexing“ ovlivní asi 7 % dotazů. Změny asi nebudou zásadní, Google sám to považuje za malou změnu, nicméně zase procento ovlivněných dotazů je oproti jiným úpravám algoritmu relativně velké. Často se v této souvislosti zmiňuje update Penguin, které ovlivnilo 3,1 % anglickojazyčných dotazů (zato mnohem zásadněji).

Kdy to bude?

Vyhledavač se už učí, pro anglický jazyk měla být nová technologie nasazována nyní, tedy na přelomu prosince 2020 a ledna 2021, další jazyky budou následovat.

Závěr: Co z toho plyne pro SEO?

Nějaké SEO cílené na „passage indexing/ranking“ není dost dobře představitelné. Co se ale dá předpokládat, je, že vhodně sémanticky členěný text bude mít při strojovém zpracování vždy výhodu. Kdo své texty co nejvíce zúročit ve smyslu jejich viditelnosti ve vyhledávčích, měl by nyní ještě více dbát na logické členění a technické strukturování textu pomocí HTML elementů, jako jsou například h1..h6, ul, ol, dt, nav, article nebo aside. I když Google bude čím dál tím lépe rozumět i „chaotičtějším“ textům, dobře strukturované dokumenty budou mít patrně vždy náskok. Jen už asi nebude tak velký.

Pokud se týče tvorby webových dokumentů, „passage indexing/ranking“ znamená lepší porozumění a zpracování dílčího obsahu u obsáhlejších textů. Oslabí se tak motivace členit je do tematických celků rozdělených na samostatné stránky (typický příklad mohou být stránky FAQ). Kromě jiných výhod se ukázalo, že rozsáhlejší webové příspěvky mají tendenci získat větší počet zpětných odkazů než ty kratší. A zpětné odkazy, to je další další faktor, který nahrává SEO.

ICTrocenka


Čtěte také v sérii „SEO v roce 2021“:

» Jak na Core Web Vitals

Zajímají vás informační technologie a chcete získat nadhled?

Odebírejte náš Newsletter, který posíláme zpravidla dvakrát do měsíce a který obsahuje výběr unikátních článků nejen našich autorů, ale také ze sítě mezinárodního vydavatelství IDG.

» Přihlaste se zdarma! [Odběr můžete kdykoli zrušit]

Byl pro vás článek přínosný?