logo najdou.cz

Jak na SEO v éře strojového učení

V době algoritmu RankBrain musíte mít responzivní web popsaný pomocí strukturovaných dat, který mobilní zařízení načte do 2 sekund. Měli byste spolupracovat s copywriterem, pečlivě naslouchat SEO specialistovi a neuškodí ani video střižna připravená chrlit každý den video požadované délky i šířky pro sociální sítě. Nechcete být přece druzí.

čtení zabere asi 20 minut

Umělá inteligence bude letos chytřejší

Umělá inteligence začíná zajímat širokou veřejnost. Ke skutečné umělé inteligenci ovšem máme ještě daleko, v posledních letech ale došlo k velkému rozvoji strojového učení (Machine Learning) i jeho podoblasti hlubokého učení (Deep Learning) pro zjednodušení často jako umělá inteligence označované. Jsou to vlastně algoritmy, které rozumí textu, umí rozpoznávat obrázky a rychle zpracovávají velké objemy dat. Lidé zjišťují, čím se strojové učení liší od statistiky nebo o čem vlastně umělá inteligence je. Abychom pochopili, jak Google používá svoji umělou inteligenci, musíme se vrátit podobně jako jedna z postav filmu Terminátor o několik let nazpátek.

Tým Google Brain se od roku 2011 orientuje právě na výzkum strojového učení a hlubokého učení. Získané poznatky aplikuje na umělou inteligenci vytvořenou buď přímo programátory, nebo nově samotnými stroji. V obsáhlém článku o směřování týmu Google Brain pod jeho vedoucími jako je Jeff Dean nebo průkopník hlubokého učení Geoffrey Hinton se zmiňuje také náš rodák Tomáš Mikolov (nyní působí ve Facebook AI Research), který dříve v týmu Google Brain pracoval na open source knihovně word2vec schopné zjistit význam slov.

V roce 2013 Google Brain oznámil, že pomocí strojového učení přiřazuje slova k matematickým entitám zvaným vektory a hledá mezi nimi souvislosti. Je tak nezávislý na klíčových slovech a dokáže relevanci stránky hodnotit i podle jiných kritérií. Na obrázku je vidět, jak díky word2vec chápe koncept hlavních měst, tedy že Paříž a Francie mají stejný vztah jako Berlín a Německo a to čtením většího množství textů bez lidského dohledu.

word2vec hlavní města
word2vec umí zachytit podobnosti mezi koncepty zdroj Google

V bilancování roku 2017 zmínil tým Google Brain AutoML - systém AutoML je schopný navrhnout další umělou inteligenci. Využívá k tomu evolučních algoritmů, simuluje tedy v podstatě přirozený výběr. Na základě splněných úkolů umí své „potomky“ přeprogramovat tak, aby byli stále lepší.

Cílem strojového učení je vyvinutí takových algoritmů, které se budou samy učit a vylepšovat na základě předchozích zkušeností.

Open source knihovna TensorFlow je dalším projektem týmu Google Brain. V rámci služby GitHub určené pro webhosting open source projektů ji využívá obrovské množství uživatelů. Byl také spuštěn open source projekt deeplearn.js což je JavaScript knihovna běžící přímo ve vašem prohlížeči usnadňující aplikovat hluboké učení.

Umělá inteligence Google Brain — RankBrain

Google několik let používal systém Sybil schopný strojové učení používat k identifikaci spamu v Gmailu nebo doporučování filmů na YouTube podle předchozího zájmu uživatele. Na základě získaných zkušeností ze Sibyl vznikl v říjnu 2015 RankBrain. Systém umělé inteligence RankBrain slouží vyhledávači Google k získávání relevantních výsledků. RankBrain z pohledu SEO popsal Bill Slawski, uznávaný odborník na patenty Google a sémantický web. Díky schopnosti se učit se RankBrain neustále vylepšuje. RankBrain prošel celou sérií aktualizací s celkovým názvem Fred. Není to nic neobvyklého, Google svůj algoritmus aktualizuje více než 600 x za rok. Podle studie německé SEO společnosti Sistrix byl Fred zaměřený především proti nekvalitnímu obsahu. Taková analýza webů je ovšem velmi náročná na hardware, tým Google Brain proto pro RankBrain vyvinul výpočetní jednotku TPU.

TPU urychluje strojové učení

Nová výpočetní jednotka TPU umožňuje až třicetkrát rychlejší strojové učení a její spotřeba energie je až osmdesátkrát nižší než u tradičních procesorů. Kromě samotného vyhledávání textového obsahu pomáhá TPU třeba zpracovávat dotazy zaměřené na obrázky v Google Photos. Stejné rozpoznávání objektů založené na strojovém učení lze použít při hledání 3D modelů.

Jedním z důvodů vývoje nové jednotky TPU bylo i neustálé vylepšování systému RankBrain.

Druhá generace TPU tedy TPU2 se označuje jako Cloud TPUs a je více orientovaná na strojové učení. TPU2 se dají zapojit za sebou podobně jako se to dělá se servery. Mimo jiné usnadní lokalizace služby Google Assistant do dalších jazyků.

Umělá inteligence velkých firem

Na špičce pomyslného žebříčku vývojářů stojí kromě Googlu také týmy Facebooku, Microsoftu, Amazonu, Adobe nebo čínského vyhledávače Baidu. Google má nyní kapacitu strojového učení na rozdávání, nebo minimálně pronajímání. Facebook prostřednictvím FAIR zpřístupnil svůj systém rozpoznávání objektů Detectron. Umělá inteligence Microsoftu si pro změnu přečte dokument a poté dokáže odpovídat stejně jako člověk. Amazon najímá špičkové lékaře a pomocí strojového učení (mimochodem Jeff Bezos začal ve svém impériu používat strojové učení někdy ve druhé polovině devadesátých let) zkouší předpovídat onemocnění. Umělá inteligence Adobe pod označením Adobe Sensei zjednodušuje některé procesy ve firemních produktech.

Umělá inteligence AlphaGO britské společnosti DeepMind porazila jednoho z nejlepších hráčů hry GO. Předtím se tato umělá inteligence naučila miliony tahů, nějakou dobu hrála sama se sebou a vždy vyhrála. Následně Google koupil DeepMind za 500 miliónů dolarů. Ovšem jak správně poznamenal jeden ze zakladatelů DeepMind Demis Hassabis, ke skutečné inteligenci se jejich algoritmus ještě nepřiblížil.

Pořád máme daleko ke stroji, který by dokázal flexibilně vykonávat plný rozsah intelektuálních úkonů jako člověk, což je známkou skutečné inteligence.Demis Hassabis (@demishassabis)

Dalším zajímavým příkladem je třeba Chicisimo. Od chvíle, kdy nasadili na módu strojové učení (nyní pod značkou Fashion Taste API) se začalo firmě dařit, i když cesta k uspokojení milionů žen nebyla jednoduchá.

Sdílení poznatků o umělé inteligenci

Vědci z Google Brain si samozřejmě chtějí udržet své vedoucí postavení na poli umělé inteligence, ale jenom díky spolupráci a podpoře dalších firem a programátorů se bude obor zlepšovat. Proto uvolnili do oběhu obrovské balíky volně použitelných dat, například YouTube 8M.

Ve spolupráci s neziskovou organizací Open AI, YC Research a společností DeepMind byl spuštěn interaktivní časopis Distill zaměřený na novinky ze světa strojového učení. Cílem časopisu Distill je pomocí vizualizačních nástrojů zvýšit pochopení principů umělé inteligence. Za zmínku stojí například článek s názvem O zvyšování lidské inteligence. Dalším místem pro sdílení poznatků je Google UX community, kde si můžete mimo jiné přečíst vynikající The UX of AI. Zajímavý newsletter na téma umělé inteligence připravuje Nathan Benaich.

Na téma role umělá inteligence ve společnosti se už u nás pořádají konference. V březnu v Praze proběhnou hned dvě akce zaměřené na umělou inteligenci a strojové učení. Během New media inspiration 2018 vystoupí například zmíněný Tomáš Mikolov a v pražském Rudolfinu se bude opět konat Machine Learning Prague - největší konference o strojovém učení v Evropě. Ale zpátky k SEO.

Kam do obsahu umístit klíčová slova

Ve svých publikacích o strojovém učení popsal O'Reilly, jakým způsobem se zjišťuje relevance stránky: Když se uživatel krátce po kliknutí vrátí zpátky na seznam výsledků vyhledávání, znamená to, že stránka pro něj neměla dostatečně přínosný obsah. Pokud se uživatel zdrží třeba u stránky na páté pozici mnohem déle než u stránky na první pozici, je jasné, že stránka z páté pozice je zajímavější. U malého množství lidí to ještě nic neznamená, ale podobné chování několika tisíc uživatelů je pro Google znamení, že bude lepší algoritmus vyhledávání upravit.

Tradiční postup zaměřený na klíčová slova se pomalu přesouvá k problematice, jak dokáže stránka vyhovět uživateli.

I v současné době algoritmu RankBrain schopného se zdokonalovat tedy stále platí dvě věci:

  1. Kolik lidí kliká na váš výsledek vyhledávání
  2. Jak dlouho se někdo zdrží na stránce

Někdy bylo uváděno, že kritérií podle kterých se hodnotí relevance stránky, je asi dvě stě. Ve skutečnosti jsou jich tisíce. Dříve pracovníci Google pro úpravu výsledků vyhledávání dělali různé změny v algoritmu vyhledávače. Vyzkoušeli je na skupině dotazů, a když byly výsledky lepší, úprava se nasadila do ostrého provozu, kde spokojeně fungovala. V éře strojového učení se nejdříve vytvoří hypotéza, pro kterou se shromáždí množina vhodných dat, a ta se následně aplikuje. Tento cyklus se potom sám opakuje tak dlouho, dokud nevrací žádané výsledky.

Ještě nedávno měla klíčová slova umístěná na správná místa následující vliv:

graf on-page seo klíčová slova
vliv použití klíčového slova na on-page SEO data ahrefs.com

To se pomalu mění a váhu má celkově zpracovaný obsah.

Vliv meta descriptions na zvýšení návštěvnosti

Většina stránek má meta descriptions dlouhé 160 znaků. Od prosince 2017 je nově povolená maximální délka pro meta descriptions 320 znaků. Možná se ptáte, zda má smysl si je prodloužit. Rozhodně to zkuste alespoň u stránek s nějakou návštěvností a můžete sledovat, jestli se vám ještě zvýší.

Kolik procent lidí klikne na vaše výsledky ve vyhledávání, nejlépe ovlivníte dobře napsaným titulkem a meta description každé stránky.

Pomocí Google Search Console takové stránky snadno vyhledáte. Zvolte Průměrná míra prokliku a Průměrná pozice. Dále pod grafem zvolte stránky, kde si vyberte ty s nízkým Click through rate, které jsou zároveň na první straně vyhledávání. Právě na stránky s nízkým CTR se zaměřte.

Search Console Průměrná míra prokliku a pozice
Průměrná míra prokliku a Průměrná pozice v GSC

Jestli se chcete jenom podívat jaké meta description stránka obsahuje, použijte jiný nástroj ukazující aktuální znění meta description. Stačí do políčka URL zadat vaši stránku a kliknout na Get Data. Zobrazí se vám současné znění. Napravo pod Description Length si nastavte požadovanou délku a můžete si zkoušet doplnit text podle potřeby.

  • Pište o tom, co je skutečně na stránce
  • Nevkládejte jenom klíčová slova, trochu se rozepište
  • Nekopírujte text ze stránky, zkuste ho přeformulovat
  • Zkuste to nejdůležitěiší mít v prvních 120 znacích
  • Nepoužívejte stejný popis pro mnoho stránek

Nezapomeňte obratnou formulací uživatele přimět ke zvýšení míry prokliku. Tvorbu delších meta descriptions si brzo zamilujete. Každý se tak může na chvíli stát copywriterem, při vkládání delších popisků také webmasterem.

POZOR AKTUALIZACE Google zkouší návrat ke kratší verzi. Momentálně je pro Meta Descriptions ideální délka 160 - 180 znaků a miliony lidí co napsali delší Meta Descriptions, je můžou zase zkracovat.

Další možnosti Search Console

Nová verze Search Console je optimalizovaná pro mobilní zařízení. Search Console kromě toho nabízí lepší možnosti meziročního srovnání, uchovává data skvělých 16 měsíců. Nyní můžete:

  • Zvolit přesná rozpětí dat
  • Porovnávat zvolená období
  • Porovnávat typy zařízení
porovnání datumů v Google Search Console
Možnost volby přesných rozpětí datumů v GSC
Google Search Console
Porovnání dvou čtvrtletí v GSC

Google Search Console umí nejen ukázat stránky vašeho webu chybějící v indexu, ale i důvod jejich absence. Zahrnutí do indexu obsahuje více detailů. URL obsažené v části Zahrnutí do indexu jsou nyní rozděleny do čtyř částí:

  • Chyba
  • Platné s upozorněním
  • Platné
  • Vyloučeno

V každé části naleznete seznam URL s limitem 1000 řádků, což je pro dlouhodobě fungující web s bohatou historií poměrně málo. Přesto je to pro zájemce o jednoduchou analýzu webu přínos.

Search Console chyby v indexu
GSC zobrazí počet stránek v indexu i vyloučené stránky

Report můžete nasdílet komukoli, kdo má Gmail a nemusí mít nastavený přístup do Search Console.

SEO se posouvá k obsahovému marketingu

Ujistěte se, že všechny vaše příspěvky mají v sobě alespoň jeden vizuální prvek – i když je to jenom fotka toho, co zrovna ve firmě děláte. Kvalitní webový copywriting bude stále důležitou součástí obsahového marketingu. Samotný textový obsah plný klíčových slov dnes už nestačí a v době chytrého algoritmu RankBrain už moc nepomáhá ani dříve používaná tajná zbraň na rozhraní SEO a copywritingu, metodika hodnocení relevance textu pomocí textové analýzy TF-IDF.

Udržet uživatele na stránce pomáhá obsahový marketing.

Při budování vaší značky má před sebou velkou budoucnost především video, které udrží návštěvníky na webu déle. Google to vnímá jako pozitivní uživatelský zážitek, což napomáhá dobré pozici, jak vysvětluje starší, ale stále dobrý článek o vlivu chování lidí na hodnocení vyhledávače Návštěvník má také příležitost se pomocí videa více ztotožnit s vaší značkou. Analytik Gary Illyes prozradil, že Google zmínky o značce sleduje a dává tomu váhu ve svém vyhledávacím algoritmu.

SEO je stále více technické

Se stoupajcími nároky na rychlost načítání v mobilních zařízeních je kladen větší důraz na technické SEO. Rychleji načtený web navíc vyhledávače lépe indexují. Třeba takový JavaScript pro vykreslování obrázků je skvělý, když máte šikovné programátory. Jinak vám může zpomalovat web nebo se kvůli němu Google nedozví, co vlastně máte na obrázku.

SEO na jednu stranu znamená obsahový marketing, je ale také stále více technické.

Technické SEO častěji při analýze webu používá analýzu logů, která ukáže, co dělá crawler navštěvující stránky. Určitě se s analýzou logů seznamte, objevíte díky ní řadu chyb nebo anomálií, které by jinak unikly pozornosti. Pomocí zevrubné analýzy logu můžete například zlepšit svůj crawl budget určující počet stránek, které vyhledávač za den prohledá. Když robot narazí na chybu, zbytečně plýtváte jeho kapacitou a některé stránky potom vynechá. Nejčastější příčiny chyb jsou:

  • Nefungující odkazy
  • Vícenásobná přesměrování
  • Duplicitní obsah
  • Dlouhá doba načítání stránek
  • Nefungující URL v XML sitemap
  • Příliš scriptů - JavaScript nebo CSS
  • Mnoho neindexovatelných stránek

Určitý obraz o svém crawl budgetu poskytuje také Google Search Console. Kombinováním dat logu a dalších zdrojů, jako je Search Console, lze získat mnohem jasnější obraz o chování uživatelů. Specialisté na SEO služby se zaměřením na technickou analýzu webu dosud takové porovnání dělali napůl ručně. Postupně můžeme očekávat automatizaci analýzy logů v běžně užívaných analytických řešeních.

Rychlost jako hodnotící faktor v SEO

Další oblastí, kterou se technické SEO zabývá je rychlost. Uživatelé dávají přednost rychle se načítajícím stránkám. Podle testů Pingdom je průměrná rychlost načtení webové stránky 3,21 sekundy, ideálně by se měla načíst do 2 sekund. To je totiž doba, jakou jsou uživatelé ochotni čekat.

Google dává mobilní verzi přednost a doporučuje responzivní design.

Google oznámil, že od července 2018 bude rychlost hodnoticím faktorem pro mobilní weby. Každý si může vyzkoušet, jak je stránka optimalizovaná pro mobily. Rychlost načítání na síti 3G si orientačně můžete ověřit pomocí TestMySite kde se také dozvíte, kolik návštěvníků během pomalejšího načítání ztratíte.

Jednoduchá analýza webu pomocí Lighthouse

Ve stejném příspěvku také radí používat automatizovanou pomůcku Lighthouse sloužící k jednoduché analýze webu. V anglickém Erudite byla úspešně provedena analýza 700 webů pomocí Lighthouse. Lighthouse umí nejen přístupnost, kompatibilitu s PWA a další drobnosti. S pomocí Lighthouse zkontrolujete hlavně výkon, který je důležitý pro rychlost webu.

lighthouse-vykresleni-webu lighthouse výkon webu
parametry vykreslení důležité pro rychlost webu

V oddílu SEO současná verze Lighthouse sleduje pouze několik základních pravidel, nejde tedy o žádnou revoluci. Podívá se, jak je nastavený viewport pro mobilní zařízení, jestli nemáte příliš malé písmo (častá chyba), dále zkontroluje několik prvků v HTML struktuře. Test mobilní přístupnosti a strukturovaná data si už musíte zkontrolovat sami.

lighthouse audit seo
SEO analýza lighthouse

Právě stukturovaná data schopná zlepšit viditelnost webu v rozšířených výsledcích vyhledávání můžeme také zařadit mezi technické SEO. Strukturovaná data ve formátu JSON-LD jsou pro vyhledávače doporučená a Google Assistant nyní strukturovaná data lépe chápe, což usnadní přicházející hlasové vyhledávání.

Hlasové ovládání na vzestupu

Microsoft Cortana, Apple Siri nebo hlasové vyhledávání Google přinesly hlasové ovládání, ještě než Amazon vytvořil Amazon Echo, Amazon Alexa nebo Google vydal Google Home. Zatím se nejedná o plnohodnotné hlasové vyhledávání, většina povelů pro hlasové ovládání se soustředí na několik základních témat:

  • Přehrávání hudby
  • Jaké bude počasí
  • Volání (jméno uloženého kontaktu)
  • Vše ohledně času (stopky, budík, kolik je hodin)

Hlasové povely neustále přibývají. Určitě znáte někoho, kdo už takový chytrý reproduktor má doma a místo, aby si jednoduše pustil písničku, raději ho chvíli přemlouvá.

Google Asssistant
dej si pauzu

Google byl průkopníkem hlasového ovládání již telefonem Moto X, který reagoval na klíčové slovo. Mimochodem funkce rozpoznání písničky Now Playing v telefonu Pixel 2 používá hluboké učení.

Apple po pěti letech vývoje nabídnul bezdrátové inteligentní reproduktory HomePod. Chce se tak odlišit od produktů jako Amazon Echo či Google Home, které nejsou primárně určené pro poslech hudby, nýbrž na ovládání hlasového asistenta a plnění úkolů. HomePod je orientovaný směrem ke kvalitní reprodukci, proto má kromě basového reproduktoru ještě sedm menších reproduktorů, každý s vlastním zesilovačem.

HomePod v sobě integruje schopnosti Siri, zároveň ale útočí na bezdrátové reproduktory vyráběné například firmou Sonos.

HomePod se dokáže s druhým HomePodem propojit a upravit podle toho svoje akustické vlastnosti. Společně zapojené HomePody ale nebudou chytřejší, leda po aktualizaci firmware. Způsobem, jakým reagují na otázky, a tím, že nenabízejí seznam dalších odkazů, jsou hlasoví asistenti mnohem bližší Chatbotům.

Chatbot pomůže s výběrem bot

Chatboti se letos určitě dostanou do popředí zájmu. Pomůžou vám objednat zboží nebo jim můžete pokládat otázky. Inteligentní Chatbot umí předpřipravit zákazníkem vyplněné formuláře a ještě inteligentnější Chatbot si umí ve firmě vyžádat chybějící údaje. Výhody nasazení Chatbota jsou zřejmé:

  • Chatbot reaguje okamžitě
  • Kontrola nad obsahem odpovědí
  • Zvýšení spokojenosti a retence zákazníků
  • Chatbot se dá nasadit globálně

Zajímavý Chatbot jménem Michal je na webu věnovanému GDPR, nové legislativy EU pro zvýšení ochrany osobních dat občanů. Michal běží díky platformě IBM Watson a snaží se, co mu jeho robotické síly stačí odpovídat na otázky ohledně GDPR. Kdyby něco nevěděl, zjistí vám to do 3 pracovních dní. Chatbot nemusí být jenom technicky zaměřený. Woebot, jehož tvůrcem je psycholožka Alison Darcy ze Stanfordu umí zvednout náladu.

Moji tvůrci mě naučili, že vždy můžeme být otevřenější, soucitnější a víc spolu mluvit! Woebot (@HiWoebot)

Woebot nejdříve obýval Facebook Messenger, uživatelům se ale nelíbilo že Facebook znal jejich trable, proto vznikl také ve formě aplikace.

Kam tedy SEO směřuje?

Je tu dlouho očekávaný Mobile First Index se svými nároky na rychlost webu, strukturovaná data usnadňující nejen pochopení obsahu vyhledávači, ale také celkový kontext a pořádná porce obsahového marketingu se postupně spojují a stanou se novým standardem při vyhledávání.

Budoucnost SEO je porozumět tomu, co lidé chtějí, a dát jim to.

SEO následujících let přinese úplně nový způsob, jak budou lidé pomocí vyhledávače získávat výsledky a dále s nimi pracovat.

Tipy pro zlepšení webu

Zajímá vás, co můžete v tuto chvíli udělat se svým webem? Vyhledávače ocení sémanticky správně zapsaný kód jazyka HTML5. Umožní jim odlišit obsah od navigace a zaměřit se na to, co je důležité. HTML5 umí také lépe používat obrázky a videa. A nepodceňujte UX, použitelnost je součást marketingu. Pro technicky zdatné následují snadno použitelné tipy pro zlepšení webu:

  • Zkontrolujte hodnocení PageSpeed Insights a zlepšete ho
  • Zapněte kompresi GZIP nebo novější BROTLI
  • Zkomprimujte obrázky
  • Minimalizujte HTTP requesty, minifikujte CSS a JavaScript
  • Odstraňte zbytečné redirecty
  • JavaScript dejte v kódu dolů, zrychlí to vykreslení stránky
  • Využijte ukládání do mezipaměti prohlížeče
  • Používejte strukturovaná data všude, kde to jde
  • Vyvarujte se vyskakovacích oken
  • Neblokujte robotům obrázky, CSS nebo JavaScript
  • Přidejte alespoň jedno video

Optimalizujte obsah pro mobilní zařízení a připravte zajímavé texty, obrázky s vyplněnými alty a videa v obvyklých indexovatelných formátech. Kdo to neudělá, může si ve výsledcích vyhledávání prohlížet stránky konkurence. Šťastnou optimalizaci!

aktualizace 17. září 2019