logo najdou.cz

Jak na SEO v éře strojového učení

V současné době musíte mít responzivní web popsaný pomocí strukturovaných dat, který mobilní zařízení načte do 2 sekund. Měli byste spolupracovat s copywriterem, pečlivě naslouchat SEO specialistovi a neuškodí ani video střižna připravená chrlit každý den video požadované délky i šířky pro sociální sítě. Nechcete být přece druzí.

Čtení zabere přibližně 20 minut.

Umělá inteligence bude letos chytřejší

Umělá inteligence začíná zajímat širokou veřejnost. Ke skutečné umělé inteligenci ovšem máme ještě daleko, v posledních letech ale došlo k velkému rozvoji strojového učení (Machine Learning) i jeho podoblasti hlubokého učení (Deep Learning) pro zjednodušení často jako umělá inteligence označované. Jsou to vlastně algoritmy, které rozumí textu, umí rozpoznávat obrázky a rychle zpracovávají velké objemy dat. Lidé zjišťují čím se strojové učení liší od statistiky nebo o čem vlastně umělá inteligence je. Obrázek vydá za tisíc slov, podívejte se na strojové učení vizuálně

Tým Google Brain se od roku 2011 orientuje právě na výzkum strojového učení a hlubokého učení. Získané poznatky aplikuje na umělou inteligenci vytvořenou buď přímo programátory, nebo nově samotnými stroji. V obsáhlém článku o směřování týmu Google Brain pod jeho vedoucími jako je Jeff Dean nebo průkopník hlubokého učení Geoffrey Hinton se zmiňuje také náš rodák Tomáš Mikolov (nyní působí ve Facebook AI Research), který dříve v týmu Google Brain pracoval na open source knihovně word2vec schopné zjistit význam slov. V roce 2013 Google oznámil, že pomocí strojového učení přiřazuje slova k matematickým entitám zvaným vektory a hledá mezi nimi souvislosti. Je tak nezávislý na klíčových slovech a dokáže relevanci stránky hodnotit i podle jiných kritérií. Na obrázku je vidět, jak díky word2vec chápe koncept hlavních měst, tedy že Paříž a Francie mají stejný vztah jako Berlín a Německo a to čtením většího množství textů bez lidského dohledu.

word2vec hlavní města

word2vec umí zachytit podobnosti mezi koncepty (zdroj: Google)

V bilancování roku 2017 tým Google Brain zmiňuje představení systému AutoML schopného navrhnout další umělou inteligenci. Využívá k tomu evolučních algoritmů, simuluje tedy v podstatě přirozený výběr. Na základě splněných úkolů umí své „potomky“ přeprogramovat tak, aby byli stále lepší.

Cílem strojového učení je vyvinutí takových algoritmů, které se budou samy učit a vylepšovat na základě předchozích zkušeností.

Open source knihovna TensorFlow je dalším projektem týmu Google Brain. V rámci služby GitHub určené pro webhosting open source projektů ji využívá obrovské množství uživatelů. Byl také spuštěn open source projekt deeplearn.js což je JavaScript knihovna běžící přímo ve vašem prohlížeči usnadňující aplikovat hluboké učení.

Umělá inteligence Google — RankBrain

Google několik let používal systém Sybil schopný strojové učení používat k identifikaci spamu v Gmailu nebo doporučování filmů na YouTube podle předchozího zájmu uživatele. Na základě získaných zkušeností se Sibyl vznikl v říjnu 2015 RankBrain. Systém umělé inteligence RankBrain slouží vyhledávači Google k získávání relevantních výsledků. RankBrain z pohledu SEO popsal Bll Slawski, uznávaný odborník na patenty Google a sémantický web. Díky schopnosti se učit se RankBrain neustále vylepšuje. RankBrain prošel celou sérií aktualizací s celkovým názvem Fred. Není to nic neobvyklého, Google svůj algoritmus aktualizuje více 600 x za rok. Podle studie německé SEO společnosti Sistrix byl Fred zaměřený především proti nekvalitnímu obsahu. Taková analýza webů je ovšem velmi náročná na hardware, tým Google Brain proto vyvinul výpočetní jednotku TPU.

TPU urychluje strojové učení

Nová výpočetní jednotka TPU umožňuje až třicetkrát rychlejší strojové učení a její spotřeba energie je až osmdesátkrát nižší než u tradičních procesorů. Kromě samotného vyhledávání textového obsahu pomáhá TPU třeba zpracovávat dotazy zaměřené na obrázky v Google Photos. Stejné rozpoznávání objektů založené na strojovém učení lze použít při hledání 3D modelů.

Jedním z důvodů vývoje nové jednotky TPU bylo i neustálé vylepšování systému RankBrain.

Druhá generace TPU tedy TPU2 se označuje jako Cloud TPUs a je více orientovaná na strojové učení. TPU2 se dají zapojit za sebou podobně jako se to dělá se servery. Mimo jiné usnadní lokalizace služby Google Assistant do mnoha světových jazyků, je tedy možné, že zanedlouho budeme moci díky Google Assistant počítačům nebo chytrým telefonům zadávat příkazy i v češtině.

Umělá inteligence velkých firem

Na špičce pomyslného žebříčku vývojářů stojí kromě Googlu také týmy Facebooku, Microsoftu, Amazonu, Adobe nebo čínského vyhledávače Baidu. Google má nyní kapacitu strojového učení na rozdávání, nebo minimálně pronajímání. Facebook prostřednictvím FAIR zpřístupnil svůj systém rozpoznávání objektů Detectron. Umělá inteligence Microsoftu si pro změnu přečte dokument a dokáže odpovídat stejně jako člověk. Amazon najímá špičkové lékaře a pomocí strojového učení (mimochodem Jeff Bezos začal ve svém impériu používat strojové učení někdy ve druhé polovině devadesátých let) zkouší předpovídat onemocnění. Umělá inteligence Adobe pod označením Adobe Sensei zjednodušuje některé procesy ve firemních produktech.

Dalším zajímavým příkladem je třeba Chicisimo. Od chvíle, kdy nasadili strojové učení v Chicisimo se začalo firmě dařit, i když cesta k tomu, jak uspokojit miliony žen nebyla jednoduchá.

Sdílení poznatků o umělé inteligenci

Vědci z Google Brain si samozřejmě chtějí udržet své vedoucí postavení na poli umělé inteligence, ale jenom díky spolupráci a podpoře dalších firem a programátorů se bude obor zlepšovat. Proto uvolnili do oběhu obrovské balíky volně použitelných dat, například YouTube 8M.

Ve spolupráci s neziskovou organizací Open AI, YC Research a společností DeepMind byl spuštěn interaktivní časopis Distill zaměřený na novinky ze světa strojového učení. Cílem časopisu Distill je za pomoci vizualizačních nástrojů zvýšit pochopení principů umělé inteligence. Za zmínku stojí například článek s názvem o zvyšování lidské inteligence. Dalším místem pro sdílení poznatků je Google UX community, kde si můžete mimo jiné přečíst vynikající The UX of AI. Zajímavý newsletter na téma umělé inteligence připravuje Nathan Benaich.

Na téma role umělá inteligence ve společnosti se už u nás pořádají konference. V březnu v Praze proběhnou hned dvě akce zaměřené na umělou inteligenci a strojové učení. Na New media inspiration 2018 vystoupí například zmíněný Tomáš Mikolov a v pražském Rudolfinu se bude opět konat Machine Learning Prague - největší konference o strojovém učení v Evropě. Eurokomisařka Věra Jourová se svým týmem jsou součástí skupiny, která připravuje pravidla co si umělá inteligence může dovolit. Stroj vybavený umělou inteligencí totiž představuje právní problém. Před zákonem jsou rodiče zodpovědné za svoje děti. Problém ovšem nastává u stroje vybaveného umělou inteligencí. Když takový stroj něco provede, kdo je vinen? Jestli uplatníme pro stroj stejná pravidla jako pro lidi, je na vině stroj. Druhá možnost je vinit toho, kdo stroj trénoval. Třetí toho, kdo za stroj odpovídá - ten ale vůbec nemusí vědět, co bylo do stroje vloženo. Ale zpátky k SEO.

Kam do obsahu umístit klíčová slova

Tradiční postup zaměřený na klíčová slova se pomalu přesouvá k problematice, jak dokáže stránka vyhovět uživateli. Ještě nedávno platil tajný recept, podle kterého měla klíčová slova umístěná na správná místa následující vliv:

graf on-page seo klíčová slova

Vliv použití klíčového slova na on-page SEO podle ahrefs.com

Ve svých publikacích o strojovém učení popsal O'Reilly, jakým způsobem se zjišťuje relevance stránky: Když se uživatel krátce po kliknutí vrátí zpátky na seznam výsledků vyhledávání, znamená to, že stránka pro něj neměla dostatečně přínosný obsah. Pokud se uživatel zdrží třeba u stránky na páté pozici mnohem déle než u stránky na první pozici, je jasné, že stránka z páté pozice je zajímavější. U malého množství lidí to ještě nic neznamená, ale podobné chování několika tisíc uživatelů je to pro Google znamení, že bude lepší algoritmus vyhledávání upravit. I v současné době algoritmu RankBrain schopného se zdokonalovat tedy stále platí dvě věci:

  1. Kolik lidí kliká na váš výsledek vyhledávání
  2. Jak dlouho se někdo zdrží na stránce

Občas se uvádělo, že kritérií podle kterých se hodnotí relevance stránky je asi dvěstě, ve skutečnosti jsou jich tisíce. Dříve pracovníci Google pro úpravu výsledků vyhledávání dělali různé změny v algoritmu vyhledávače, vyzkoušeli je na skupině dotazů a když byly výsledky lepší, tak se úprava nasadila do ostrého provozu kde spokojeně fungovala. V éře strojového učení se nejdříve vytvoří hypotéza pro kterou se shromáždí množina vhodných dat, a ta se následně aplikuje. Tento cyklus se potom sám opakuje tak dlouho dokud nevrací žádané výsledky.

Kolik procent lidí klikne na vaše výsledky ve vyhledávání nejlépe ovlivníte dobře napsaným titulkem a meta description každé stránky.

Většina stránek má meta descriptions dlouhé 160 znaků. Od prosince 2017 je nově povolená maximální délka pro meta descriptions 320 znaků. Možná se ptáte, zda má smysl si je prodloužit. Rozhodně to zkuste alespoň u stránek s nějakou návštěvností a můžete sledovat, jestli se vám ještě zvýší. Pomocí Google Search Console takové stránky snadno vyhledáte. Zvolte Průměrná míra prokliku a Průměrná pozice. Dále pod grafem zvolte stránky kde si vyberte stránky s nízkým CTR, které jsou zároveň na první straně vyhledávání. Na ty se zaměřte.

Search Console Průměrná míra prokliku a pozice

Průměrná míra prokliku a Průměrná pozice v Google Search Console

Jestli se chcete jenom podívat jaké meta description stránka obsahuje, použijte jiný nástroj ukazující aktuální znění meta description. Stačí do políčka URL zadat vaši stránku a kliknout na Get Data. Zobrazí se vám současné znění. Napravo pod Description Length si nastavte požadovanou délku a můžete si zkoušet doplnit text podle potřeby.

  • Pište o tom, co je skutečně na stránce
  • Nevkládejte jenom klíčová slova, trochu se rozepište
  • Nekopírujte text ze stránky, zkuste ho přeformulovat
  • Zkuste to nejdůležitěiší mít v prvních 120 znacích
  • Nepoužívejte stejný popis pro mnoho stránek

Nezapomeňte obratnou formulací uživatele přimět ke zvýšení míry prokliku. Tvorbu delších meta descriptions si brzo zamilujete. Každý se tak může na chvíli stát copywriterem, při vkládání delších popisků také webmasterem.

POZOR AKTUALIZACE od května 2018 zkouší Google návrat ke kratší verzi. Momentálně je pro Meta Descriptions ideální délka 160 - 180 znaků a miliony lidí co napsali delší Meta Descriptions je můžou zase zkracovat.

Další možnosti Search Console

Nová verze Search Console je optimalizovaná pro mobilní zařízení. Search Console také nabízí lepší možnosti meziročního srovnání, uchovává data skvělých 16 měsíců. Nyní můžete:

  • Zvolit přesná rozpětí datumů
  • Porovnávat zvolená období
  • Porovnávat typy zařízení
porovnání datumů v Google Search Console

Možnost volby přesných rozpětí datumů v Google Search Console

Google Search Console

Porovnání dvou čtvrtletí v Google Search Console

Google Search Console umí nejen ukázat stránky vašeho webu chybějící v indexu, ale též důvod jejich absence. Zahrnutí do indexu obsahuje více detailů. URL obsažené v části Zahrnutí do indexu jsou nyní rozděleny do čtyř částí:

  • Chyba
  • Platné s upozorněním
  • Platné
  • Vyloučeno

V každé části naleznete seznam URL s limitem 1000 řádků, což je pro dlouhodobě fungující web s bohatou historií poměrně málo. Přesto je to pro zájemce o jednoduchou analýzu webu přínos. Report můžete nasdílet komukoli, kdo má Gmail a nemusí mít nastavený přístup do Search Console.

Search Console chyby v indexu

SEO se posouvá k obsahovému marketingu

Vizuální obsah, jako jsou obrázky a videa, je mnohem zábavnější než písemný obsah, protože vyžaduje méně pozornosti pro pochopení. Každá marketingová strategie tak nejenom že musí být postavená na analytických datech, ale musí počítat s poutavým multimediálním obsahem.

Ujistěte se, že všechny vaše příspěvky mají v sobě alespoň jeden vizuální prvek – i když je to jenom fotka toho, co zrovna ve firmě děláte. Kvalitní webový copywriting bude stále důležitou součástí obsahového marketingu. Samotný textový obsah ale dnes už nestačí.

Udržet uživatele na stránce pomáhá obsahový marketing.

Při budování vaší značky má před sebou velkou budoucnost především video, keré udrží návštěvníky na webu déle. Google to vnímá jako pozitivní uživatelský zážitek, což napomáhá dobré pozici jak píše starší ale stále dobrý článek o vlivu chování lidí na hodnocení vyhledávače Návštěvník má také příležitost se pomocí videa více ztotožnit s vaší značkou. Analytik Gary Illyes prozradil, že Google sleduje zmínky o vaší značce a dává tomu váhu ve svém vyhledávacím algoritmu.

SEO je stále více technické

Se stoupajcími nároky na rychlost načítání na mobilních zařízeních je větší důraz na technické SEO. Rychleji načtený web také vyhledávače lépe indexují. Třeba takový JavaScript je skvělý, když máte šikovné programátory. Jinak vám může zpomalovat web nebo se kvůli němu Google nedozví, co vlastně máte na obrázku, pokud ho vykreslujete přes JavaScript.

SEO na jednu stranu znamená obsahový marketing, je ale také stále více technické.

Technické SEO také čím dál častěji při analýze webu používá analýzu logů, která ukáže co dělá crawler navštěvující stránky. Určitě se s analýzou logů seznamte, objevíte díky ní řadu chyb nebo anomálií, které by jinak unikly pozornosti. Pomocí zevrubné analýzy logu můžete například zlepšit svůj crawl budget určující počet stránek, které vyhledávač za den prohledá. Když robot narazí na chybu, zbytečně plýtváte jeho kapacitou a některé stránky potom vynechá. Nejčastější příčiny chyb jsou:

  • Nefungující odkazy
  • Vícenásobná přesměrování
  • Duplicitní obsah
  • Dlouhá doba načítání stránek
  • Nefungující URL v XML sitemap
  • Příliš scriptů - JavaScript nebo CSS
  • Mnoho neindexovatelných stránek

Určitý obraz o svém crawl budgetu poskytuje také Google Search Console. Kombinováním dat logu a dalších zdrojů jako je Google Analytics nebo Search Console lze získat mnohem jasnější obraz o chování uživatelů. Specialisté na SEO služby se zaměřením na technickou analýzu webu dosud takové porovnání dělali napůl ručně. Postupně se dá čekat automatizace analýzy logů v běžně užívaných analytických řešeních.

Rychlost jako hodnotící faktor v SEO

Další oblastí kterou se technické SEO zabývá je rychlost. Uživatelé dávají přednost rychle se načítajícím stránkám. Podle testů Pingdom se webová stránka načte průměrně za 3,21 sekundy, ideálně by se měla načíst do 2 sekund. To je totiž doba, jakou jsou uživatelé ochotni čekat.

Google oznámil, že od července 2018 bude rychlost hodnoticím faktorem pro mobilní weby. Každý si může vyzkoušet, jak je stránka optimalizovaná pro mobily. Rychlost načítání na síti 3G si orientačně můžete ověřit pomocí TestMySite kde se také dozvíte, kolik návštěvníků během pomalejšího načítání ztratíte.

Google dává mobilní verzi přednost a doporučuje responzivní design.

Ve stejném příspěvku také radí používat automatizovanou pomůcku Lighthouse sloužící k jednoduché analýze webu. Z hlediska SEO v současné verzi Lighthouse kontroluje pouze několik základních pravidel, nejde tedy o žádnou revoluci. S pomocí Lighthouse zkontrolujete také výkon, přístupnost, kompatibilitu s Progressive Web Apps a několik dalších drobností. Lighthouse s úspěchem použili v anglickém Erudite pro kontrolu 700 webů. PWA původně vyvinuté v roce 2015 pro Android přicházejí na iOS a časem možná nahradí mobilní aplikace.

Mezi technické SEO můžeme zařadit také stukturovaná data schopné zlepšit viditelnost webu v rozšířených výsledcích vyhledávání. Google Assistant nyní lépe chápe strukturovaná data což usnadní přicházející hlasové vyhledávání.

Hlasové ovládání na vzestupu

Microsoft Cortana, Apple Siri nebo hlasové vyhledávání Google přinesly hlasové ovládání, ještě než Amazon vytvořil Amazon Echo, Amazon Alexa nebo Google vydal Google Home. Zatím se nejedná o plnohodnotné hlasové vyhledávání, většina povelů pro hlasové ovládání se soustředí na několik základních témat:

  • Přehrávání hudby
  • Jaké bude počasí
  • Volání (jméno uloženého kontaktu)
  • Vše ohledně času (stopky, budík, kolik je hodin)

Hlasové povely neustále přibývají. Určitě znáte někoho, kdo už takový chytrý reproduktor má doma a místo aby si jednoduše pustil písničku, raději ho chvíli přemlouvá.

Google Asssistant

Google byl průkopníkem hlasového ovládání již telefonem Moto X, který reagoval na klíčová slova. Mimochodem funkce rozpoznání písničky Now Playing v telefonu Pixel 2, modelu kterým se Google snaží dokázat že není jenom vyhledávač, ale také značka kvalitních smartphonů, používá hluboké učení.

Apple po pěti letech vývoje nabídnul bezdrátové inteligentní reproduktory HomePod. Chce se tak odlišit od produktů jako Amazon Echo či Google Home, které nejsou primárně určené pro poslech hudby, nýbrž na ovládání hlasového asistenta a plnění úkolů. HomePod je orientovaný směrem ke kvalitní reprodukci, proto má kromě basového reproduktoru ještě sedm menších reproduktorů, každý s vlastním zesilovačem.

HomePod v sobě integruje schopnosti Siri, zároveň ale útočí na bezdrátové reproduktory vyráběné například firmou Sonos.

HomePod se dokáže s druhým HomePodem propojit a upravit podle toho svoje akustické vlastnosti. Společně zapojené HomePody ale nebudou chytřejší, leda po aktualizaci firmware. Způsobem, jakým reagují na otázky, a tím, že nenabízejí seznam dalších odkazů, jsou hlasoví asistenti mnohem bližší Chatbotům.

Chatbot pomůže s výběrem bot

Chatboti se letos určitě dostanou do popředí zájmu. Pomůžou vám objednat zboží nebo jim můžete pokládat otázky. Inteligentní Chatbot umí předpřipravit zákazníkem vyplněné formuláře a ještě inteligentnější Chatbot si umí ve firmě vyžádat chybějící údaje. Výhody nasazení Chatbota jsou zřejmé:

  • Chatbot reaguje okamžitě
  • Kontrola nad obsahem odpovědí
  • Zvýšení spokojenosti a retence zákazníků
  • Chatbot se dá nasadit globálně

Zajímavý Chatbot jménem Michal je na webu věnovanému GDPR, nové legislativy EU pro zvýšení ochrany osobních dat občanů. Michal běží díky platformě IBM Watson a snaží se, co mu jeho robotické síly stačí, odpovídat na otázky ohledně GDPR. Kdyby něco nevěděl, zjistí vám to do 3 pracovních dní. Chatbot nemusí být jenom technicky zaměřený. Woebot jehož tvůrcem je psycholožka Alison Darcy ze Stanfordu umí zvednout náladu.

Moji tvůrci mě naučili, že vždy můžeme být otevřenější, soucitnější a víc spolu mluvit!

Woebot (@HiWoebot) 10. října 2017

Woebot nejdříve obýval Facebook Messenger, uživatelům se ale nelíbilo že Facebook znal jejich trable, proto vznikl také ve formě aplikace. Kdo má nějakého bota v provozu, může si dokonce zaregistrovat vlastní doménu s koncovkou .bot tak neváhejte.

Kam tedy SEO směřuje?

Dlouho očekávaný Mobile First Index se svými nároky na rychlost webu, strukturovaná data usnadňující pochopení obsahu vyhledávači a pořádná porce obsahového marketingu se postupně spojují a stanou se novým standardem při vyhledávání. A nepodceňujte UX, použitelnost je součást marketingu.

Budoucnost SEO je porozumět tomu, co lidé chtějí, a dát jim to.

Pravděpodobně už SEO 2018 a celkem jistě SEO 2019 přinese úplně nový způsob, jak lidé budou získávat výsledky vyhledávání a dále s nimi pracovat. Ptáte se, co můžete v tuto chvíli udělat se svým webem? Zde je 12 snadno použitelných tipů:

12 tipů pro zlepšení webu

  • Zkontrolujte hodnocení PageSpeed Insights a zlepšete ho
  • Zapněte kompresi GZIP
  • Zkomprimujte obrázky
  • Minimalizujte HTTP requesty, minifikujte CSS a JavaScript
  • Používejte CDN
  • Odstraňte zbytečné redirecty
  • JavaScript dejte v kódu dolů, zrychlí to vykreslení stránky
  • Využijte ukládání do mezipaměti prohlížeče pro větší rychlost
  • Používejte strukturovaná data všude, kde to jde
  • Vyvarujte se vyskakovacích oken
  • Neblokujte pro robota obrázky, CSS nebo JavaScript
  • Přidejte alespoň jedno video

Optimalizujte obsah pro mobilní zařízení a připravte zajímavé texty, obrázky s vyplněnými alty a videa v obvyklých indexovatelných formátech. Kdo to neudělá, může si ve výsledcích vyhledávání prohlížet stránky konkurence. Šťastnou optimalizaci v roce 2018!

Autor: Martin Slavíček

Leden 2018