1. Robot se nedostane tam, kam potřebuje: špatná práce s crawl budgetem
U menších webů se crawl budget často neřeší, ale jakmile máte stovky až tisíce URL, je to kritický faktor. Googlebot neprochází web nekonečně; pokud mu server vrací zbytečně mnoho variant stránek, filtrů, parametrů nebo duplicit, utrácí čas na nesmysly místo důležitých URL. Typický problém je e-shop s faceted navigation, kde vzniknou tisíce kombinací třídění, barev a velikostí.
Praktický signál vidíte v Google Search Console v sekci Statistiky procházení. Pokud roste počet procházených URL, ale neindexovaných stránek nebo důležitý obsah mizí z indexu, je potřeba audit. Pomůže také log file analysis v nástrojích jako Screaming Frog Log File Analyser nebo Oncrawl. Z logů zjistíte, zda robot tráví čas na parametrech, nebo naopak zanedbává klíčové landing pages.
- zablokujte nekonečné kombinace parametrů přes robots.txt nebo canonical, ale opatrně – robots.txt neřeší indexaci, jen crawling
- u navigačních filtrů používejte jasnou strategii: co má být indexovatelné, co ne
- důležité URL propojujte interním odkazováním z hlavní navigace, kategorií i obsahových článků
- u velkých webů sledujte poměr discovered vs. indexed v Search Console
2. Duplicitní obsah není jen copy-paste: kanibalizace, parametry a špatné canonicaly
Duplicitní obsah se dnes netýká jen textů převzatých z jiných webů. Častěji vzniká technicky: stejné produkty pod více URL, stránkování, UTM parametry, varianty s a bez lomítka, HTTP/HTTPS, www/non-www nebo tiskové verze. Vyhledávač pak musí rozhodnout, která verze je „ta pravá“, a pokud mu to neulehčíte, rozmělníte autoritu i signály relevance.
Nejčastější chyba je slepé spoléhání na rel=canonical. Canonical je doporučení, ne příkaz. Pokud canonical vede na stránku, která je slabá, blokovaná nebo obsahově neodpovídá, Google ho může ignorovat. Kontrolujte proto nejen zdrojový kód, ale i to, jakou verzi Google skutečně indexuje pomocí operátoru site: a hlavně v URL Inspection v Search Console.
- sjednoťte jednu preferovanou verzi domény a protokolu
- u parametrů zvažte noindex, canonical nebo jejich úplné odstranění z indexace
- stránkování řešte tak, aby každá stránka měla unikátní hodnotu a logickou interní vazbu
- hlídejte kanibalizaci klíčových slov v Ahrefs, Semrush nebo Collabim
3. Struktura webu je pro roboty mapa i past zároveň
Dobrá informační architektura není jen UX téma. Pro SEO je to způsob, jak vyhledávači vysvětlit, které stránky jsou hlavní, které podpůrné a jak spolu souvisejí. Když máte plochý web bez hierarchie, robot sice vše najde, ale nedokáže dobře pochopit tematické celky. Naopak příliš hluboká struktura s pěti a více kliky od homepage často snižuje šanci na rychlou indexaci a posilování důležitých URL.
Užitečný test je vizualizace interního prolinkování. Ve Screaming Frog si nechte zobrazit crawl depth a počet interních odkazů na URL. Důležité stránky by měly být dosažitelné ideálně do 3 kliků a měly by dostávat více interních odkazů než okrajový obsah. Pokud máte topic cluster, hlavní pilířová stránka musí přirozeně odkazovat na podstránky a zpět, ne jen na náhodné články.
- používejte jasné kategorie, podkategorie a obsahové huby
- z hlavních stránek odkazujte na strategické landing pages s anchor textem odpovídajícím tématu
- zbytečně neschovávejte důležitý obsah za filtry, modály nebo JavaScriptové interakce bez fallbacku
- pravidelně kontrolujte orphan pages, tedy stránky bez interních odkazů
4. JavaScript může být skvělý pro UX, ale špatný pro indexaci
Moderní weby postavené na Next.js, Reactu nebo jiných SPA frameworkách nejsou problém samy o sobě. Problém nastává, když je obsah dostupný až po vykreslení na klientovi, nebo když robot nedostane stabilní HTML. Google sice JavaScript umí renderovat, ale proces je pomalejší, náročnější a méně spolehlivý než čisté HTML. U konkurence může rozhodnout i několik dní zpoždění indexace.
Pokud máte podezření na rendering problém, použijte URL Inspection v Search Console a porovnejte „View crawled page“ s finálně vykreslenou stránkou. Ve Screaming Frog zapněte JavaScript rendering a porovnejte rozdíly v title, H1, textu a odkazech. Častý problém: navigace nebo obsah se načte až po interakci uživatele, takže robot nevidí důležité odkazy.
- kritický obsah renderujte server-side nebo staticky
- metadata, canonical, hreflang a structured data generujte do HTML, ne až po načtení skriptem
- u SPA ověřte, že každá URL vrací unikátní HTML odpovídající obsahu
- omezte závislost na lazy-loadu u textového obsahu a interních odkazů
5. Core Web Vitals nejsou jen rychlost, ale i signál důvěry a použitelnosti
Od roku 2021 jsou Core Web Vitals součástí hodnocení uživatelského zážitku a v praxi často korelují s lepšími konverzemi. Nejde ale jen o splnění laboratorních metrik. Pokud je LCP nad 2,5 s, INP nad 200 ms nebo CLS nad 0,1, trpí jak uživatel, tak robot při interpretaci stránky. Pomalé stránky bývají hůře procházené, méně sdílené a častěji opouštěné.
V PageSpeed Insights sledujte nejen skóre, ale konkrétní doporučení: velikost obrázků, blokující skripty, fonty, caching a server response time. V reálných projektech často nejvíc pomůže optimalizace hero obrázku, odložení neklíčových skriptů a nastavení CDN. U WordPressu bývá problém v těžkých page buildech a nadbytku pluginů; u custom řešení zase v přetíženém backendu nebo špatně nastaveném edge cachingu.
- komprimujte obrázky do WebP nebo AVIF
- používejte preload pro klíčové fonty a hero assety
- omezte třetí strany jako chaty, heatmapy a příliš mnoho tagů v GTM
- měřte CWV v reálných datech přes CrUX, Search Console a GA4
6. Schema markup chybí, je chybné nebo neodpovídá obsahu
Strukturovaná data nejsou přímý ranking factor ve smyslu „přidám schema a skočím nahoru“. Jsou ale zásadní pro pochopení obsahu a pro bohaté výsledky. Pokud máte e-shop, lokální firmu, články nebo FAQ, schema pomáhá vyhledávači interpretovat entity, vztahy a typ stránky. Chyby v datech ale mohou být stejně škodlivé jako jejich absence.
V praxi často vidím schema, které popisuje něco jiného než stránka obsahuje. Například Product bez ceny, FAQPage s marketingovými otázkami mimo obsah, nebo recenze vložené na každou stránku bez reálného podkladu. Takové markupy mohou být ignorovány a v horším případě snižují důvěryhodnost webu. Validujte je přes Rich Results Test a Schema Markup Validator.
- na články používejte Article nebo BlogPosting se správným datumem a autorem
- u firemních webů doplňte Organization, LocalBusiness a kontaktní údaje
- u produktů kontrolujte cenu, dostupnost, SKU a varianty
- schema pravidelně revidujte po redesignu nebo změně CMS
7. Indexace se rozpadá kvůli signálům, které web vysílá robotům i AI vyhledávání
Současné vyhledávání už není jen o klasickém SERPu. Google AI Overviews, Perplexity a další AI nástroje pracují s obsahem, který je snadno parsovatelný, důvěryhodný a jasně strukturovaný. Pokud má web nejednoznačné nadpisy, chybné metainformace, slabé autorství nebo nejasné datum aktualizace, ztrácí šanci být citován i pochopen. To je důležité hlavně u informačních webů a odborných článků.
Stále častěji se vyplatí pracovat s principy E-E-A-T: uvést autora s praxí, zdroje dat, jasnou redakční politiku a aktualizace obsahu. U technických témat pomáhá i sekce „Jak jsme postupovali“, krátké metodiky, tabulky a přesné definice. Robot i AI model lépe čtou obsah, který je konzistentní a entitně propojený.
- používejte jednoznačné H1, H2 a interní kotvy
- u důležitých stránek přidejte autora, datum aktualizace a zdroje
- pravidelně kontrolujte Search Console, zda stránka neztrácí impressions kvůli poklesu indexace
- testujte, jak váš obsah cituje Perplexity, ChatGPT s web browsingem nebo AI Overviews v Google
Pokud chcete technické SEO řídit profesionálně, sledujte tři vrstvy najednou: crawling, indexaci a interpretaci obsahu. Když se jedna z nich rozbije, výkon webu padá i bez viditelných chyb v designu nebo textu. Nejlepší výsledky přináší pravidelný audit v kombinaci nástrojů jako Google Search Console, Screaming Frog, PageSpeed Insights, Ahrefs nebo Semrush a log analýza u větších webů. Právě tam se nejčastěji ukáže, kde robot zabloudil a proč ranking stagnuje.
