HTML je velmi účinný nástroj, má však také několik omezení, která se stávají zřetelnějšími při přechodu na komplikovanější a rozsáhlejší domovské stránky a menší WWW servery. Následující odstavce se věnují této problematice podrobněji.
Omezená struktura - Většina omezení HTML má společný zdroj, omezenou sadu tagů, která je v první řadě určena pro specifikaci formátování dokumentů přenášených přes web. Jinými slovy, prvky HTML podporují pouze omezený počet jednoduchých struktur.
Tato omezení má HTML společná s dalšími formátovacími značkovacími jazyky, jakým je RTF, který byl vytvořen pro přenos dokumentů určených pro tisk. Jedním z důvodů vzniku SGML byla snaha o oddělení informací od jejich formátování, tak, aby bylo možné informace označovat nějakým účinným a rozšiřitelným mechanismem.
Malá strukturovanost HTML vytváří významné překážky při použití HTML v aplikacích, které jsou komplikovanější než jednoduché surfování, jako je opakované využití informací, jejich výměna a automatizace. O všem se dočtete níže.
Omezené opakované využití informací - Mnoho organizací publikuje stejné informace řadou různých způsobů. Je velmi běžné, že jsou data publikována zároveň v tištěné formě a na WWW. Informace, které byly původně vytvořeny v HTML mohou být znovu využity při tisku a informace, původně určené pro tisk, mohou být znovu publikovány na webu.
Abychom dosáhly požadovaného výsledku, je ovšem třeba dokumenty nejdříve převést do nové podoby a poté ručně upravit jejich vzhled (tedy formátování konečného dokumentu). A to znamená, že po každé změně zdrojových informací musí následovat konverze a ruční úprava. To je drahé a náročné na čas i práci a představuje jeden z důvodů, proč SGML začaly používat organizace, které potřebují přenášet velká množství dat.
Omezená výměna - Protože je Internet jednoduchý a všudepřítomný, představuje ideální prostředí pro organizace, které si potřebují vyměňovat data. HTML ale podminovává tuto výměnu svou malou a fixovanou sadou tagů, které z velké většiny pouze určují konečný vzhled dokumentu. HTML nám nedává možnost označit si data uvnitř dokumentu a tím jsou možnosti jejich opětovného použití velmi omezeny.
Výrobce počítačů může mít například záměr získat data o používaných polovodičích od svých dodavatelů a použít je pak v systému CAD (design s pomoci počítače).
Omezené možnosti automatizace - automatizace šetří práci, omezuje náklady, urychluje přenos a zlepšuje kvalitu. Existuje mnoho možností, jak automatizovat používání webu, zejména v případě internetů a extranetů. Příkladem mohou být téměř všechny aplikace založené na formulářích, jako je pojišťovací agenda nebo on-line bankovnictví.
HTML ovšem klade automatizaci do cesty významné překážky. Všechny vysoce automatizované procesy jsou založeny na datových formátech majících velké vyjadřovací schopnosti a jsou naprosto konzistentní. Vyjadřovací schopnosti HTML jsou nedostatečné, neboť jsou omezeny pevně stanovenou sadou formátovacích prvků a HTML rovněž nesplňuje požadavek naprosté konzistence, protože neexistuje způsob, jak si vynutit rigorózní strukturu dat z těchto prvků složených.
Prohledávání produkuje příliš mnoho zásahů - Jednou z nejcennějších schopností webu je možnost jeho prohledávání podle klíčových slov. S tím, jak množství informací dostupných na webu stoupá do závratných výšek, množství dat, která navrací běžný dotaz se zvýšil do nepoužitelných proporcí. Každý, kdo hledá nějakou informaci, si musí vybrat ze dvou možností. Buďto klást otázky tak úzce zaměřené, že vynechávají i podstatné informace, a nebo klást otázky obecné, potom je však nemožné všechny zásahy prohlédnout.
Důvod, proč prohledávání webu poskytuje příliš mnoho zásahů, spočívá v tom, že obvykle prohledáváme veškerý obsah každé stránky. Ačkoliv můžeme otázky omezit na to, že budou prohledávány pouze názvy, takovéto dotazy téměř jistě neobjeví řadu relevantních informací.
Jedním z nejlepších způsobů, jak vylepšit prohledávání webu, je používání prvků, které budou specifické pro daný obsah. Tak například slovo "kůň" by mohlo být označeno jako název zvířete nebo gymnastické náčiní. Dotazy na slovo kůň by tedy mohly být omezeny na oblast biologie nebo sportu.
Pohyblivý cíl: HTML 2.0,..., 3.2,..., 4.0... ??? - Protože je HTML standard, který se vyvíjí, jeho schopnosti se neustále rozšiřují novými tagy. Každý, kdo udržuje velké množství informací ve formátu HTML, musí obvykle znovu prohlédnou a přeznačkovat data poté, kdy je přijat nový standard. Mnoho webových správců je ve skutečnosti rádo, že Microsoft a Netscape již neobměňují své prohlížeče tak rychle, takže nemusí své stránky tak často přeznačkovávat.
Aby se vyhnuly těmto problémům, mnoho organizací vytváří svá data v SGML a teprve pak je převádí do HTML. Zatímco převaděč ze SGML do HTML může být přepsán během několika hodin, přeznačkování stovek nebo tisíců stránek může být otázka řady týdnů.
