Why HTML Isn't Enough | Proč HTML nestačí |
HTML has a lot going for it, but HTML also has several limitations that become apparent for applications that are larger or more functional than home pages and small websites. The following paragraphs explain these limitations in detail. | HTML je velmi účinný nástroj, má však také několik omezení, která se stávají zřetelnějšími při přechodu na komplikovanější a rozsáhlejší domovské stránky a menší WWW servery. Následující odstavce se věnují této problematice podrobněji. |
Limited structure - Most of HTMLâ?™s limitations can be traced to its fixed set of tags, which primarily serve to specify formatting of documents delivered on the Web. In other words, HTML tags support only a fixed and trivially simple structure. | Omezená struktura - Většina omezení HTML má společný zdroj, omezenou sadu tagů, která je v první řadě určena pro specifikaci formátování dokumentů přenášených přes web. Jinými slovy, prvky HTML podporují pouze omezený počet jednoduchých struktur. |
In this, HTML shares the limitations of other presentation-specific markup languages, such as RTF, which is designed for documents that are delivered in print. The reason SGML was invented was, in part, to separate information from formatting in order to provide a powerful and extensible way to mark up information. | Tato omezení má HTML společná s dalšími formátovacími značkovacími jazyky, jakým je RTF, který byl vytvořen pro přenos dokumentů určených pro tisk. Jedním z důvodů vzniku SGML byla snaha o oddělení informací od jejich formátování, tak, aby bylo možné informace označovat nějakým účinným a rozšiřitelným mechanismem. |
HTMLâ?™s lack of structure creates significant barriers to using HTML for applications beyond simple browsing, such as reuse, interchange, and automation. Each of these is covered below. | Malá strukturovanost HTML vytváří významné překážky při použití HTML v aplikacích, které jsou komplikovanější než jednoduché surfování, jako je opakované využití informací, jejich výměna a automatizace. O všem se dočtete níže. |
Limited reuse - Many organizations publish the same information in multiple forms; itâ?™s very common to have both printed and Web forms of the same data. Information originally created in HTML can be reused for printing, and information originally created for printing can be reused for Web delivery. | Omezené opakované využití informací - Mnoho organizací publikuje stejné informace řadou různých způsobů. Je velmi běžné, že jsou data publikována zároveň v tištěné formě a na WWW. Informace, které byly původně vytvořeny v HTML mohou být znovu využity při tisku a informace, původně určené pro tisk, mohou být znovu publikovány na webu. |
However, to achieve reuse requires conversion thatâ?™s usually followed by manual intervention to fix up the appearance (i.e., the formatting) of the resulting document. And that means that each time the source information changes, the conversion and fix-up process must be repeated. This is an expensive, time-consuming, and labor-intensive process, and one of the reasons for the adoption of SGML by organizations with lots of data to distribute. | Abychom dosáhly požadovaného výsledku, je ovšem třeba dokumenty nejdříve převést do nové podoby a poté ručně upravit jejich vzhled (tedy formátování konečného dokumentu). A to znamená, že po každé změně zdrojových informací musí následovat konverze a ruční úprava. To je drahé a náročné na čas i práci a představuje jeden z důvodů, proč SGML začaly používat organizace, které potřebují přenášet velká množství dat. |
Limited interchange - Because the Internet is simple and ubiquitous, it provides an ideal medium for organizations that want to interchange data. However, HTML undermines interchange because its small, fixed set of tags primarily indicates only the appearance of an element of a document. HTML provides nothing to denote the data within a document, which cripples attempts to achieve reuse. | Omezená výměna - Protože je Internet jednoduchý a všudepřítomný, představuje ideální prostředí pro organizace, které si potřebují vyměňovat data. HTML ale podminovává tuto výměnu svou malou a fixovanou sadou tagů, které z velké většiny pouze určují konečný vzhled dokumentu. HTML nám nedává možnost označit si data uvnitř dokumentu a tím jsou možnosti jejich opětovného použití velmi omezeny. |
For example, a computer manufacturer may wish to capture semiconductor data from its suppliers and feed that data into its computer-aided design (CAD) systems. Its CAD systems require data such as the function, tolerances, and timing of each pin of an integrated circuit. HTML provides no way to tag such data unambiguously. In fact, even if the original source data contains the necessary tagging to eliminate uncertainty, which is likely to be the case if the source data is in SGML, the resulting down-translation to HTML strips all the intelligence away. | Výrobce počítačů může mít například záměr získat data o používaných polovodičích od svých dodavatelů a použít je pak v systému CAD (design s pomoci počítače). |
Limited automation - Automation saves labor, reduces costs, speeds delivery, and improves quality. There are many opportunities for adding automation to the use of the Web, particularly for intranets and extranets. Examples include almost any forms-based application, such as insurance enrollments, medical claims processing, and online banking. | Omezené možnosti automatizace - automatizace šetří práci, omezuje náklady, urychluje přenos a zlepšuje kvalitu. Existuje mnoho možností, jak automatizovat používání webu, zejména v případě internetů a extranetů. Příkladem mohou být téměř všechny aplikace založené na formulářích, jako je pojišťovací agenda nebo on-line bankovnictví. |
However, HTML poses a significant barrier to achieving automation. All highly automated processes are built on a data format thatâ?™s highly expressive and absolutely consistent. HTML lacks the necessary expressiveness, since itâ?™s limited to a fixed set of presentation-oriented tags, and lacks as well the absolute consistency, since thereâ?™s no way to impose a rigorous data structure on top of those tags. | HTML ovšem klade automatizaci do cesty významné překážky. Všechny vysoce automatizované procesy jsou založeny na datových formátech majících velké vyjadřovací schopnosti a jsou naprosto konzistentní. Vyjadřovací schopnosti HTML jsou nedostatečné, neboť jsou omezeny pevně stanovenou sadou formátovacích prvků a HTML rovněž nesplňuje požadavek naprosté konzistence, protože neexistuje způsob, jak si vynutit rigorózní strukturu dat z těchto prvků složených. |
Searching produces too many "hits" - One of the most valuable capabilities of the Web is provided by search engines that allow a user to find everything on the Web related to an inquiry. As the volume of information available on the Web continues to skyrocket, however, the amount of data retrieved for a typical search has risen to unusable proportions. Searchers of information must choose between queries that are so narrow that relevant information may be omitted from the results, and queries so general that they produce far too many hits to be useful. | Prohledávání produkuje příliš mnoho zásahů - Jednou z nejcennějších schopností webu je možnost jeho prohledávání podle klíčových slov. S tím, jak množství informací dostupných na webu stoupá do závratných výšek, množství dat, která navrací běžný dotaz se zvýšil do nepoužitelných proporcí. Každý, kdo hledá nějakou informaci, si musí vybrat ze dvou možností. Buďto klást otázky tak úzce zaměřené, že vynechávají i podstatné informace, a nebo klást otázky obecné, potom je však nemožné všechny zásahy prohlédnout. |
The reason that Web searches turn up too many hits is that we typically search all the content of every page. Although searches can be limited to titles, those searches are almost certain to exclude relevant hits. | Důvod, proč prohledávání webu poskytuje příliš mnoho zásahů, spočívá v tom, že obvykle prohledáváme veškerý obsah každé stránky. Ačkoliv můžeme otázky omezit na to, že budou prohledávány pouze názvy, takovéto dotazy téměř jistě neobjeví řadu relevantních informací. |
One of the best ways to improve Web searching would be to provide content-specific elements. For example, the word "bonds" could be tagged as a name, or a chemical term, or a financial term. Then searches for content related to "bonds" could be limited to a specific domain of inquiry. | Jedním z nejlepších způsobů, jak vylepšit prohledávání webu, je používání prvků, které budou specifické pro daný obsah. Tak například slovo "kůň" by mohlo být označeno jako název zvířete nebo gymnastické náčiní. Dotazy na slovo kůň by tedy mohly být omezeny na oblast biologie nebo sportu. |
Moving target: HTML 2.0 to 3.2 to 4.0 to ?? - Since HTML is an evolving standard, its capabilities are continually being extended through the introduction of new tags. For those who are maintaining large amounts of information in HTML, the release of new revisions of HTML usually requires reviewing and retagging the existing data. In fact, many Surfers are relieved that Microsoft and Netscape have increased the intervals between new versions of their browsers from six months to one year, because that means that they donâ?™t have to retag their websites as often. | Pohyblivý cíl: HTML 2.0,..., 3.2,..., 4.0... ??? - Protože je HTML standard, který se vyvíjí, jeho schopnosti se neustále rozšiřují novými tagy. Každý, kdo udržuje velké množství informací ve formátu HTML, musí obvykle znovu prohlédnou a přeznačkovat data poté, kdy je přijat nový standard. Mnoho webových správců je ve skutečnosti rádo, že Microsoft a Netscape již neobměňují své prohlížeče tak rychle, takže nemusí své stránky tak často přeznačkovávat. |
To avoid the retagging problem entirely, many organizations create their source information in SGML and down-translate to HTML. The level of effort for changing an SGML-to-HTML translator may be as little as a few hours, while the effort to retag hundreds or thousands of pages can stretch into many weeks. | Aby se vyhnuly těmto problémům, mnoho organizací vytváří svá data v SGML a teprve pak je převádí do HTML. Zatímco převaděč ze SGML do HTML může být přepsán během několika hodin, přeznačkování stovek nebo tisíců stránek může být otázka řady týdnů. |
