Formát hypertextových dokumentů

Hypertextové dokumenty systému WWW jsou psány v jazyce HyperText Markup Language (HTML). Dokument v jazyce HTML obsahuje kromě vlastního textu dodatečné informace potřebné pro jeho zobrazování, odkazy na obrázky vložené přímo do textu a odkazy mimo zobrazovaný dokument. Tyto pokyny jsou zapsány mezi závorkami < a >:
<H1>Firma HTML Vás vítá</H1>
<A href="location.html"><img src="photo.jpg" alt="pohled"></A>
<H2>Moravské nám. 1, 612 66 Brno</H2>
<UL>
<LI><A HREF="products.html">Přehled produktů</A>
<LI><A HREF="news.html">Novinky</A>
</UL>
<HR>
...
Dodatečné pokyny lze vložit do textu libovolným textovým editorem. Oproti jiným formátům hypertextových souborů zůstává text ve formátu HTML přístupný běžnými nástroji pro zpracování obyčejných textových souborů. Jazyk HTML byl navržen při vývoji systému WWW v roce 1990. Od počátku byl vyvíjen jako jednoduchý jazyk pro popis struktury dokumentů umožňující zobrazovat hypertextové dokumenty na různých platformách. Pro popis struktury jsou používány značky (markup) vložené do textu dokumentu. Konečný vzhled dokumentu je určen způsobem jeho zobrazování, který je dán možnostmi zobrazovacího programu. Jazyk HTML není určen pro popis vzhledu stránek vysázeného dokumentu. Při návrhu HTML byly uvažovány hlavně hypertextové vlastnosti dokumentů a to především z hlediska zpřístupnění textových informací. Teprve později byly doplňovány rysy týkající se zobrazení dokumentu.

Jazyk HTML a SGML

Jazyk HTML je formálně definován jako reprezentační jazyk popisující strukturované dokumenty systému SGML (Standard Generalized Markup Language). Systém SGML (standard ISO 8879:1986) je obecným systémem pro definici strukturovaných dokumentů a reprezentaci instancí takových dokumentů. Instancí dokumentu ve formátu HTML se rozumí strukturovaný dokument obsahující značky popisného jazyka HTML. Formát dokumentu a značky jsou formálně definovány definicí typu dokumentu SGML (Document Type Definition - DTD). Součástí definice jazyka HTML je také kompletní definice DTD pro systém SGML, takže je možné s použitím systému SGML zpracovávat dokumenty ve formátu HTML.

Jazyk HTML verze 2.0

Jazyk HTML je postupně dále vyvíjen a rozšiřován. První verze jazyka HTML byla definována pouze doprovodnou dokumentací k původní distribuci systému WWW z laboratoří CERN. Snaha o standardizaci této verze byla rychle předstižena dalším vývojem a ztratila brzy smysl. Následkem nečekaně rychlého celosvětového rozšíření systému WWW v posledních létech a nekoordinovaného vývoje různých verzí prohlížečů bylo neustálé oddalování přijetí jednotné verze definice jazyka HTML. Teprve koncem roku 1995 se podařilo definovat ty společné rysy jazyka HTML, které jsou běžně používány a které naprostá většina prohlížečů zvládá. Tyto společné rysy byly specifikovány formálně pracovní skupinou IETF (Internet Engineering Task Force) HTML ve formě standardu jazyka HTML verze 2.0, který byl přijat v listopadu 1995 jako dokument RFC 1866 (http://www.fee.vutbr.cz/pub/doc/rfc/rfc1866.txt).

Jazyk HTML verze 3.0

Jazyk HTML verze 2.0 obsahuje minimální společnou podmnožinu rysů používaných verzí jazyka. Tato podmnožina nezahrnuje mnohé dnes běžně používané prvky, jako jsou tabulky, podklad textu, zarovnání textu, apod. Těchto navrhovaných nových prvků jazyka HTML 3.0 je poměrně hodně a jsou postupně upřesňovány a formalizovány v nových návrzích jazyka HTML. První návrh specifikace jazyka HTML verze 3.0 ve formě návrhu dokumentu RFC z března roku 1995 se ukázal jako předčasný a ztratil platnost, protože návrhy dokumentů RFC musí být do 6 měsíců inovovány nebo přijaty. Návrh kompletní nové specifikace byl příliš velkým soustem a proto byl rozčleněn na samostatné návrhy rozšíření jazyka v jednotlivých oblastech, jako jsou tabulky, vzorce, atributy hlaviček, odstavců a odkazů, vložené obrázky a styly. Takto rozčleněné návrhy jsou snadněji průchozí a budou zřejmě postupně schvalovány. Návrh kompletní nové verze jazyka HTML 3 je tak samozřejmě neustále oddalován.

Původní specifikaci jazyka HTML verze 3.0 jazyka lze nalézt na adrese http://www.fee.vutbr.cz/pub/WWW/documents/draft-ietf-html-specv3-00.txt.old. Aktuální informace o stavu návrhu jsou dostupné z dokumentů pracovní skupiny HTML IETF na adrese http://www.ics.uci.edu/pub/ietf/html/. Následující popis vychází z informací dostupných koncem června 1996.

Nové rysy jazyka

Následující nové rysy jazyka HTML verze 2.0 byly postupně publikovány jako samostatné dokumenty RFC. Všechny jsou zahrnuty v návrhu jazyka HTML verze 3.2.

Jazyk HTML verze 3.2

V nových verzích prohlížečů firem Netscape a Microsoft se objevila celá řada nových vlastností jazyka, které v mnoha případech nebyly v žádném z připravovaných návrhů nové verze jazyka. Nakonec nezbylo standardizační skupině nic jiného, než akceptovat stav daný vývojem prohlížečů a pokusit se společně s výrobci dohodnout na podporované společné množině nových rysů jazyka. Prvním výsledkem této snahy bylo oznámení a zveřejnění prvního návrhu specifikace jazyka HTML verze 3.2 v květnu 1996. Přestože je označení této verze jazyka číselně vyšší než u původního návrhu, obsahuje ve skutečnosti méně nových vlastností. Tato specifikace obsahuje pouze ty rysy jazyka, které jsou již implementovány v posledních verzích prohlížečů firem Netscape, Microsoft, SpyGlass, IBM a Sun. Poslední verze návrhu je dostupná na adrese http://www.w3.org/pub/WWW/TR/REC-html32.html.
Poslední změna:
Pokud máte námět na vylepšení této stránky nebo na ní naleznete chybu, zašlete dopis na adresu lampa@fit.vutbr.cz.