Formát hypertextových dokumentů
Hypertextové dokumenty systému WWW jsou psány v jazyce HyperText
Markup Language (HTML). Dokument v jazyce HTML obsahuje kromě vlastního
textu dodatečné informace potřebné pro jeho zobrazování, odkazy na obrázky
vložené přímo do textu a odkazy mimo zobrazovaný dokument. Tyto pokyny jsou
zapsány mezi závorkami < a >:
<H1>Firma HTML Vás vítá</H1>
<A href="location.html"><img src="photo.jpg" alt="pohled"></A>
<H2>Moravské nám. 1, 612 66 Brno</H2>
<UL>
<LI><A HREF="products.html">Přehled produktů</A>
<LI><A HREF="news.html">Novinky</A>
</UL>
<HR>
...
Dodatečné
pokyny lze vložit do textu libovolným textovým editorem. Oproti jiným formátům
hypertextových souborů zůstává text ve formátu HTML přístupný běžnými nástroji
pro zpracování obyčejných textových souborů. Jazyk HTML byl navržen při vývoji
systému WWW v roce 1990. Od počátku byl vyvíjen jako jednoduchý jazyk pro
popis struktury dokumentů umožňující zobrazovat hypertextové dokumenty na
různých platformách. Pro popis struktury jsou používány značky (markup)
vložené do textu dokumentu. Konečný vzhled dokumentu je určen způsobem jeho
zobrazování, který je dán možnostmi zobrazovacího programu. Jazyk HTML není
určen pro popis vzhledu stránek vysázeného dokumentu. Při návrhu HTML byly
uvažovány hlavně hypertextové vlastnosti dokumentů a to především
z hlediska zpřístupnění textových informací. Teprve později byly
doplňovány rysy týkající se zobrazení dokumentu.
Jazyk HTML a SGML
Jazyk HTML je formálně definován jako reprezentační jazyk popisující
strukturované dokumenty systému SGML (Standard Generalized Markup
Language). Systém SGML (standard ISO 8879:1986) je obecným systémem pro
definici strukturovaných dokumentů a reprezentaci instancí takových dokumentů.
Instancí dokumentu ve formátu HTML se rozumí strukturovaný dokument obsahující
značky popisného jazyka HTML. Formát dokumentu a značky jsou formálně
definovány definicí typu dokumentu SGML (Document Type Definition -
DTD). Součástí definice jazyka HTML je také kompletní definice DTD pro systém
SGML, takže je možné s použitím systému SGML zpracovávat dokumenty ve
formátu HTML.
Jazyk HTML je postupně dále vyvíjen a rozšiřován. První verze jazyka HTML byla
definována pouze doprovodnou dokumentací k původní distribuci systému WWW
z laboratoří CERN. Snaha o standardizaci této verze byla rychle
předstižena dalším vývojem a ztratila brzy smysl. Následkem nečekaně rychlého
celosvětového rozšíření systému WWW v posledních létech a nekoordinovaného
vývoje různých verzí prohlížečů bylo neustálé oddalování přijetí jednotné verze
definice jazyka HTML. Teprve koncem roku 1995 se podařilo definovat ty společné
rysy jazyka HTML, které jsou běžně používány a které naprostá většina
prohlížečů zvládá. Tyto společné rysy byly specifikovány formálně pracovní
skupinou IETF
(Internet Engineering Task Force) HTML ve formě standardu
jazyka HTML verze 2.0, který byl přijat v listopadu 1995 jako dokument RFC
1866 (http://www.fee.vutbr.cz/pub/doc/rfc/rfc1866.txt).
Jazyk HTML verze 3.0
Jazyk HTML verze 2.0 obsahuje minimální společnou podmnožinu
rysů používaných verzí jazyka. Tato podmnožina nezahrnuje mnohé dnes běžně
používané prvky, jako jsou tabulky, podklad textu, zarovnání textu, apod.
Těchto navrhovaných nových prvků jazyka HTML 3.0 je poměrně hodně a jsou
postupně upřesňovány a formalizovány v nových návrzích jazyka HTML. První
návrh specifikace jazyka HTML verze 3.0 ve formě návrhu dokumentu RFC z března
roku 1995 se ukázal jako předčasný a ztratil platnost, protože návrhy dokumentů
RFC musí být do 6 měsíců inovovány nebo přijaty. Návrh kompletní nové
specifikace byl příliš velkým soustem a proto byl rozčleněn na samostatné
návrhy rozšíření jazyka v jednotlivých oblastech, jako jsou tabulky, vzorce,
atributy hlaviček, odstavců a odkazů, vložené obrázky a styly. Takto rozčleněné
návrhy jsou snadněji průchozí a budou zřejmě postupně schvalovány. Návrh
kompletní nové verze jazyka HTML 3 je tak samozřejmě neustále oddalován.
Původní specifikaci jazyka HTML verze 3.0 jazyka lze nalézt na
adrese http://www.fee.vutbr.cz/pub/WWW/documents/draft-ietf-html-specv3-00.txt.old.
Aktuální informace o stavu návrhu jsou dostupné z dokumentů pracovní
skupiny HTML IETF na adrese http://www.ics.uci.edu/pub/ietf/html/.
Následující popis vychází z informací dostupných koncem června 1996.
Nové rysy jazyka
Následující nové rysy jazyka HTML verze 2.0 byly postupně
publikovány jako samostatné dokumenty RFC. Všechny jsou zahrnuty
v návrhu jazyka HTML verze 3.2.
V nových verzích prohlížečů firem Netscape a Microsoft se objevila celá řada nových vlastností
jazyka, které v mnoha případech nebyly v žádném z připravovaných
návrhů nové verze jazyka.
Nakonec nezbylo standardizační skupině nic jiného, než akceptovat stav daný
vývojem prohlížečů a pokusit se společně s výrobci dohodnout na
podporované společné množině nových rysů jazyka. Prvním výsledkem této snahy
bylo oznámení a zveřejnění prvního návrhu specifikace jazyka HTML verze 3.2
v květnu 1996. Přestože je označení této verze jazyka číselně vyšší než u
původního návrhu, obsahuje ve skutečnosti méně nových vlastností.
Tato specifikace obsahuje pouze ty rysy
jazyka, které jsou již implementovány v posledních verzích prohlížečů
firem Netscape, Microsoft, SpyGlass, IBM a Sun.
Poslední verze návrhu je dostupná na adrese
http://www.w3.org/pub/WWW/TR/REC-html32.html.
Poslední změna:
Pokud máte námět na vylepšení této stránky nebo na ní naleznete chybu,
zašlete dopis na adresu
lampa@fit.vutbr.cz.