O objetivo deste texto é ser amplo o suficiente para cobrir toda a Hypertext Markup Language (HTML) e mais o padrão CGI, e ao mesmo tempo ser de fácil compreensão e leitura, visando o usuário leigo nestes tópicos. Dessa forma apresentaremos explicações sucintas sobre os elementos da HTML e do padrão CGI.
A World Wide Web (Teia de Alcance Mundial), também conhecida como
WWW ou simplesmente W3, foi criada a partir de 1989 no
CERN (European Laboratory for Particle Physics) por Tim
Berners-Lee, com o objetivo de permitir que conhecimento e informação
pudessem ser compartilhados de forma rápida e transparente através de
hipertextos. Também foi Tim Berners-Lee um dos principais envolvidos no
desenvolvimento da Hypertext Markup Language (Linguagem de Marcadores
para Hipertexto), mais conhecida como HTML. Atualmente o
desenvolvimento da WWW está a cargo do W3 Consortium
(http://www.w3.org).
HTML é uma linguagem simples que permite a criação de hipertexto, que são documentos caracterizados por conter, além de texto, imagens estáticas, imagens em movimento, sons, enfim, tudo aquilo que conhecemos como hipermídia. Outra importante característica de um hipertexto é possuir ligação com outros hipertextos, através de ligações (âncoras) mais conhecidas como links. O Help do Windows é um exemplo clássico de hipertexto. Na WWW estes hipertextos são comumente chamados de páginas ou documentos.
Para escrever um arquivo em HTML, pode-se utilizar um editor especial para HTML, como o FrontPage ou então um editor de texto puro, como o Edit do DOS. No caso do editor de texto puro, é preciso conhecer os marcadores da linguagem. Neste texto iremos abordar a versão 3.2 da HTML, cuja divulgação ocorreu em 7/mai/1996.
Os marcadores HTML aparecem sempre na forma <marcador atributos>, escritos entre "<" e ">" para diferenciar do restante do texto, pois um arquivo em HTML contém tanto os marcadores quanto o texto da página. A linguagem HTML não é case-sensitive, ou seja, nos marcadores não faz diferença as letras aparecerem maiúsculas ou minúsculas, com algumas poucas exceções que são as entities, listadas na tabela de caracteres especiais (no final deste texto). Os atributos definem o comportamento do marcador, são opcionais (exceto quando indicado ao contrário) e não importa a ordem em que aparecem no marcador.
Existem basicamente dois tipos de marcadores em HTML. Um serve para definir características do texto, tipos e tamanhos das letras, título da página, cabeçalhos, etc. O outro tipo de marcador define objetos dentro da página, como uma imagem, uma linha de separação ou uma linha em branco. Os marcadores do primeiro tipo aparecem na forma <marcador>...</marcador>, definindo dessa forma sua área de atuação, e são genericamente chamados de delimitadores. Por exemplo, o código HTML <i>casa</i> fará com que a palavra casa apareça escrita em itálico, pois o marcador i define letras em itálico.
A WWW usa a arquitetura cliente-servidor, dessa forma, para navegar (passear) nas páginas da WWW é necessário um WWW Browser (cliente), ou seja, um software capaz de interpretar HTML e que conheça os protocolos de comunicação usados na WWW para solicitar serviços aos servidores. Alguns browsers muito comuns são o Netscape Navigator, o Internet Explorer, o Mosaic e o lynx, este último para terminais não gráficos. Dentre estes browsers, o Netscape Navigator é um dos mais difundidos.
Os marcadores permitidos no body, por sua vez, podem ser divididos em dois grupos distintos: marcadores de bloco (block level) e marcadores de texto (text level). O primeiro grupo define a formatação dos blocos que constituem o documento, enquanto que o segundo serve para formatar o conteúdo dos blocos.
Marcadores de bloco (block level)
Cabeçalho
| Listas
|
Delimitadores de texto
| Outros
|
Marcadores de texto (Text level)
Estilos físicos
| Estilos lógicos
|
Formulários
| Marcadores especiais
|
Tabelas
|
<title>Um simples exemplo</title>
<h2>Olá a
todos</h2>
Este <i>arquivo</i> e' escrito em
<b>HTML</b>.
Este texto pode ser gravado em um arquivo chamado "teste.html" (ou "teste.htm"
no DOS) e quando lido por um browser produz uma página como a seguinte:
Explicando os marcadores:
<title> . . . </title>
<h2> . . . </h2>
Gerou o texto "Olá a todos" com letra grande, tipo h2 (cabeçalho nível 2).
<i> . . . </i>
Gera letras em itálico.
<b> . . . </b>
Gera letras em negrito (bold).