1. Introdução


O objetivo deste texto é ser amplo o suficiente para cobrir toda a Hypertext Markup Language (HTML) e mais o padrão CGI, e ao mesmo tempo ser de fácil compreensão e leitura, visando o usuário leigo nestes tópicos. Dessa forma apresentaremos explicações sucintas sobre os elementos da HTML e do padrão CGI.


1.1 HTML - A linguagem da World Wide Web


A World Wide Web (Teia de Alcance Mundial), também conhecida como WWW ou simplesmente W3, foi criada a partir de 1989 no CERN (European Laboratory for Particle Physics) por Tim Berners-Lee, com o objetivo de permitir que conhecimento e informação pudessem ser compartilhados de forma rápida e transparente através de hipertextos. Também foi Tim Berners-Lee um dos principais envolvidos no desenvolvimento da Hypertext Markup Language (Linguagem de Marcadores para Hipertexto), mais conhecida como HTML. Atualmente o desenvolvimento da WWW está a cargo do W3 Consortium (http://www.w3.org).

HTML é uma linguagem simples que permite a criação de hipertexto, que são documentos caracterizados por conter, além de texto, imagens estáticas, imagens em movimento, sons, enfim, tudo aquilo que conhecemos como hipermídia. Outra importante característica de um hipertexto é possuir ligação com outros hipertextos, através de ligações (âncoras) mais conhecidas como links. O Help do Windows é um exemplo clássico de hipertexto. Na WWW estes hipertextos são comumente chamados de páginas ou documentos.

Para escrever um arquivo em HTML, pode-se utilizar um editor especial para HTML, como o FrontPage ou então um editor de texto puro, como o Edit do DOS. No caso do editor de texto puro, é preciso conhecer os marcadores da linguagem. Neste texto iremos abordar a versão 3.2 da HTML, cuja divulgação ocorreu em 7/mai/1996.

Os marcadores HTML aparecem sempre na forma <marcador atributos>, escritos entre "<" e ">" para diferenciar do restante do texto, pois um arquivo em HTML contém tanto os marcadores quanto o texto da página. A linguagem HTML não é case-sensitive, ou seja, nos marcadores não faz diferença as letras aparecerem maiúsculas ou minúsculas, com algumas poucas exceções que são as entities, listadas na tabela de caracteres especiais (no final deste texto). Os atributos definem o comportamento do marcador, são opcionais (exceto quando indicado ao contrário) e não importa a ordem em que aparecem no marcador.

Existem basicamente dois tipos de marcadores em HTML. Um serve para definir características do texto, tipos e tamanhos das letras, título da página, cabeçalhos, etc. O outro tipo de marcador define objetos dentro da página, como uma imagem, uma linha de separação ou uma linha em branco. Os marcadores do primeiro tipo aparecem na forma <marcador>...</marcador>, definindo dessa forma sua área de atuação, e são genericamente chamados de delimitadores. Por exemplo, o código HTML <i>casa</i> fará com que a palavra casa apareça escrita em itálico, pois o marcador i define letras em itálico.

A WWW usa a arquitetura cliente-servidor, dessa forma, para navegar (passear) nas páginas da WWW é necessário um WWW Browser (cliente), ou seja, um software capaz de interpretar HTML e que conheça os protocolos de comunicação usados na WWW para solicitar serviços aos servidores. Alguns browsers muito comuns são o Netscape Navigator, o Internet Explorer, o Mosaic e o lynx, este último para terminais não gráficos. Dentre estes browsers, o Netscape Navigator é um dos mais difundidos.



1.2 Visão geral dos marcadores HTML

Os marcadores que servem para definir a estrutura de um arquivo HTML são:

No capítulo seguinte veremos que um documento HTML é composto de duas partes: head e body. Cada parte possui seu próprio conjunto de marcadores permitidos.


Marcadores do head


Marcadores do body

Os marcadores permitidos no body, por sua vez, podem ser divididos em dois grupos distintos: marcadores de bloco (block level) e marcadores de texto (text level). O primeiro grupo define a formatação dos blocos que constituem o documento, enquanto que o segundo serve para formatar o conteúdo dos blocos.

Marcadores de bloco (block level)

Cabeçalho
  • H1 - Cabeçalho nível 1 (o maior)
  • H2 - Cabeçalho nível 2
  • H3 - Cabeçalho nível 3
  • H4 - Cabeçalho nível 4
  • H5 - Cabeçalho nível 5
  • H6 - Cabeçalho nível 6 (o menor)
Listas
  • UL - Lista não ordenada
  • DIR - Lista de diretório
  • MENU - Lista de itens de menu
  • OL - Lista ordenada
  • LI - Item de lista
  • DL - Lista de definições
    • DT - Definição de termo
    • DD - Definição
Delimitadores de texto
  • P - Parágrafo
  • PRE - Texto pré-formatado
  • PLAINTEXT - Texto puro
  • XPM - Texto puro
  • BLOCKQUOTE - Citação longa
  • ADDRESS - Informação de endereço
Outros
  • CENTER - Divisão para centralização
  • DIV - Divisão para alinhamento
  • HR - Linha horizontal
  • FORM - Formulário
  • TABLE - Tabelas


Marcadores de texto (Text level)

Estilos físicos
  • I - Itálico
  • B - Negrito
  • TT - Teletipo
  • BLINK - Letra piscando
  • STRIKE - Letra riscada
  • U - Sublinhado
  • BIG - Grande
  • SMALL - Pequeno
  • SUB - Subscrito
  • SUP - Sobrescrito
Estilos lógicos
  • VAR - Variável
  • EM - Enfatizado
  • CITE - Citação curta
  • CODE - Fragmentos de códigos
  • KBD - Entrada via teclado
  • SAMP - Saída via monitor
  • DFN - Definição de termos
  • STRONG - Fortemente enfatizado
Formulários
  • INPUT - Entrada de dados
  • SELECT - Lista de seleção
    • OPTION - Opção da lista
  • TEXTAREA - Área de entrada de dados
Marcadores especiais
  • BR - Quebra de linha
  • FONT - Tamanho, tipo e cor de caractere
  • A - Âncora (link)
  • IMG - Imagem
  • MAP - Mapa sensível e clicável
    • AREA - Área clicável

  • APPLET - Java applet
    • PARAM - Parâmetros para um applet
    • TEXTFLOW - Texto alternativo para um applet
  • FRAMESET - Conjunto de janelas
    • FRAME - Janela
    • NOFRAMES - Texto alternativo para um frameset
Tabelas
  • CAPTION - Título da tabela
  • TR - Linha da tabela
  • TH - Célula de cabeçalho
  • TD - Célula da tabela



1.3 Exemplo de um documento HTML

Aqui temos um exemplo simples de uma página escrita em HTML:


<title>Um simples exemplo</title>
<h2>Olá a todos</h2>
Este <i>arquivo</i> e' escrito em <b>HTML</b>.


Este texto pode ser gravado em um arquivo chamado "teste.html" (ou "teste.htm" no DOS) e quando lido por um browser produz uma página como a seguinte:


Olá a todos

Este arquivo e' escrito em HTML.


Explicando os marcadores: