HTML

Este artículo, es una breve introducción para aquellos que desean publicar en diarios, foros, u otras páginas web en las que, por un motivo o por otro, se ven forzados a escribir código HTML en crudo y sin ayudas.

No se cubren ni muchísimo menos todas las posibilidades que ofrece el HTML, y ni siquiera se cubren aquellas partes que son imprescindibles para crear páginas web completas, como la cabecera. Tan sólo se menciona como escribir los fragmentos centrales de la página, lo que típicamente se necesita cuando se escribe una entrada en un diario, o un comentario en un foro: párrafos, listas, citas, enlaces, imágenes, etc.

Introducción
HTML significa HyperText Markup Language, que traducido significa Lenguaje de Marcado de HyperTexto. El hypertexto no es más que texto que se puede leer siguiendo más de un orden posible. Por ejemplo, una novela o un relato, sólo se puede leer empezando por la primera página, y acabando en la última. Pero una página web (o un sitio web) puede leerse de formas muy diferentes, saltando de un punto a otro, e incluso saltando a otros sitios web.

El concepto de marcado, viene de que al texto normal, se le insertan marcas que no deben ser leídas, sino interpretadas de forma especial. Puede parecer extraño, pero es un concepto similar a las anotaciones que hacen los profesores al corregir un texto de un alumno, o a las que hacen los editores en los manuscritos que reciben para publicar. Esas marcas indican que en un punto falta o sobra un párrafo, que un determinado fragmento debe tener un sangrado diferente, que una palabra debe estar en negrita, etc. Cuando se escribe código HTML, estas marcas las escribe el propio autor (o alguien que lo haga por él), y son interpretadas automáticamente por el navegador cuando muestra una página (de hecho, esta es casi la única tarea del navegador, o al menos, la más importante).

Carácteres blancos
Hay algunos carácteres que no representan ningún texto imprimible, y puesto que el papel es blanco (y muchas veces el fondo de las páginas web también), les llamamos carácteres blancos, o en blanco. Los ejemplos más claros son el espacio en blanco (la barra espaciadora), el retorno de carro (con la tecla «retorno» o «intro»), y la tabulación horizontal (con la tecla de tabulación). Hay más, pero son menos conocidos, ya que pertenecen a otros idiomas o son de origen técnico, y normalmente no se pueden escribir directamente con una tecla. Nos centraremos sólo en esos tres, que son casi los únicos que afectan a los idiomas occidentales.

Las reglas de HTML no distinguen entre los distintos carácteres blancos, y tampoco distinguen entre uno o varios seguidos. Esto es contraintuitivo al principio, ya que según como escribas, es posible que no se parezca totalmente lo escrito a lo que muestra el navegador (aunque diga lo mismo). También puede que hayas tenido la primera duda: si escribes varios retornos de carro para hacer un punto y aparte, ¡el navegador lo mostrará como un sólo espacio, igual que un punto y seguido! ¿Cómo se deben escribir los párrafos entonces? La explicación es muy importante, pero también sencilla de entender, y es la separación entre estructuración y presentación.

Separación entre estructuración y presentación
Este punto es muy importante, y podía haberlo introducido antes, pero ahora resultará más fácil poner ejemplos. En la web, jamás sabemos quien hay al otro lado, ni en qué condiciones estará leyendo la página. Es por eso que siempre se ha intentado que sea lo más universal posible. Universal no porque las páginas estén disponibles a lectores repartidos por todo el planeta, sino porque las páginas deben poder ser leídas por usuarios en muy distintas condiciones: pueden estar leyendo en una pantalla tan enana como la de un teléfono móvil, o tan grande como la de una televisión; pueden tener la ventana del navegador ocupando toda la pantalla, o no; incluso puede que su navegador no les muestre las páginas, sino que se las lea en voz alta; o directamente puede ser que la página esté siendo analizada y guardada por un buscador, y no haya ningún humano de por medio.

Es por eso que en HTML no decimos como se debe ver cierta parte del documento, sino que es cada parte del documento. En lugar de decir que este texto debe ir en letra muy grande y centrado, diremos que es un título o un encabezado. Un navegador sabrá que debe mostrarlo con letra grande, un lector de pantalla sabrá que debe pronunciarlo de forma especial, y un motor de búsqueda sabe que es una parte importante del documento.



¿Y cómo se relaciona esto con párrafos y los carácteres blancos? Fijémonos primero en los párrafos de las páginas web, y de los libros impresos. Casi todas las páginas web separan los párrafos dejando una línea completamente en blanco entre ellos. Pero en los libros u otros medios impresos, esa separación no existe, y en su lugar tenemos que cada párrafo está sangrado, es decir, que el primer renglón del párrafo no empieza junto al borde, sino más adentro. Cuando escribimos a mano, normalmente hacemos lo mismo que en las páginas web, y dejamos una línea en blanco entre párrafo y párrafo. Así que cuando escribimos con un procesador de texto, la mayoría pulsamos dos veces el retorno de carro para indicar un punto y aparte.

Tras estas explicaciones, deberíamos tener bastante claro que una cosa es la apariencia, y otra el contenido. También deberíamos entender que por ese mismo motivo, tiene su lógica que la forma de separar los párrafos en HTML, no es escribiendo saltos de línea, sino con marcas como las que comentábamos en la introducción. Estamos apunto de ver esas marcas, y qué forma tienen, pero antes debemos conocer un último aspecto teórico.