En el post anterior se detallaron los diferentes buscadores existentes en Internet. Pero, ¿cómo funciona un buscador?

Los buscadores de Internet se basan en robots. Estos robots escanean la Web identificando sitios, sus relaciones, contenido, … para construir sus tablas y asociar palabras clave con sitios web.

En este enlace se recogen la lista y caracterísitcas de los robots que están activos y recorren las páginas en Internet para crear los índices.

La construcción de los índices del buscador se basa en las etiquetas META incorporadas a las páginas HTML, tales como, description, keywords, title, …

         <meta name="language" content="es"/>
	<meta name="robots" content="all"></meta>
	<meta name="revisit-after" content="15 day"></meta>
	<meta http-equiv="Pragma" content="no-cache"></meta>
	<meta http-equiv="Cache-Control" content="no-cache"></meta>
	<meta http-equiv="Content-type" content="text/html; charset=iso-8859-15"></meta>

	<meta name="description" content="Información sobre Ministerio de Medio Ambiente"/>
	<meta name="keywords" content="Medio Ambiente, Biodiversidad, Cambio climático,"/>

Desde Webconfs.com/search-engine se muestra la información que vería un robot de la pagina.

Recomendaciones a los webmaster

Si estamos interesado en ser indexados, Google ofrece una serie de recomendaciones a los webmasters: Directrices de diseño y contenido, tecnicas y de calidad.  

Para conocer las tendencias de los posibles visitantes, las palabras clave que se debe usar y hacer la web más atractiva a los buscadores, puede usarse este complemento.

Dublin Core 

Dublin Core es el estandar que define los campos descriptivos de cualquier contenido pero sin profundizar en la implementación de dichos campos. Para ello se puede utilizar RDF, por ejemplo.

Ejemplo de campos META según el Dublin Core:

         <meta name="language" content="es"/>

	<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
	<meta name="DC.title" content="Ministerio de Medio Ambiente y Medio Rural y Marino"></meta>
	<meta name="DC.identifier" content="http://www.marm.es"></meta>
	<meta name="DC.description" content="Información sobre la estructura, gestión y política del Ministerio"></meta>
	<meta name="DC.subject" content="Medio Ambiente, Biodiversidad, Cambio climático, Calidad ambiental, "></meta>
	<meta name="DC.language" scheme="ISO639-1" content="es"></meta>
	<meta name="DC.creator" content="http://www.marm.es"></meta>
	<meta name="DC.publisher" content="http://www.marm.es"></meta>
	<meta name="DC.license" content="http://www.marm.es"></meta>
	<meta name="DC.type" scheme="DCMITYPE" content="http://purl.org/dc/dcmitype/Text"></meta>

dc

Desde el siguiente enlace se facilita la generación de metadatos según Dublin Core.

 

 

 

Microformatos

Es posible aplicar microformatos a cierto contenido de una página, de manera que un buscador inteligente entienda un determinado significado a ese contenido. Para la interpretacion correcta en el lado del navegador se  requiere la instalación de un plug-in en el mismo.

Desde este enlace se puede generar el código html necesario para incorporar microformatos a la pagina, bien de tarjetas de visita (hcard), calendarios o eventos (hCalendar), ….

Todo ello nos lleva hacia la Web Semantica.

Enlaces:

Be Sociable, Share!