Hemos estado recopilando información sobre los motores de búsqueda, sobre todo en lo que se refiere a los diferentes términos que suelen recibir los robots de búsqueda. Seguro que os resulta interesante saber algo mas sobre estas herramientas que utilizamos día a día. Son tres los elementos que componen un motor de búsqueda:
1. Interfaz
Es la página Web a la que accede el usuario. En ella se establece el tipo de búsqueda. Hay dos tipos :
2. Base de datos textual
Índice de palabras, frases y datos asociados con la dirección de páginas Web (URL) , programas, ficheros, etc. La información se da de alta y de baja, pero siempre dejando una referencia para que después, quien busque un tema relacionado, pueda encontrar la dirección y un pequeño resumen de lo que contiene.
3. Robot
Programa de ordenador que está diseñado para recorrer de forma automática, la estructura hipertexto de la Web con el fin de llevar a cabo una o varias de las siguientes funciones:
Análisis estadístico: Miden el crecimiento de la Web, número de servidores conectados, etc.
Los términos robots, spiders, Wanderers, knowbots, webcrawlers y web scanners suelen considerarse sinónimos, aunque es posible encontrar matizaciones, como la recogida por Michael Berns quien distingue entre Spiders, Knowbots y Wanderers.
Otra matización interesante es la aportada por Martijn Koster , quien entiende como sinónimos los términos robots, spiders y webcrawlers, a los que añade el término Worms (Gusanos): Robots encargados de tareas de duplicación (creación de Mirrors).
Por ultimo, hay otro término que es importante no olvidar, los WebAnts (Hormigas): Conjunto de robots físicamente alejados que cooperan para la consecución de distintos objetivos. Por ejemplo, compartiendo los resultados obtenidos para asegurarse de no duplicar esfuerzos.
Imprime este post
Deja tu comentario sobre Los elementos de un motor de búsqueda
*Nota: Sólo se tendrán en cuenta los comentarios correctamente redactados y que estén relacionados con el tema de la entrada.RSS a los comentarios de esta entrada · TrackBack URI