martes, 25 de julio de 2017

El uso de los buscadores en Internet


Se definen, describen y caracterizan un grupo de los principales motores 
de búsqueda que operan en Internet. Se analizan los métodos 
reconocidos para su evaluación y selección, así como se ofrecen  algunos 
consejos para perfeccionar el proceso de búsqueda con el fin de mejorar 
sus resultados. Se exponen, de forma general, sus semejanzas y 
diferencias, ventajas y desventajas y se analizan sus tendencias actuales 
de uso.
Buscadores en Internet. Conceptos, clasificación y características
Muchos son los nombres que han recibido los buscadores de acuerdo 
con su estructura y funcionamiento. Algunos autores los clasifican en 
índices, robots y metabuscadores,2 otros los agrupan en directorio s y 
buscadores,3 o bien en índices y motores de búsqueda.4,5 Todos estos 
términos tienen su equivalente en inglés, sin embargo, en esta lengua 
además de "index", "meta-  search engine" "directory" y "search engine", 
para los 2 últimos aparecen en la literatura sinónimos como "crawler o 
spider" y "human-powered" respectivamente. Veamos a continuación 
algunas definiciones.
En el artículo "Buscadores: Los puntos de partida en la red"2 se plantea 
que se dividen básicamente en índices, robots y metabuscadores. Aquí se 
consideran los índices como los pioneros en Internet, ellos funcionan 
mediante la incorporación constante de nuevas páginas a su base de 
datos, generalmente disponen de un evaluador que minimiza el número 
de páginas que ingresan al sistema y asegura  su calidad; los robots 
(llamados por la gran mayoría motores de búsqueda) disponen de 
programas "arañas" que recorren la red e incluyen de forma automática 
"todo cuanto encuentran", esto genera grandes dificultades para los 
navegantes al momento de seleccionar los recursos, sobre todo en el 
caso de búsquedas con un alto recobrado; por último, los 
metabuscadores se limitan a redirigir la pregunta que reciben a varios 
buscadores a la vez, y según el estado de opinión prevaleciente, suele ser 
difícil pero recomendable el trabajo con ellos, cuando no se encuentra 
información en los índices y motores.
Efectivamente, de acuerdo con las diferentes formas de funcionamiento, 
es acertado establecer estas 3 categorías para clasificar los buscadores, 
pero cabría preguntar qué significa "todo lo que encuentran" los robots, o 
será que realmente no hay límites en lo que ellos recogen en la red.
En otra clasificación, se dividen en directorios y buscadores. Se dice que 
los directorios son catálogos de direcciones que  tienen relativamente 
pocos sitios (cientos o miles), pero ellos se seleccionan y verifican; esto 
supone cierta calidad, incluso, algunos directorios que contienen una 
evaluación del sitio que indica cuán bueno es, otros presentan un breve 
resumen, escrito  por un reseñador o evaluador, que explica el contenido 
(la mayoría sólo tienen una descripción que proporciona el propio autor 
del sitio); por otra parte, se definen los buscadores como enormes 
índices que comúnmente registran millones de páginas y donde  las 
búsquedas producen miles de sitios como respuesta.3
En estas clasificaciones, si bien es cierto que la definición de los 
directorios es muy amplia y clara, el concepto de buscador se queda sin 
explicar ¿cómo funciona esta herramienta?, además ¿por qué  llamarle 
buscador?, ¿acaso no son buscadores también los directorios?; por otra 
parte, estos llamados "buscadores" no deben considerárseles índices 
precisamente, porque ellos no muestran listas de términos o categorías a 
los navegantes, el índice no es más que una parte interna donde se 
almacena una copia de cada una de las páginas identificadas.
Otras 2 clasificaciones, tal vez menos comunes, son buscadores de 
categorías y buscadores de contenido (o de palabras por contexto), al 
primero se le llama también índices, que está claro que se refieren a los 
directorios y aunque no se describen conceptos los ejemplos hablan por 
sí solos: por categorías, Yahoo y por contexto, Altavista.6
Es oportuno señalar que aun cuando los motores de búsqueda no se 
estructuran por categorías temáticas como los directorios, existen 
también motores especializados en áreas geográficas y temáticas, por 
tipos de recursos, entre otros.
Sullivan,7 un importante autor vinculado al tema de los motores de 
búsqueda, editor de la revista  Search Engine Watch, plantea que el 
término "motor de búsqueda" se emplea indistintamente para los motores 
basados en los programas "crawler" o "spider", y para los directorios 
accionados por humanos, pero enfatiza en las diferencias entre ambos 
justamente porque los primeros trabajan automáticamente y los 
segundos dependen del factor humano.
Un aspecto importante, tratado por este autor, son las partes de los 
motores de búsqueda: el primer elemento es el "spider" o "crawler", 
encargado de visitar las páginas web, leerlas y analizar sus enlaces a 
otras páginas, esta operación se repite cada cierto tiempo en busca de 
cambios. El segundo elemento es el índice, también llamado catálogo 
donde se almacena una copia de cada página web que se encuentra, cada 
vez  que cambia la página se actualiza con la nueva información, 
claramente transcurre un tiempo desde que se encuentra la página hasta 
que se indiza y no es hasta entonces que está disponible en el motor de 
búsqueda. El tercer elemento es el software, programa  que se encarga de 
examinar los millones de páginas web contenidas en el índice, busca 
aquellas que contengan las palabras iguales a las solicitadas en la 
búsqueda, para luego ordenarlas según su relevancia. Para muchos 
navegantes es una interrogante saber  si realmente el orden de los 
registros es aleatorio o responde a un determinado método de 
ordenamiento, más adelante se ofrecerán algunas consideraciones al 
respecto.7
Como puede apreciarse, en cada una de las definiciones, la función de 
cada una de estas herramientas es la misma: "buscar en la red", todos 
entonces se sitúan en una gran categoría general: buscadores. Son 
páginas web que analizan la red con el objetivo de que los navegantes 
encuentren los sitios donde se encuentra la información que ellos 
necesitan, ponen a su disposición "alternativas" para moldear las 
búsquedas con ayuda de sus propios lenguajes de interrogación, la 
diferencia está en el funcionamiento de cada uno; según esto, se dividen 
en 3 subcategorías, que en la opinión de la autora la manera más acertada 
de agruparlos es en:

Directorios (se refiere a los llamados índices o buscadores de 
categorías).

Motores de búsqueda (que algunos le llaman buscadores, robots, 
arañas o buscadores de contenido).

Metabuscadores (que se abordarán más adelante).
Si se analizan detenidamente los conceptos referentes a las 2 primeras 
categorías es fácil encontrar ventajas y desventajas en cada una, por 
ejemplo, los directorios son excelentes para buscar por temas o 
categorías y los resultados  se ordenan por dichas categorías, pero ellos 
no catalogan tantas direcciones como un motor de búsqueda; por su 
parte, los motores de búsqueda son muy útiles para buscar datos 
específicos y permiten encontrar "casi todo", pero esto, a su vez, produce 
como  resultado demasiados sitios de todo tipo y calidad (miles) en una 
respuesta típica.


Búsqueda por campos 
La búsqueda por campos es una herramienta tradicional en la búsqueda 
en bases de datos convencionales. Se considera, en Internet, una de las 
técnicas más efectivas para restringir los resultados de la búsqueda y 
aumentar la relevancia.
Por título 
Mediante cualquiera de las técnicas anteriores se indica a la base de 
datos que debe buscar solo en el campo título, como se muestra en el 
siguiente ejemplo: 
title:"Panamerican Health Organization", nótese que no se deben dejar 
espacios entre (:) y la palabra clave. En este caso, se devolverán todos 
los sitios que incluyan esta frase en el título.
Por dominio 
En este caso, se restringe la búsqueda a determinados dominios de 
países o tipo de instituciones (educacionales, no gubernamentales, 
militares, etc.). Por ejemplo: domain: cu + sld.