Grecia Uso del internet
martes, 25 de julio de 2017
El uso de los buscadores en Internet
Se definen, describen y caracterizan un grupo de los principales motores
de búsqueda que operan en Internet. Se analizan los métodos
reconocidos para su evaluación y selección, así como se ofrecen algunos
consejos para perfeccionar el proceso de búsqueda con el fin de mejorar
sus resultados. Se exponen, de forma general, sus semejanzas y
diferencias, ventajas y desventajas y se analizan sus tendencias actuales
de uso.
Buscadores en Internet. Conceptos, clasificación y características
Muchos son los nombres que han recibido los buscadores de acuerdo
con su estructura y funcionamiento. Algunos autores los clasifican en
índices, robots y metabuscadores,2 otros los agrupan en directorio s y
buscadores,3 o bien en índices y motores de búsqueda.4,5 Todos estos
términos tienen su equivalente en inglés, sin embargo, en esta lengua
además de "index", "meta- search engine" "directory" y "search engine",
para los 2 últimos aparecen en la literatura sinónimos como "crawler o
spider" y "human-powered" respectivamente. Veamos a continuación
algunas definiciones.
En el artículo "Buscadores: Los puntos de partida en la red"2 se plantea
que se dividen básicamente en índices, robots y metabuscadores. Aquí se
consideran los índices como los pioneros en Internet, ellos funcionan
mediante la incorporación constante de nuevas páginas a su base de
datos, generalmente disponen de un evaluador que minimiza el número
de páginas que ingresan al sistema y asegura su calidad; los robots
(llamados por la gran mayoría motores de búsqueda) disponen de
programas "arañas" que recorren la red e incluyen de forma automática
"todo cuanto encuentran", esto genera grandes dificultades para los
navegantes al momento de seleccionar los recursos, sobre todo en el
caso de búsquedas con un alto recobrado; por último, los
metabuscadores se limitan a redirigir la pregunta que reciben a varios
buscadores a la vez, y según el estado de opinión prevaleciente, suele ser
difícil pero recomendable el trabajo con ellos, cuando no se encuentra
información en los índices y motores.
Efectivamente, de acuerdo con las diferentes formas de funcionamiento,
es acertado establecer estas 3 categorías para clasificar los buscadores,
pero cabría preguntar qué significa "todo lo que encuentran" los robots, o
será que realmente no hay límites en lo que ellos recogen en la red.
En otra clasificación, se dividen en directorios y buscadores. Se dice que
los directorios son catálogos de direcciones que tienen relativamente
pocos sitios (cientos o miles), pero ellos se seleccionan y verifican; esto
supone cierta calidad, incluso, algunos directorios que contienen una
evaluación del sitio que indica cuán bueno es, otros presentan un breve
resumen, escrito por un reseñador o evaluador, que explica el contenido
(la mayoría sólo tienen una descripción que proporciona el propio autor
del sitio); por otra parte, se definen los buscadores como enormes
índices que comúnmente registran millones de páginas y donde las
búsquedas producen miles de sitios como respuesta.3
En estas clasificaciones, si bien es cierto que la definición de los
directorios es muy amplia y clara, el concepto de buscador se queda sin
explicar ¿cómo funciona esta herramienta?, además ¿por qué llamarle
buscador?, ¿acaso no son buscadores también los directorios?; por otra
parte, estos llamados "buscadores" no deben considerárseles índices
precisamente, porque ellos no muestran listas de términos o categorías a
los navegantes, el índice no es más que una parte interna donde se
almacena una copia de cada una de las páginas identificadas.
Otras 2 clasificaciones, tal vez menos comunes, son buscadores de
categorías y buscadores de contenido (o de palabras por contexto), al
primero se le llama también índices, que está claro que se refieren a los
directorios y aunque no se describen conceptos los ejemplos hablan por
sí solos: por categorías, Yahoo y por contexto, Altavista.6
Es oportuno señalar que aun cuando los motores de búsqueda no se
estructuran por categorías temáticas como los directorios, existen
también motores especializados en áreas geográficas y temáticas, por
tipos de recursos, entre otros.
Sullivan,7 un importante autor vinculado al tema de los motores de
búsqueda, editor de la revista Search Engine Watch, plantea que el
término "motor de búsqueda" se emplea indistintamente para los motores
basados en los programas "crawler" o "spider", y para los directorios
accionados por humanos, pero enfatiza en las diferencias entre ambos
justamente porque los primeros trabajan automáticamente y los
segundos dependen del factor humano.
Un aspecto importante, tratado por este autor, son las partes de los
motores de búsqueda: el primer elemento es el "spider" o "crawler",
encargado de visitar las páginas web, leerlas y analizar sus enlaces a
otras páginas, esta operación se repite cada cierto tiempo en busca de
cambios. El segundo elemento es el índice, también llamado catálogo
donde se almacena una copia de cada página web que se encuentra, cada
vez que cambia la página se actualiza con la nueva información,
claramente transcurre un tiempo desde que se encuentra la página hasta
que se indiza y no es hasta entonces que está disponible en el motor de
búsqueda. El tercer elemento es el software, programa que se encarga de
examinar los millones de páginas web contenidas en el índice, busca
aquellas que contengan las palabras iguales a las solicitadas en la
búsqueda, para luego ordenarlas según su relevancia. Para muchos
navegantes es una interrogante saber si realmente el orden de los
registros es aleatorio o responde a un determinado método de
ordenamiento, más adelante se ofrecerán algunas consideraciones al
respecto.7
Como puede apreciarse, en cada una de las definiciones, la función de
cada una de estas herramientas es la misma: "buscar en la red", todos
entonces se sitúan en una gran categoría general: buscadores. Son
páginas web que analizan la red con el objetivo de que los navegantes
encuentren los sitios donde se encuentra la información que ellos
necesitan, ponen a su disposición "alternativas" para moldear las
búsquedas con ayuda de sus propios lenguajes de interrogación, la
diferencia está en el funcionamiento de cada uno; según esto, se dividen
en 3 subcategorías, que en la opinión de la autora la manera más acertada
de agruparlos es en:
Directorios (se refiere a los llamados índices o buscadores de
categorías).
Motores de búsqueda (que algunos le llaman buscadores, robots,
arañas o buscadores de contenido).
Metabuscadores (que se abordarán más adelante).
Si se analizan detenidamente los conceptos referentes a las 2 primeras
categorías es fácil encontrar ventajas y desventajas en cada una, por
ejemplo, los directorios son excelentes para buscar por temas o
categorías y los resultados se ordenan por dichas categorías, pero ellos
no catalogan tantas direcciones como un motor de búsqueda; por su
parte, los motores de búsqueda son muy útiles para buscar datos
específicos y permiten encontrar "casi todo", pero esto, a su vez, produce
como resultado demasiados sitios de todo tipo y calidad (miles) en una
respuesta típica.
Búsqueda por campos
La búsqueda por campos es una herramienta tradicional en la búsqueda
en bases de datos convencionales. Se considera, en Internet, una de las
técnicas más efectivas para restringir los resultados de la búsqueda y
aumentar la relevancia.
Por título
Mediante cualquiera de las técnicas anteriores se indica a la base de
datos que debe buscar solo en el campo título, como se muestra en el
siguiente ejemplo:
title:"Panamerican Health Organization", nótese que no se deben dejar
espacios entre (:) y la palabra clave. En este caso, se devolverán todos
los sitios que incluyan esta frase en el título.
Por dominio
En este caso, se restringe la búsqueda a determinados dominios de
países o tipo de instituciones (educacionales, no gubernamentales,
militares, etc.). Por ejemplo: domain: cu + sld.
Suscribirse a:
Entradas (Atom)