Motores de búsqueda, palabras clave y portales web

Rodrigo Ricardo Publicado el 11 noviembre, 2020 7 minutos y 10 segundos de lectura

¿Qué son los motores de búsqueda?

¿Qué hace cuando tiene una pregunta o necesita encontrar información sobre un tema? Si usted es como la mayoría de las personas, recurra a Internet o, más específicamente, a la World Wide Web.

La World Wide Web es un sistema de documentos de hipertexto interconectados a los que se accede a través de Internet que proporciona muchos recursos y herramientas de búsqueda. Estas herramientas de búsqueda le permiten localizar una gran cantidad de información de forma rápida y cómoda. La World Wide Web ha generado una gran cantidad de motores de búsqueda. Un motor de búsqueda es un programa que permite a los usuarios localizar sitios web específicos de información en Internet basándose en palabras clave. Las palabras clave son los términos descriptivos que se utilizan para encontrar información relevante.

Abby desea encontrar información sobre el entrenamiento de obediencia para el nuevo cachorro que acaba de traer a casa. Utiliza su motor de búsqueda favorito, Google. Otros motores de búsqueda que se pueden utilizar son Yahoo, Bing, AOL y Ask.com. Abby ingresa las palabras clave «adiestramiento de perros» en su motor de búsqueda.

¿Qué es un portal web?

El motor de búsqueda envía las palabras clave de la consulta a un servidor.
El motor de búsqueda envía al servidor

Abby también podría realizar su búsqueda desde un portal web. Un portal web es un sitio que se utiliza como punto de partida para ingresar a la web. Un portal incluye un directorio web y un motor de búsqueda, así como otras funciones útiles, como directorios de compras, correo electrónico, almacenamiento de archivos, juegos y salas de chat. Muchos motores de búsqueda también son portales web. Algunos portales web que se utilizan habitualmente en la actualidad son Yahoo, AOL y MSN. Muy a menudo, configurará su navegador web para que se abra en la página de inicio de un portal.

Componentes de un motor de búsqueda

Los motores de búsqueda tienen tres componentes principales: el formulario de búsqueda, la base de datos y el robot.

El formulario de búsqueda es el componente con el que estará más familiarizado. El formulario de búsqueda es la interfaz en la que escribe una palabra o frase que desea buscar. Se compone de un cuadro de texto y un botón de envío. El formulario de búsqueda es donde Abby ingresaría las palabras clave «adiestramiento de perros». Las palabras clave escritas en el motor de búsqueda se envían a un servidor que busca en la base de datos. Recuerde que un servidor es una computadora conectada directamente a Internet en la que se pueden almacenar y acceder a datos.

Una base de datos es una colección organizada de información a la que se puede acceder, administrar y actualizar. La página de resultados de una búsqueda web mostrará información a la que se ha accedido desde la base de datos. La base de datos se llena con información recopilada de un robot.

Un robot , también llamado bot , rastreador o araña , se utiliza para navegar por la Web siguiendo hipervínculos con el fin de indexar contenido web y almacenar páginas web. Un robot, o araña, se arrastra por la Web en busca de nuevas páginas o actualizaciones para agregar al índice del motor de búsqueda. La araña recopilará palabras clave y descripciones de metaetiquetas para agregarlas a la base de datos. Las metaetiquetas son parte del código HTML de una página web. Proporcionan información específica sobre la página web al navegador; sin embargo, las metaetiquetas no se pueden ver cuando accede a una página web. Su propósito es servir como informantes a las arañas. Los motores de búsqueda utilizan metaetiquetas para indexar páginas web.

Las metaetiquetas en el código HTML ayudan a las arañas a extraer información de las páginas web.
Ejemplo de código de metaetiqueta

El índice almacena toda la información recopilada por la araña para que se pueda encontrar lo más rápido posible. Es probable que los motores de búsqueda grandes tengan varias arañas trabajando simultáneamente. Estas arañas recopilan e indexan cientos de millones de páginas web para responder a los millones de búsquedas que se realizan cada día.

La búsqueda de Abby compila una lista de información y localizadores uniformes de recursos (o URL) para páginas web que cumplen con los criterios especificados. Esta lista se denomina conjunto de resultados. El conjunto de resultados a menudo contiene el enlace a cada página, título de página, descripción e incluso las primeras líneas de texto de la página. La búsqueda se completa cuando la página de resultados del motor de búsqueda se envía al navegador y se muestra en el monitor.

Operadores booleanos

Cuando realiza una búsqueda en la Web, está consultando el índice. Su consulta puede ser una sola palabra, una frase o incluso una oración. La construcción de una búsqueda compleja requerirá el uso de operadores de búsqueda u operadores lógicos booleanos. Los operadores lógicos booleanos le permiten limitar o ampliar su búsqueda para encontrar la información más relevante. La lógica booleana recibió su nombre de George Boole, un matemático del siglo XIX. La lógica booleana consta de tres operadores lógicos: y , o y no .

El operador ‘y’ se utiliza para limitar la búsqueda uniendo varios términos de búsqueda. El motor de búsqueda devolverá resultados que incluyen todas las palabras clave. El operador ‘y’ se utiliza a menudo para vincular diferentes conceptos. Un ejemplo es el «entrenamiento y trucos en casa». Solo se recuperarían los registros que contengan tanto entrenamiento de la casa como trucos.

El operador ‘o’ se utiliza para ampliar su búsqueda. El operador ‘o’ localizará documentos que contengan al menos una de las palabras clave especificadas. Es útil cuando tiene palabras similares para describir el mismo tema. Un ejemplo es ‘perro o canino’.

La lógica booleana recibe su nombre del matemático George Boole.
Operadores booleanos de George Boole

El operador ‘no’ se utiliza para excluir una palabra específica de una búsqueda. Se ignorarán los documentos que contengan la palabra clave especificada. El problema potencial con esto es que los resultados pueden volverse demasiado limitados y se pueden omitir documentos valiosos. Un ejemplo es «las razas de perros no son Yorkshire Terrier».

Resumen de la lección

La próxima vez que realice una búsqueda en la Web, tenga en cuenta todo lo que sucede entre bastidores. Es probable que ingrese a la Web a través de un portal Web o un sitio utilizado como punto de partida que contiene información y recursos diversificados. El portal incluirá un motor de búsqueda o un programa que le permitirá localizar sitios web específicos de información en Internet.

Tema relacionado:
¿Qué es la Web 3.0?

Cada motor de búsqueda incluirá tres componentes: un robot , una base de datos y un formulario de búsqueda . Trabajan juntos para obtener información sobre páginas web, almacenar la información, proporcionar la interfaz para facilitar la búsqueda y mostrar los resultados de una búsqueda. El formulario de búsqueda proporciona la interfaz que le permite ingresar sus palabras clave. La base de datos es una colección organizada de información que se busca para encontrar los resultados más relevantes. El robot (o araña ) navega por la Web siguiendo hipervínculos y recopilando información de las metaetiquetas con el fin de indexar el contenido de la Web y almacenar páginas web.

Las búsquedas web complejas pueden ser más eficientes cuando se utilizan operadores lógicos booleanos. Los operadores booleanos se utilizan para limitar o ampliar los resultados de la búsqueda mediante «y», «o» y «no».

Objetivos de la lección

Después de ver esta lección, debería poder:

  • Defina ‘motor de búsqueda’ y enumere los más comunes en Internet
  • Identificar los tres componentes de los motores de búsqueda y sus usos.
  • Explique cómo los operadores booleanos hacen que las búsquedas web complejas sean más eficientes con ‘y’, ‘o’ y ‘no’.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador