El turno de Google.

Como todos sabemos, Yahoo! no es un motor de búsqueda sino un directorio. Esto significa que su base de datos está compuesta por sitios seleccionados «a mano», por personas reales. Esta particularidad motiva que dicha base de datos sea sustancialmente menor que la de los motores, los cuales las conforman mediante el uso de programas navegadores, los llamados robots. Cuando una búsqueda no encuentra coincidencias entre los sitios almacenados en su archivo, Yahoo! exhibe los resul-tados ofrecidos por algún otro sistema. Durante los últimos tiempos, este sistema era el de Inktomi y a partir del próximo mes será el de Google.

Este cambio eleva varios escalones la importancia de Google como proveedor de visitas para sitios en castellano, dado que Yahoo! continúa siendo uno de los buscadores más utilizado por los usuarios hispanos. Aunque todos podemos enviar nuestros sitios a las versiones en español de Yahoo!, no podemos hacerlo a su sitio principal, en inglés, perdiendo de esta forma una buena posibilidad de obtener más visitas. El recurso alternativo es el de conseguir un buen listado en el motor adicional, de modo que podamos aparecer entre los resultados secundarios. En muchas oportunidades, estos listados se convierten en los principales, dado que muy pocos sitios en nuestro idioma están incluidos en el Yahoo! principal y para una buena cantidad de consultas ellos serán los únicos resultados disponibles.

Y también serán los únicos en las versiones hispanas cuando las búsquedas incluyan términos no archivados en Yahoo! Recordemos que este directorio generalmente sólo almacena una página por sitio y muy pocos datos sobre ésta, los que nosotros ingresamos en el formulario de registro. De esta forma, nos deja sin posibilidades de ser hallados por una gran cantidad de keywords relacionadas con nuestro sitio.

Los motores de búsqueda, por el contrario, indexan varias páginas por sitio y gran parte de su contenido (si no todo), ampliando dichas posibilidades. Consiguiendo buenos listados en estos buscadores alternativos de Yahoo!, tenemos grandes chances de aparecer en los resultados de las consultas realizadas en sus páginas.

Google, en http://www.google.com , es un buscador con robot y su funcionamiento difiere bastante de los otros motores de búsqueda. Su sistema de selección de resultados otorga una relevancia mayúscula a la POPULARIDAD de un sitio, el tema que tratamos en nuestra última edición.

Su base de datos está desarrollada de forma que, ante todo, le sea asignado a cada sitio un índice de popularidad. Sólo después, ante una consulta determinada, utiliza la comparación textual y lista las coincidencias conservando el ordenamiento que cada una de ellas tiene en la escala del buscador.

El proceso de agregar URLs es similar a cualquier otro motor. Hay que dirigirse a su página de AddURL en http://www.google.com/addurl.aspl e ingresar la de nuestro sitio en el casillero correspondiente. Provee también un casillero para incluir algunas palabras clave, aunque según Google éstas no son utilizadas para el esquema de relevancia (lo cual parece ser correcto, de acuerdo con las pruebas que hemos hecho).

Al igual que alguno de los otros motores, Google ignora las «instrucciones» de los tags meta keywords y description. Una página es relevante ante una búsqueda si la palabra clave utilizada se halla dentro del texto principal o si estuviera asociada al ENLACE QUE APUNTA HACIA ELLA.

Para el listado en sí utiliza el título de la página, acompañado de un breve extracto del texto principal. Otra de sus características reside en que este extracto NO ES siempre el mismo, sino que varía de acuerdo con la keyword utilizada en la búsqueda. Esto se debe a que Google exhibe una porción de texto que incluye las keywords en cuestión y, a menos que éstas estén cercanas unas de otras, el párrafo a mostrar irá variando para ajustarse a esta característica. Es una forma de mostrar en cual contexto es utilizada tal palabra clave, lo que permite al usuario seleccionar aquel que más se ajuste a su interés.

Google dice tener una base de datos «escalable», que eventualmente estará en condiciones de acompañar el crecimiento de la red (una vieja aspiración de todos los motores de búsqueda, hoy algo postergada). De acuerdo con su política, es posible que indexe con mayor prioridad (y que actualice más frecuentemente) aquellos sitios que va encontrando varias veces en su paso por la web, en vez de aquellos que le son sugeridos via formulario. Este es otro dato que subraya la importancia que le da el buscador a los enlaces desde otros sitios.

A tal punto es importante la «link popularity» para Google que incluso puede mostrar entre sus resultados algunos sitios que aún NO ha recorrido su robot, basado exclusivamente en la cantidad de veces que ha encontrado enlaces hacia ellos. En estos casos, el listado de estos sitios exhibirá directamente su URL en lugar del título.

Del mismo modo, un sitio puede NO APARECER NUNCA en los resultados si no cuenta con enlaces externos apuntando hacia él.

Otro elemento clásico que tiene mayor influencia en Google que en el resto de los buscadores es la posición relativa que mantienen entre sí los términos utilizados en la búsqueda, otorgando mayor relevancia a las páginas que contengan las palabras clave cercanas unas de otras (algo similar a lo que es posible obtener con el operador NEAR en otros buscadores).

El listado en Google puede demorar entre una y cuatro semanas desde el momento en que es solicitado y suponiendo que el sitio en cuestión ya cuente con referencias en su base de datos. La frecuencia de actualización es variable basada también en datos previos, aunque la general anunciada es de cada 30 días. El robot suele recorrer gran parte del sitio, lo que por el momento no hace recomendable el envío de múltiples páginas.

Cabe mencionar que como en los casos consignados en nuestra nota anterior, Google también permite consultar la cantidad de enlaces que apuntan hacia nuestro sitio, utilizando para ello la siguiente sintaxis:

link:mi_dominio.com

Por último, señalamos que, siguiendo las normas de la web, su robot obedece las instrucciones contenidas en el archivo robots.txt, al mismo tiempo que acepta cierto número de tags meta robots que nos permiten controlar cuanto de un sitio puede ser indexado.

En una nota al margen, es oportuno recordar una vez más que dada la forma de trabajo de un robot, debemos tener MUCHO cuidado con la instalación online de documentos que no deseamos hacer públicos. Todo material publicado en la web es potencialmente accesible por cualquier navegador o robot. Más aún en el caso de Google, y debido a su fuerte dedicación a seguir enlaces para encontrar otros sitios, es posible que inadvertidamente demos a conocer información confidencial.

Mucha gente cree que basta con que algún directorio de su servidor no esté enlazado desde ninguna otra página para que nadie, con medios legítimos, pueda accederlo. Pero resulta que un enlace hacia él puede aparecer imprevistamente, haciéndolo inmediatamente accesible para un robot. Un caso habitual se da cuando se «clickea» un link desde esa zona del sitio. Esta acción se verá reflejada en los logs de acceso del sitio de destino, que quizá SI sean públicos, bien directamente o por medio de las páginas producidas por su software de estadísticas. Y, obviamente, si ya hay un enlace hacia aquella zona, ésta pasa a ser accesible públicamente. Repetimos que esto no es relativo sólo a Google, sino que puede suceder con cualquier navegador y es aún más sencillo para un robot.

Artículo original de Oscar González Alba
publicado en la lista de correo de Guía para los Buscadores.
© Tiempos Mejores – Buscadores en Castellano
Técnicas de promoción de sitios web en español