El nuevo algoritmo de búsqueda de Google: BERT
El 25 de octubre de 2019, Google nos hizo una promesa:
Entenderemos la investigación mejor que nunca.
Es a través de la creación de un nuevo algoritmo de búsqueda , BERT, que Google promete revolucionar las búsquedas una vez más.
Según la nota de prensa publicada en su blog en inglés , el buscador explica que analiza miles de millones de búsquedas diarias, y que el 15 % de estas consultas son nuevas para ellos. Por lo tanto, han creado mecanismos para ofrecer resultados para consultas impredecibles.
Lanzamiento oficial de Bert
Hoy, 9 de diciembre de 2019, Google anunció en un tweet que ha lanzado una actualización de su algoritmo para 70 idiomas diferentes.
Piar
BERT, nuestra nueva herramienta para que la Búsqueda de Google comprenda mejor los idiomas, ya está disponible en más de 70 idiomas en todo el mundo. Su lanzamiento inicial fue en octubre para el inglés estadounidense. Puedes leer más sobre BERT a continuación y consultar la lista completa de idiomas en este hilo… https://t.co/NuKVdg6HYM
— Google SearchLiaison (@searchliaison) 9 de diciembre de 2019
Las personas como tú y yo usamos buscadores. Todos los días. Pero no siempre estamos seguros de qué buscamos ni de cómo buscarlo.
La esencia de la investigación radica en comprender el lenguaje.
A menudo sabemos exactamente lo que queremos, pero no estamos del todo seguros de las palabras que nos llevarán al resultado que necesitamos. Esto se debe a que los motores de búsqueda requieren que las preguntas estén formuladas de una manera particular para ofrecernos lo que buscamos.
¡Eso es lo que BERT pretende cambiar!
las herramientas de búsqueda han evolucionado, especialmente las de Google, se ha hecho aún más evidente que algunas cosas todavía no funcionan bien.
La gente todavía se siente obligada a buscar desde el algoritmo , tratando de entender cómo el motor de búsqueda comprenderá lo que quieren encontrar, en lugar de hacer preguntas de la forma en que un ser se las hace a otro.
El problema que BERT quiere resolver
Para solucionar este problema, la empresa está realizando una mejora significativa en la forma en que entiende las consultas, lo que representa el mayor avance en los últimos cinco años y uno de los mayores avances en la historia de las búsquedas.
Los últimos avances del equipo de investigación de Google en la ciencia de la comprensión del lenguaje, impulsados por el aprendizaje , indican que los resultados futuros serán increíbles.

¿Quieren un ejemplo?
Google Translate, con la ayuda del Asistente de Google, ahora puede traducir el habla en tiempo real, directamente desde tu teléfono. Esta función, llamada Modo Intérprete, está diseñada para facilitar la conversación entre personas que hablan diferentes idiomas.
Entra BERT
Uno de los mayores desafíos en el procesamiento del lenguaje natural (PLN) es la falta de datos para procesar nuestro lenguaje y así resolver el de búsqueda .
Dado que el PLN es un campo con muchas tareas distintas, la mayoría de los conjuntos de datos específicos contienen solo unos pocos miles (o unos pocos cientos de miles) de ejemplos de entrenamiento etiquetados por humanos.

Procesamiento del lenguaje natural en Google BERT
Los modelos modernos de procesamiento del lenguaje natural, basados en el aprendizaje profundo, demuestran buenos resultados cuando se les proporcionan grandes cantidades de datos.
Mejoran cuando se entrenan utilizando millones (o miles de millones) de ejemplos de entrenamiento anotados.
Entrenamiento de modelos de aprendizaje para mejorar las búsquedas
Para ayudar a llenar este vacío con los mejores datos disponibles, los investigadores han desarrollado una variedad de técnicas para entrenar modelos de representación del lenguaje de propósito general utilizando la vasta cantidad de texto sin anotar en la Web .
Esta técnica se conoce como preentrenamiento.
El modelo preentrenado se puede ajustar durante el proceso de aprendizaje de PLN con una pequeña muestra de datos.
Este entrenamiento proporciona respuestas a preguntas y análisis , lo que resulta en mejoras sustanciales en la precisión en comparación con el entrenamiento con estos conjuntos de datos desde cero.
Esta tecnología permite a cualquiera entrenar su propio sistema de preguntas y respuestas de última generación, abriendo nuevas de negocio para muchas empresas de todos los tamaños.
Transform, el nuevo modelo de aprendizaje de idiomas.
Transformer utiliza un nuevo modelo de red neuronal para comprender el significado de las oraciones.
Ya no utiliza criterios como la longitud de las palabras, sino modelos que procesan las palabras en relación con todas las demás palabras de una oración, en lugar de una por una en orden.
Por lo tanto la semántica se está convirtiendo en un elemento cada vez más fundamental para comprender los algoritmos de Google.
Por lo tanto, los modelos BERT pueden considerar el contexto completo de una palabra observando las palabras que la preceden y la siguen; esto resulta particularmente útil para comprender la intención detrás de las consultas de búsqueda.
Descifrando el código de búsqueda
Los motores de búsqueda actuales pueden comprender el contexto de las palabras en tu consulta, utilizando tecnologías como BERT.
Podrás buscar de una manera que te resultará cada vez más natural.

El propio Google explicó nuestra búsqueda, potenciada por BERT:
Anteriormente, en esta búsqueda en inglés, la palabra "to" no se tenía muy en cuenta por ser un término de uso muy común. Por lo tanto, el resultado mostrado no era preciso para la pregunta: "¿Necesita visa un brasileño que viaje a Estados Unidos en 2019?".
Tras esta implementación, el algoritmo comprende que la preposición es extremadamente importante, ya que es lo que da sentido a la pregunta.
En resumen, a partir de esta implementación del algoritmo, las palabras clave tendrán mucho más en cuenta.
Mejorar la búsqueda en más idiomas
Para los fragmentos destacados, Google está utilizando un modelo BERT para mejorarlos en los veinticuatro países donde esta función está disponible.
Analizando estos resultados, ya es posible observar mejoras significativas en idiomas como el coreano, el hindi y nuestro portugués.
¿Cómo interpretan los usuarios los resultados de búsqueda?
Las páginas de resultados de búsqueda (SERP) complejas alteran el comportamiento del usuario en relación con las búsquedas, y surge el patrón de pinball Kate Moran y Cami Goray .
El contenido complejo y dinámico en las páginas de (SERP) recibe mucha atención por parte de estos. Investigadores de Google descubrieron que, cuando estas funciones, como los fragmentos destacados, están presentes en la página de resultados, captan la atención del usuario en el 74 % de los casos.
Dado que las páginas de resultados de búsqueda ya no muestran patrones consistentes de una consulta a otra, los usuarios a menudo se ven obligados a evaluar la página antes de profundizar y hacer clic en cualquier cosa.
Esto significa que el diseño de una página de resultados de búsqueda (SERP) puede determinar qué enlaces obtienen visibilidad y en cuáles se hace clic.
La inconsistencia de las SERP
La inconsistencia en los diseños de las páginas de resultados de búsqueda (SERP) implica que los usuarios tienen que esforzarse más para procesar la información hoy en día que en el pasado.
Podemos afirmar que los motores de búsqueda nos incentivan a explorar más a fondo las páginas con los resultados de nuestras búsquedas , yendo más allá del primer resultado. Sin embargo, las personas son bastante rápidas al elegir un resultado de búsqueda: observamos que los usuarios dedicaron un promedio de 5,7 segundos a considerar los resultados antes de realizar su primera selección (con un intervalo de confianza del 95 % de entre 4,9 y 6,5 segundos).
No siempre tienes que ser el primero.
¿Qué implica esta nueva forma de ver las cosas para los equipos de productos digitales y los creadores de contenido?
En 2006, el primer resultado en cualquier página de resultados de búsqueda recibía el 51 % de los clics. En nuestro proyecto , en cambio, descubrimos que la primera posición en una SERP (definida como el primer elemento en el cuadro de búsqueda) recibía solo el 28 % de los clics, casi la mitad, lo que representa un cambio drástico en el comportamiento del usuario en apenas una década. El 59 % de los clics se concentraron en las tres primeras posiciones, pero las posiciones inferiores recibieron ligeramente más clics que en 2006.
Cuando las páginas de resultados de los motores de búsqueda contienen elementos complejos y visualmente atractivos, es más probable que los usuarios se sientan atraídos por esos elementos y distribuyan su atención a lo largo de la página de resultados.
Si logras alcanzar las 5 primeras posiciones en una SERP, tienes una buena probabilidad (entre un 40 y un 80%) de obtener información valiosa sobre tu usuario.
Sigue siendo importante aparecer en la primera página de resultados, ya que es poco probable que la gente haga clic para pasar a la segunda página.
Considera añadir algunas de estas funciones SERP no tradicionales a la búsqueda de tu sitio web si resulta útil para tu contenido. Pero recuerda que si las páginas de resultados son demasiado inconsistentes entre consultas, los usuarios deben volver a evaluar la página cada vez, lo que aumenta el coste de la interacción.
Fuente: https://www.nngroup.com/articles/pinball-pattern-search-behavior/
Preguntas frecuentes
¿Qué es un algoritmo?
En informática, un algoritmo es una secuencia finita de acciones ejecutables cuyo objetivo es obtener una solución a un tipo específico de problema. Según Dasgupta, Papadimitriou y Vazirani, "los algoritmos son procedimientos precisos, inequívocos, mecánicos, eficientes y correctos".
¿Qué es el procesamiento del lenguaje natural?
El procesamiento del lenguaje natural, o PLN, es una subdisciplina de la informática, la inteligencia artificial y la lingüística que estudia los problemas de la generación y comprensión automáticas de las lenguas humanas naturales.





Publicar comentario