O novo algoritmo de pesquisa do Google: BERT

Em 25 de outubro de 2019 o Google nos fez uma promessa:

Vamos compreender as pesquisas melhor do que nunca.

É através da criação de um novo algoritmo de pesquisa, o BERT, que o Google promete revolucionar mais uma vez as pesquisas.

Segundo o release postado em seu blog em inglês, o buscador nos esclarece que eles analisam bilhões de pesquisas todos os dias e 15% destas consultas são aquelas que nunca vimos antes. Por isso, criamos maneiras de retornar resultados para consultas que não podemos prever.

Lançamento Oficial do Bert

Hoje, dia 09 de Dezembro de 2019 o Google anunciou em um tweet que liberou o update em seu algorítimo para 70 línguas diferentes.

Pessoas como eu e você usamos pesquisas. Todos os dias. Mas nem sempre temos certeza do que procuramos, ou como procurar.

A essência da pesquisa é a compreensão da linguagem.

Muitas das vezes temos certo o que queremos, mas não temos certeza absoluta das palavras que nos levam até o resultado que precisamos. Isso porque os buscadores precisam das perguntas feitas a sua maneira para nos entregar o que queremos.

É isso que o BERT visa mudar!

Conforme as ferramentas de busca foram evoluindo, principalmente a do Google, ficou ainda mais evidente como algumas coisas ainda não funcionam bem.

As pessoas ainda se sentem obrigas a fazer buscas do ponto de vista do algoritmo, tentando entender como o buscador irá entender o que eles querem achar, ao invés de fazer perguntas do jeito que um ser humano faz a outro.

O problema que o BERT quer resolver

Para resolver esse problema a empresa está fazendo uma melhoria significativa na maneira como eles entendem as consultas, representando o maior salto em frente nos últimos cinco anos e um dos os maiores saltos adiante na história da Pesquisa.

Os últimos avanços da equipe de pesquisa do Google, na ciência do entendimento de idiomas, possibilitada pelo aprendizado de máquina, nos indicam que os resultados futuros serão incríveis.

interpreter mode

Quer um exemplo?

O Google Tradutor com a ajuda do Google Assistant agora pode traduzir a fala, em tempo real, direto do seu telefone. Chamado de Interpreter Mode, essa funcionalidade chega para facilitar a conversação entre pessoas falantes de línguas diferentes.

Entre em cena o BERT

Um dos maiores desafios no processamento de linguagem natural (PNL) é a falta de dados de treinamento para processar a nossa linguagem de forma a resolver o problema da busca.

Como a PNL é um campo diversificado com muitas tarefas distintas, a maioria dos conjuntos de dados específicos contém apenas alguns milhares (ou algumas centenas de milhares) de exemplos de treinamento rotulados por humanos.

processamento linguagem natural

Processamento de linguagem natural no Google BERT

Os modelos modernos de Programação de Linguagem Natural, baseados em aprendizado profundo, demonstram bons resultados quando providos por grandes quantidades de dados.

Eles melhoram quando são treinados usando milhões (ou bilhões) de exemplos de treinamento anotados.

Treinando modelos de aprendizado para melhorar as buscas

Para ajudar a preencher essa lacuna, com os melhores dados, os pesquisadores desenvolveram uma variedade de técnicas para treinar modelos de representação de linguagem de uso geral, usando a enorme quantidade de texto não anotado na Web.

Esta técnica é conhecida como como pré-treinamento.

O modelo pré-treinado pode ser ajustado, durante o processo de aprendizado em PNL com uma amostra pequena de dados.

Esse treinamento tem como resposta as perguntas e análises de sentimentos, melhorias substanciais de precisão em comparação com o treinamento nesses conjuntos de dados a partir do zero.

Essa tecnologia permite que qualquer pessoa treine seu próprio sistema de atendimento de perguntas de última geração, abrindo possibilidades de novos negócios a muitas empresas, de todos os tamanhos.

Transforme, o novo modelo de aprendizagem de linguagem

Transformer, usa um novo modelo de rede neural para entender o significado das frases.

Já não usa critérios como tamanho das palavras mas modelos que processam palavras em relação a todas as outras palavras em uma frase, em vez de uma por uma na ordem.

A semântica, por tanto, é cada vez mais fundamental no entendimento dos algorítimos do Google.

Os modelos BERT podem, portanto, considerar o contexto completo de uma palavra observando as palavras que vêm antes e depois dela – particularmente útil para entender a intenção por trás das consultas de pesquisa.

Quebrando o código das buscas

A pesquisa dos buscadores atuais poderão entender o contexto das palavras na sua consulta, usando o tecnologias como o BERT.

Você vai poder pesquisar de uma maneira cada vez mais natural para você.

13564b26f84780d88b625c68ab78a92d
Exemplo da nova busca do Google usando o Bert

O Google mesmo explicou a nossa busca, turbinada pelo BERT:

Antes a palavra “to” nessa busca em inglês era levada pouco em consideração por ser um termo muito usado, comum. E por isso o resultado mostrado não era preciso para a pergunta: “se em 2019 um brasileiro em viagem aos EUA precisa de visto”.

Depois dessa implementação o algoritmo já entende que a preposição é extremamente importante, por ser ele é que dá sentido a pergunta.

Em resumo, palavras críticas vão ser levadas muito mais em questão a partir dessa implementação no algoritmo.

Melhorando a pesquisa em mais idiomas

Aplicando o BERT para melhorar a Pesquisa, o Google procura transformar a busca numa ferramenta mais fácil de ser usada para pessoas em todo o mundo.

Uma característica poderosa desses sistemas é que eles podem aprender com um idioma e aplicá-los a outros. É possível usar modelos que aprendem com melhorias em inglês (um idioma em que existe a grande maioria do conteúdo da web) e aplicá-los a outros idiomas, omo o português, por exemplo.

Isso ajuda aos buscadores a retornar melhor resultados aos usuários. Resultados cada vez mais relevantes nos vários idiomas em que a Pesquisa é oferecida.

Para os snippets em destaque, o Google está usando um modelo BERT para melhorar os snippets em destaque nas duas dúzias de países em que esse recurso está disponível.

Analisando esses resultados já é possível observar melhorias significativas em idiomas como coreano, hindi e o nosso português.

Como os usuários compreendem os resultados das buscas?

SERPs complexas alteram o comportamento dos usuários perante as pesquisa, e a surge: o padrão de pinball. Para entender o padrão pinball, leia esse estudo do Nielsen Norman Group por Kate Moran and Cami Goray.

O conteúdo complexo e dinâmico nas páginas de resultados – SERPs – recebe muita atenção por parte dos buscadores. Quando esses recursos estão presentes, como os trechos em destaque, na página de resultados, os pesquisadores do Google descobriram que eles receberam atenção dos usuários em 74% dos casos.

Como as páginas de resultados de pesquisa agora não mostram padrões iguais, de consulta para consulta, os usuários geralmente são forçados a avaliar a página antes de se aprofundar e fazer um clique em algo.

Isso significa que o layout de uma SERP pode determinar quais links obtêm visibilidade e quais são clicados.

A inconsistência das SERPs

A inconsistência no layout das SERPs significa que os usuários trabalham mais para processar as informações hoje, do que costumavam fazer anteriormente.

Podemos dizer que os mecanismos de pesquisa estão nos incentivando a explorar mais as páginas com o resultado das nossas buscas, indo além do primeiro resultado. No entanto, as pessoas são bastante rápidas na escolha de um resultado de pesquisa – descobrimos que os usuários gastaram uma média de 5,7 segundos considerando os resultados antes de fazer sua primeira seleção (com um intervalo de confiança de 95% de 4,9 a 6,5 segundos).

Você nem sempre precisa ser o primeiro

O que esse novo padrão de olhar significa para equipes de produtos digitais e criadores de conteúdo?

Em 2006, o primeiro resultado em qualquer página de resultados recebeu 51% dos cliques. Em nosso projeto, ao contrário, descobrimos que a primeira posição em uma SERP (definida como o primeiro item listado na caixa de pesquisa) recebia apenas 28% dos cliques – quase metade, o que é uma mudança drástica no comportamento do usuário em pouco tempo. de apenas cerca de uma década. 59% dos cliques foram concentrados nas três primeiras posições, mas as posições inferiores receberam um pouco mais de cliques do que em 2006.

Quando as páginas de resultados de pesquisa contêm elementos complexos e visualmente atraentes, é mais provável que os usuários sejam atraídos para esses elementos e distribuam sua atenção pelo SERP.

Se você conseguir chegar às 5 primeiras posições em uma SERP, terá uma boa chance (40 a 80%) de obter uma visão valiosa do seu usuário.

Ainda é importante aparecer na primeira página de resultados, pois é provável que as pessoas não cliquem na segunda página.

Considere adicionar alguns desses recursos SERP não tradicionais à sua pesquisa no site, se isso fizer sentido para o seu conteúdo. Mas lembre-se de que quando as páginas de resultados são muito inconsistentes de consulta para consulta, os usuários precisam reavaliar a página a cada vez, o que aumenta o custo da interação.

Fonte: https://www.nngroup.com/articles/pinball-pattern-search-behavior/

Perguntas Frequentes

O que é algoritmo?

Em ciência da computação, um algoritmo é uma sequência finita de ações executáveis que visam obter uma solução para um determinado tipo de problema. Segundo Dasgupta, Papadimitriou e Vazirani, “algoritmos são procedimentos precisos, não ambíguos, mecânicos, eficientes e corretos”

O que é processamento de linguagem natural?

Processamento de linguagem natural ou PNL é uma subárea da ciência da computação, inteligência artificial e da linguística que estuda os problemas da geração e compreensão automática de línguas humanas naturais.


Alexander Rodrigues Silva

Alexander Rodrigues Silva

Consultor SEO

Especialista SEO, consultor internacional SEO e autor do livro SEO Semântico: Fluxo de trabalho semântico. Sou um defensor da Web Semântica e Bibliotecário em formação, com mais de 20 anos de experiência no Digital. Trabalho com Search Engine Optimization desde 2009, sempre buscando alinhar a experiência do usuário a estratégias como Marketing de Conteúdo, otimizando o investimento em SEO.

eBook Kindle: SEO Semântico – Fluxo de trabalho semântico

SEO Semântico – A série