Intenção ambígua refere-se a palavras-chave em que o objetivo do pesquisador não é claro e também requer requisitos adicionais. Se uma consulta for vaga, o mecanismo de pesquisa da Internet não pode estabelecer com precisão a intenção do pesquisador.
Um método típico para processar consultas de pesquisa é obter um conjunto de documentos correspondentes e depois classificá-los com uma função de pontuação de importância. Esse método fácil geralmente funciona bem para questões de pesquisa específicas e específicas. No entanto, às vezes essa técnica falha.
Quando uma consulta de pesquisa é ampla (por exemplo, “camisetas”), não fica claro exatamente como decidir quais resultados correspondentes são um dos mais relevantes. Além disso, pior ainda, quando a pergunta é ambígua (por exemplo, “misturadores”), não fica claro apenas como determinar os resultados de coordenação, quanto mais colocá-los.
Um mecanismo de pesquisa pode descobrir instantaneamente quando uma consulta de pesquisa tem uma intenção ampla ou ambígua? Nenhum método é o melhor, mas aqui estão alguns sinais benéficos: Certas pesquisas tendem a ter conjuntos de resultados minúsculos.
Por outro lado, consultas amplas e também incertas tendem a ter grandes conjuntos de resultados. Se esse número for alto, a questão é discutível ou possivelmente ampla.
Diferença de resultados na busca com intenção ambígua
Um sinal mais forte do que o tamanho do conjunto de resultados é sua variância. Esta diferença pode ser verificada a partir da semelhança do resultado dos pares (por exemplo, intervalo de cosseno usando uma versão de incorporação de palavras) ou a partir de um histograma que resume a coleção de resultados (por exemplo, a piora da circulação do grupo). Uma grande diferença mostra uma investigação ambígua ou ampla.
A distinção dos resultados. Mais um sinal é a diversidade dos resultados em relação aos da coleção total de registros, normalmente medidos usando a divergência de Kullback-Leibler.
Para um estudo mais aprofundado disso, bem como de estratégias relevantes, sugiro a argumentação de Claudia Hauff sobre “Antecipando o desempenho de consultas e sistemas de acesso.”
Análise de consulta e Intenção ambígua
As pesquisas breves costumam ser amplas e, também, são mais prováveis de serem incertas. Lidar com a consulta com um tagger de classe gramatical ou de reconhecimento de entidade pode produzir uma avaliação muito mais precisa. Hauff discute esses tipos de métodos em sua seção sobre previsores de pré-recuperação.
Uma abordagem ainda mais moderna tiraria vantagem de embeddings de palavras, por exemplo, comparando o inquérito com uma coleção de pesquisas de especificidade reconhecida.
Em contraste, consultas amplas e pouco claras têm taxas de cliques mais baixas e menos cliques de resultados com classificação superior. Pesquisas amplas e ambíguas também têm preços mais altos de paginação, melhoria de questões e reformulação de questões.
É possível usar consultas rotuladas para educar uma versão de compreensão do dispositivo que identifica consultas incertas e amplas – embora qualquer abordagem baseada em hábitos históricos do pesquisador seja propensa a viés de apresentação.