A criação de definições para o SEO Semântico

Resumo: neste artigo eu apresento a metodologia para criação de definições amplamente usada na Biblioteconomia para o trabalho de otimização de sites de forma semântica, o SEO Semântico, como auxiliar importante na solução de um dos maiores problemas das ferramentas de buscas na web: a ambiguidade.

Por que criar melhores definições para nossas entidades?

O principal problema que sistemas automatizados de recuperação da informação (buscadores web estão nesta categoria), enfrentam é ter um alto grau de certeza sobre a informação que o usuário quer.

Quando eu faço uma pergunta do tipo: “onde eu acho puma?”, o Google, por exemplo, me gera uma busca deste tipo:

busca no site Google
Na imagem, busca no site Google utilizando o descritor “onde eu acho puma?”. Fonte: autor deste artigo.

Fica claro perceber, que devido ao meu histórico — que não tem carro e não faz buscas por isso — que o algoritmo tem mais confiança na entidade “puma” estar relacionada a marca esportiva, menos para carros e nenhuma para o animal puma.

Portanto foi feito, o que em Ciências da Informação, chamamos de desambiguação.

A Wikipedia define desambiguação assim:

Na linguística, desambiguação se refere ao processo de explicação à mensagem que possui mais de um sentido. Um termo ambíguo é, então, aquele que traz uma mensagem ou instrução confusa e que pode ser interpretado de mais de uma maneira.

Wikipedia Brasil

Eu já escrevi sobre isso aqui no Blog no post A importância da desambiguação no SEO Semântico.

Outro exemplo de resultado otimizado, desta vez usando busca por voz:

o que significa semantico
Representação de busca feita por mecanismo de reconhecimento de voz do Google, a pergunta em questão é “o que significa seo semântico”, já há definição de SEO Semântico apresentada de acordo com o site “seosemantico.com.br”.

A definição que eu criei, a partir da minha perspectiva do que é o SEO Semântico, gerou esse resultado.

Marcelo Schiessl e Marisa Brascher em Ontologia: ambiguidade e precisão, afirmam que a ambiguidade é um grande obstáculo para a recuperação de informação.

Portanto, todo e qualquer ajuda que possamos a dar ao nosso leitor algorítmico (os mecanismos de buscas, principalmente), ajuda nesse processo de fugir da incerteza, tornando mais claro para as ferramentas de recuperação de que assunto especificamente estamos querendo saber.

E uma das maneiras mais simples de fazer isso é lidar com definições precisas acerca dos conceitos, termos e entidades que estão presentes nos nossos textos.

A definição de entidades

O processo de definir entidades conhecido por definição terminológica se encaixa perfeitamente no nosso trabalho por nos ajudar na criação de um enunciado-texto que “dá conta de significados de termos ou de expressões de uma técnica, tecnologia ou ciência.”1, ou seja, nos ajuda a lidar com os termos específicos de uma área do conhecimento do qual tratamos (relacionado ao seu campo semântico) e seus significados.

Entidade é qualquer coisa, concreta ou abstrata, incluindo associações entre entidades, abstraídos do mundo real e modelado em forma de tabela que guardarão informações no banco de dados.
As entidades são objetos e/ou pessoas unicamente identificáveis com propriedades individuais (como cor = vermelho, data de nascimento = 28 de agosto de 1749, altitude = 2962 metros, temperatura = — 4,5 graus). — ENTIDADE (INFORMÁTICA)

WIKIPEDIA BRASIL

Definir é usar a correta expressão de um saber especializado ou como afirma FINATTO (2022):

Uma porção de conhecimento especializado. Neste caso, esse enunciado (outro nome que podemos usar, neste caso, para definição), é, também segundo FINATTO (2022), uma representação conceitual particular, vinculada a um saber técnico, científico ou tecnológico.

Foi esse uso das definições que me chamou a atenção e me fez ver sua importância na criação de conteúdos otimizados, principalmente para o SEO Semântico, que por motivos óbvios, precisa ser específico e extremamente claro acerca das entidades que está tratando.

Como a teoria da criação de definições ajuda o SEO?

Para usar as técnicas de criação de termos no SEO, eu escolhi, na minha prática profissional me apropriar dos estudos da Terminologia, depois de ler essa definição:

A terminologia é uma disciplina que permite identificar sistematicamente o vocabulário de uma determinada especialidade, analisar esse vocabulário e, se necessário, criá-lo e padronizá-lo em uma situação operacional específica para responder às necessidades de expressão dos usuários.

DUBUC, 1999, p. 21–22

Uma das atividades mais complexas, de quando inicio um projeto de SEO Semântico é de entender os conceitos, e consequentemente os termos e entidades, do domínio do conhecimento ao qual o site pertence.

Eu já fiz estudos longos sobre o mundo do atendimento ao cliente, carros elétricos, energia solar, quadros sob medida, entre outros. Esse processo de conhecer sobre um assunto que você não conhece nada é complexo, demorado e não tem garantia nenhuma de sucesso.

Mas quando conheci os estudos da Terminologia, que pode ser definida como uma disciplina da Linguística que estuda a forma e o significado das palavras que fazem parte do conjunto de palavras existente em um determinado idioma, entendi que poderia usar suas metodologias para o meu trabalho.

Estudando mais sobre a Teoria Comunicativa da Terminologia (TCT), que surgiu nas décadas de 80 e 90, proposta por Maria Teresa Cabré e colaboradores, que entendi as possiblidades. Essa nova visão sobre o estudo dos termos é perfeita para o SEO por conta dessa estrutura particular de trabalho:

TERMO > Criação do conjunto de palavras pelos falantes especializados em determinado assunto.

O uso do vocabulário usado por especialistas em determinado assunto me ajuda a resolver o meu problema de pesquisa em projetos de SEO, por me dar um ponto de partida altamente qualificado de termos, conceitos e entidades com as quais posso montar o meu Fluxo de Trabalho Semântico.

A Teoria Comunicativa da Terminologia utilizada um método de criar as definições que se encaixa perfeitamente no meu trabalho, chamado de Método Semasiológico, que parte das palavras para buscar os seus significados. Isso permite com que eu uso um conjunto de textos escritos por especialistas, para criar o que chamamos de Corpus, um conjunto de obras de todos os tipos, escritas por especialistas em determinado assunto.

Um corpus sobre o mundo de Harry Potter pode ser, por exemplo, uma Wiki escrita por fãs, pesquisadores e especialistas amadores nos livros e filmes.

Além disso, o TCT se preocupa com a Variação Terminológica, algo comum em qualquer área, porque a variação ocorre o tempo todo, seja porque especialistas atualizam com o tempo a definição dos termos ou porque usam diferentes palavras para definir a mesma entidade.

Na Medicina, o que hoje conhecemos por Hanseníase, já foi chamado de Lepra e de Mal de Lázaro. Ou nos estudos relacionados a produção agrícola a mandioca é também denominada macaxeira, aipim, maniva, castelinha, uaipi, maniveira, pão-de-pobre, etc.

Quero citar aqui as professoras Profª Drª Rita do Carmo Ferreira Laipelt e Profª. Drª. Regina Helena Van der Laan, quando fala da importância da Terminologia na Indexação:

Dessa forma a compreensão do que é um termo e da existência de variantes terminológicas irá possibilitar condições ao indexador de melhor representar as informações. Isto permitirá um acesso mais fácil para os diferentes usuários de um sistema de recuperação da informação (SRI).

Profª Drª Rita do Carmo Ferreira Laipelt e Profª. Drª. Regina Helena Van der Laan

A criação de definições para o SEO Semântico

Portanto, a proposta que eu trago a nossa prática de otimização é o uso da metodologia criada pela TCT, mas antes, vamos relembrar o tipo de enunciado que vamos usar. Para isso vou usar a definição terminológica que Barros (2004) sintetiza, assim:

O enunciado que descreve o conteúdo semântico-conceptual de uma unidade lexical ou terminológica em posição de entrada de um verbete […] Consiste em uma paráfrase sinonímica que exprime o conceito designado pela unidade lexical ou terminológica por meio de outras unidades linguísticas [sic]; é um conjunto de informações que são dadas sobre a entrada. (pp. 158–9).

Barros (2004)

Quero citar alguns pontos desta definição, que é bem complexa, mas que nos interessam muito.

Primeiro a visão de descrever o conteúdo semântico e conceitual das entidades que usamos nos nossos projetos. Sejam essas entidades usadas como categorias para estruturar um projeto, temas para conteúdo ou palavras usadas em textos, a preocupação com o sentido que damos a ela e os conceitos envolvidos na sua clara definição é que, para mim, é fundamental.

Se eu estou otimizando um projeto sobre carros elétricos, preciso primeiro saber como a indústria conceitua o que é um veículo movido a energia elétrica. Depois eu posso personalizar essa definição com a visão particular da organização que é dona do site. Isso dá a personalidade necessária para diferenciar o meu conteúdo de outros já criados.

O segundo ponto é a paráfrase sinonímica. A Sinonímia (sinônimos) ocorre entre pares de palavras ou expressões, mas não é uma relação somente de significados, para que duas expressões sejam sinônimas, não basta que tenham a mesma referência no mundo. Trazendo para os termos do SEO Semântico, não basta que eu esteja falando da mesma entidade.

Para que aconteça essa relação as expressões que você usa no seu conteúdo precisa, além de falar sobre a mesma entidade, deve ter o mesmo sentido. Portanto ser semanticamente objetiva.

Voltando ao meu exemplo sobre carros elétricos. Se eu estou falando do novo BMW i4, posso usar variações no meu conteúdo para falar desta entidade (BMW i4), mas as sentenças que eu crio precisam se referirem ao mesmo conjunto de fatos e serem ambas verdadeiras.

Se eu falo que o i4 é um carro elétrico criado pela BMW em uma frase, em outra posso falar com o lançamento do ano da fábrica alemã BMW é o primeiro Gran Coupé Elétrico. Ambos os fatos verdadeiros sobre a mesma entidade.

Definições de entidades

Mas não vamos usar todo tipo de definição no SEO, o tipo de definição que nos interessa é a usada nos dicionários terminológicos:

Definições terminológicas trazem predominantemente conhecimentos formais sobre “coisas” ou fenômenos.

(FINATTO, 1998, p. 2)

A definição terminológica apresenta as seguintes características:

  • Adequação ao domínio;
  • Estrutura formal e organização conceitual do enunciado definicional;
  • Gênero próximo + diferenças específicas*

Já escrevi muitas vezes aqui no Blog Semântico sobre Domínio (domínio do conhecimento, domínio semântico). A Antropologia Linguística tem uma abordagem, a lexicografia outra, mas é a visão das Ciências Sociais que nos ajuda.

A busca era originalmente para ver como as palavras que grupos de humanos usam para descrever certas coisas são relativas às percepções e significados subjacentes que esses grupos compartilham.

A etnossemântica tornou-se o campo que se concentrou em torno do estudo desses domínios semânticos e, mais especificamente, o estudo de como a categorização e o contexto de palavras e grupos de palavras refletiam as maneiras como diferentes culturas categorizam palavras em discurso e atribuem significado à sua língua.

OTTENHEIMER, 2006, P. 18

Gênero próximo + diferenças específicas

Mas antes de continuar, preciso ressaltar a importância do item 3: gênero próximo + diferenças específicas. Ele funciona como um guia para iniciarmos o processo de definição dos nossos conceitos, termos e entidades. Vejamos um exemplo:

“Um carro elétrico é um veículo a motor impulsionado por energia elétrica.”

Neste exemplo, a palavra “veículo a motor” representa o gênero próximo, por ser o gênero mais próximo (e acima na hierarquia) de carro elétrico. Se pensarmos em uma taxonomia dos veículos, podemos ter algo assim:

  • Veículos
  • Veículo a motor
  • Veículos elétricos (ou carros elétricos).

“Um carro elétrico é um veículo a motor impulsionado por energia elétrica.”

A expressão “impulsionado por energia elétrica” é a diferença específica de um carro elétrico, uma característica única deste tipo particular de carro.

E como isso nos ajuda?

Qual a vantagem de usar esse padrão na criação de textos otimizados?

Atualmente, conforme aprendi com Teodora Petkova, nós temos duas audiências para os nossos conteúdos:

Os algoritmos e os humanos.

Tenho usado a criação de definições no meu trabalho, para lidar com um problema que os algoritmos precisam resolver: a ambiguidade da nossa linguagem. Para isso, sigo esse padrão:

Já no início do texto defino, sem ambiguidade as entidades com as quais estamos trabalhando. É claro, que para o texto não ficar duro para a leitura dos seres humanos, posso usar várias estratégias para gerar essas definições, mas de qualquer maneira, o conteúdo começa definindo claramente do que estou falando, no nível das entidades.

Não posso deixar de relembrar que estamos construindo uma camada de conteúdo semântico para a Web, portanto vamos falar brevemente sobre Web Semântica.

Web Semântica, Dados Estruturados e SEO

Uma web, para ser semântica precisa de dados estruturados. Além de criar boas definições, usar dados estruturados no seu site vai ajudar ainda mais ao seu público algorítmico. Sabemos que as pesquisas no campo da semântica, adaptada a tecnologias da web, avançaram para resolver ambiguidade, mas ainda esse é um trabalho em andamento.

Buscadores como Google e Bing usam tecnologia para resolver esse problema. Imagina se o seu conteúdo ajudar aos buscadores a resolver a ambiguidade da busca para o seu domínio do conhecimento?

A minha proposta é usar a metodologia da Teoria Comunicativa da Terminologia para criar definições formais para os seus conceitos, termos e entidades. Essas definições podem, e devem, ser armazenadas em sua taxonomia (ou você pode criar um Tesauro para o seu conteúdo), tornando essa documentação útil para todos que criam conteúdo na sua organização.

Em resumo, a proposta é:

Definições Formais

Começar as descrições com definições formais das entidades porque isso ajuda ao algoritmo a entender o que estamos falando.

Padronização

Um padrão de criação de textos para entidades e categorias não significa textos sem criatividade, mas nos ajuda a não fugir do nosso campo semântico.

Referências

  • FINATTO, M. J. B. O papel da definição de termos técnico-científicos. lume.ufrgs.br, 2002. Disponível em http://hdl.handle.net/10183/184253. Acesso em: 4 de fev. de 2023
  • RODRIGUES, Daniel de Sá. Definição terminológica: princípios e regras. periodicos.ufpa.br, 2020. Revista Moara, n. 55, jan-jul 2020. Disponível em http://dx.doi.org/10.18542/moara.v0i55.9040. Acesso em: 4 de fev. de 2023.
    Alexander Rodrigues Silva

    Alexander Rodrigues Silva

    Consultor SEO

    Especialista SEO, consultor internacional SEO e autor do livro SEO Semântico: Fluxo de trabalho semântico. Sou um defensor da Web Semântica e Bibliotecário em formação, com mais de 20 anos de experiência no Digital. Trabalho com Search Engine Optimization desde 2009, sempre buscando alinhar a experiência do usuário a estratégias como Marketing de Conteúdo, otimizando o investimento em SEO.

    eBook Kindle: SEO Semântico – Fluxo de trabalho semântico

    SEO Semântico – A série