{"id":9306,"date":"2026-03-16T13:27:27","date_gmt":"2026-03-16T10:27:27","guid":{"rendered":"https:\/\/semantico.com.br\/blog\/?p=9306"},"modified":"2026-03-25T17:36:30","modified_gmt":"2026-03-25T14:36:30","slug":"o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo","status":"publish","type":"post","link":"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/","title":{"rendered":"O custo invis\u00edvel da desordem: como a arquitetura da informa\u00e7\u00e3o estanca preju\u00edzos com SEO"},"content":{"rendered":"\n<p>Neste artigo, vou escrever sobre um assunto que, \u00e0 primeira vista, parece distante do <a class=\"wl-entity-page-link\" title=\"Otimiza\u00e7\u00e3o para motores de busca\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/otimizacao-para-motores-de-busca\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/otimizacao-para-motores-de-busca\" >SEO<\/a>. Costumeiramente falamos sobre assuntos t\u00e9cnicos, <a class=\"wl-entity-page-link\" title=\"\u00edndice\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/indexacao-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/indexacao-2\" >indexa\u00e7\u00e3o<\/a>, updates de <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/algoritmo-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/algoritmo-2\" >algoritmo<\/a> e mais recentemente de IA. Mas \u00e9 sobre outro tipo de IA que quero tratar aqui: a <a class=\"wl-entity-page-link\" title=\"Taxonomia\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/taxonomia-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/taxonomia-2\" >Arquitetura da Informa\u00e7\u00e3o<\/a>. Mas vamos tratar sob um novo ponto de vista: vem comigo!<\/p>\n\n\n\n<p>Em ecossistemas corporativos de maior complexidade e em ambientes de neg\u00f3cios cada vez mais digitalizados, a arquitetura da informa\u00e7\u00e3o n\u00e3o deve ser vista como uma simples camada organizacional no desenvolvimento de interfaces. Na verdade, ela \u00e9 uma pot\u00eancia estrat\u00e9gica contra o preju\u00edzo que ultrapassa a casa dos milh\u00f5es e \u00e9 gerado pela perda cont\u00ednua de produtividade.<\/p>\n\n\n\n<p>Este fen\u00f4meno ocorre quando funcion\u00e1rios das <a class=\"wl-entity-page-link\" title=\"Organiza\u00e7\u00e3o\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/organizacao-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/organizacao-2\" >organiza\u00e7\u00f5es<\/a> n\u00e3o conseguem recuperar <a class=\"wl-entity-page-link\" title=\"SEO\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/informacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/informacao;http:\/\/data.wordlift.io\/wl0221\/entity\/otimizacao_para_motores_de_busca\" >informa\u00e7\u00f5es<\/a> vitais para o seu trabalho ou quando clientes n\u00e3o encontram as respostas \u00e0s suas <a class=\"wl-entity-page-link\" title=\"pesquisa\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/pesquisa\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/pesquisa\" >consultas<\/a> e pesquisas nas ferramentas de busca dos sites dessas organiza\u00e7\u00f5es.<\/p>\n\n\n\n<p>Especialistas em Experi\u00eancia do Usu\u00e1rio, Arquitetura da Informa\u00e7\u00e3o e <a class=\"wl-entity-page-link\" title=\"SEO\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/seo-semantico\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/seo-semantico;http:\/\/data.wordlift.io\/wl0221\/entity\/seo__semantico\" >SEO Sem\u00e2ntico<\/a> operam na interse\u00e7\u00e3o exata entre a cogni\u00e7\u00e3o humana e a infraestrutura cada vez mais intrincada de <a class=\"wl-entity-page-link\" title=\"Dado\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/dado-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/dado-2\" >dados<\/a> da Web. \u00c9 neste cen\u00e1rio que a <a class=\"wl-entity-page-link\" title=\"categorization\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/categorizacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/categorizacao\" >categoriza\u00e7\u00e3o<\/a> deve atuar como um redutor prim\u00e1rio de carga cognitiva e, simultaneamente, como o grande motor que impulsiona os sistemas de busca rumo \u00e0 sem\u00e2ntica, seja a busca interna de um portal, seja a indexa\u00e7\u00e3o realizada pelos buscadores atuais.<\/p>\n\n\n\n<p>Quando os dados n\u00e3o est\u00e3o organizados numa estrutura l\u00f3gica, o <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/processamento-de-linguagem-natural\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/processamento-de-linguagem-natural\" >Processamento de Linguagem Natural<\/a> sofre, os algoritmos falham em compreender o <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/sentido\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/sentido\" >sentido<\/a> do <a class=\"wl-entity-page-link\" title=\"Content\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/conteudo\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/conteudo\" >conte\u00fado<\/a> e a <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/visibilidade\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/visibilidade\" >visibilidade<\/a> org\u00e2nica do neg\u00f3cio vai de mal a pior.<\/p>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Conte\u00fados<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabela de conte\u00fado\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/#fundamentos_da_categorizacao_a_ciencia_da_organizacao_de_objetos_e_entidades\" >Fundamentos da categoriza\u00e7\u00e3o: a ci\u00eancia da organiza\u00e7\u00e3o de objetos e entidades<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/#semelhanca_similarity\" >Semelhan\u00e7a (similarity)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/#dessemelhanca_dissimilarity\" >Dessemelhan\u00e7a (dissimilarity)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/#a_visao_intrinseca_a_ontologia_do_objeto\" >A vis\u00e3o intr\u00ednseca (a ontologia do objeto)<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/#a_visao_extrinseca_a_percepcao_e_aplicacao_do_usuario\" >A vis\u00e3o extr\u00ednseca (a percep\u00e7\u00e3o e aplica\u00e7\u00e3o do usu\u00e1rio)<\/a><\/li><\/ul><\/nav><\/div>\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"fundamentos_da_categorizacao_a_ciencia_da_organizacao_de_objetos_e_entidades\"><\/span>Fundamentos da categoriza\u00e7\u00e3o: a ci\u00eancia da organiza\u00e7\u00e3o de objetos e entidades<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>A categoriza\u00e7\u00e3o e arquitetura da informa\u00e7\u00e3o s\u00e3o as estrat\u00e9gias que voc\u00ea procura para aumentar a encontrabilidade digital e evitar o custo invis\u00edvel da desordem.<\/strong><\/p>\n\n\n\n<p class=\"has-text-align-center\"><strong><a href=\"https:\/\/semantico.com.br\/blog\/as-ferramentas-certas-para-o-seo-sao-estrategias-e-taticas\/\">Quer ler mais sobre estrat\u00e9gias e t\u00e1ticas no SEO?<\/a><\/strong><\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Introdu\u00e7\u00e3o \u00e0 l\u00f3gica de classifica\u00e7\u00e3o no contexto digital<\/h4>\n\n\n\n<p>A categoriza\u00e7\u00e3o \u00e9 o pilar que fundamenta a cogni\u00e7\u00e3o humana, a base que permite que o nosso c\u00e9rebro processe volumes massivos de informa\u00e7\u00f5es ao agrupar <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/entidades\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/entidades\" >entidades<\/a> por semelhan\u00e7a e distinguir meticulosamente suas dessemelhan\u00e7as. Dentro da sua caixa cr\u00e2niana voc\u00ea tem a melhor m\u00e1quina de categoriza\u00e7\u00e3o j\u00e1 inventada.<\/p>\n\n\n\n<p>Em ambientes digitais e na pr\u00f3pria <a class=\"wl-entity-page-link\" title=\"Ci\u00eancias da informa\u00e7\u00e3o\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/ciencia-da-informacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/ciencia-da-informacao\" >Ci\u00eancia da Informa\u00e7\u00e3o<\/a>, essa l\u00f3gica de organiza\u00e7\u00e3o \u00e9 o que separa uma jornada de usu\u00e1rio intuitiva e enriquecedora do caos informacional absoluto.<\/p>\n\n\n\n<p>Para o arquiteto de informa\u00e7\u00e3o e o profissional de SEO, organizar a informa\u00e7\u00e3o significa mapear o modelo mental do usu\u00e1rio, de modo a reduzir o esfor\u00e7o de escolha, transformando dados brutos em ativos estruturados e rapidamente recuper\u00e1veis, com efic\u00e1cia e efici\u00eancia.<\/p>\n\n\n\n<p>Quando lidamos com algoritmos de busca modernos, como o BERT, a m\u00e1quina precisa compreender a qual &#8220;entidade&#8221; um conte\u00fado pertence para poder entreg\u00e1-lo como a melhor resposta a uma consulta. Sem uma l\u00f3gica de <a class=\"wl-entity-page-link\" title=\"Ranking\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/ranking\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/ranking\" >classifica\u00e7\u00e3o<\/a> eficiente, o conte\u00fado produzido fica invis\u00edvel e perde seu valor.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lise de tipos de conceitos e atributos<\/h4>\n\n\n\n<p>Voc\u00ea j\u00e1 ouviu falar das diretrizes NISO Z39.19?<\/p>\n\n\n\n<p>As diretrizes ANSI\/NISO Z39.19-2005 (R2010) estabelecem normas essenciais para a constru\u00e7\u00e3o, formata\u00e7\u00e3o e gest\u00e3o de <a class=\"wl-entity-page-link\" title=\"Vocabul\u00e1rio\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/vocabulario-2\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/vocabulario-2\" >vocabul\u00e1rios<\/a> controlados monol\u00edngues, incluindo tesauros, listas, synonym rings e <a class=\"wl-entity-page-link\" title=\"Taxonomia\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/taxonomia__trashed\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/taxonomia__trashed\" >taxonomias<\/a>. O foco das diretrizes \u00e9 a <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/representacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/representacao\" >representa\u00e7\u00e3o<\/a> consistente de objetos de conte\u00fado para facilitar a <a class=\"wl-entity-page-link\"  href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/recuperacao-da-informacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/recuperacao-da-informacao\" >recupera\u00e7\u00e3o da informa\u00e7\u00e3o<\/a> em sistemas de conhecimento.<\/p>\n\n\n\n<p><strong>Uma curiosidade<\/strong>: voc\u00ea sabia que pode usar a NIZO Z39.19-2005 como base para construir as novas queridinhas das ferramentas de IA, as ontologias? Acesse esse artigo em <a href=\"https:\/\/cip.brapci.inf.br\/download\/135118\" target=\"_blank\" rel=\"noopener\">cip.brapci.inf.br\/download\/135118<\/a> e leia como fazer.<\/p>\n\n\n\n<p>Voltando \u00e0 nossa conversa sobre a <a class=\"wl-entity-page-link\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/organizacao-da-informacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/organizacao-da-informacao\">organiza\u00e7\u00e3o da informa\u00e7\u00e3o<\/a>: sabemos que a estrutura\u00e7\u00e3o de um banco de dados competente e otimizado exige a identifica\u00e7\u00e3o correta de atributos e classes, o que permite a implementa\u00e7\u00e3o de buscas facetadas multidimensionais, uma funcionalidade vital para cat\u00e1logos extensos como os que vimos nos e-commerces.<\/p>\n\n\n\n<p>Com base nas diretrizes padronizadas da NISO (National Information Standards Organization), resumi os sete tipos de conceitos essenciais  que n\u00f3s, que trabalhamos com a representa\u00e7\u00e3o da informa\u00e7\u00e3o, precisamos conhecer para estruturar qualquer taxonomia:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Coisas (Things):<\/strong> referem-se a objetos f\u00edsicos, entidades palp\u00e1veis e suas partes constituintes. No com\u00e9rcio eletr\u00f4nico, pode ser um &#8220;notebook&#8221; ou um &#8220;processador&#8221;.<\/li>\n\n\n\n<li><strong>Materiais (Materials):<\/strong> subst\u00e2ncias das quais as coisas s\u00e3o formadas. Por exemplo, especifica\u00e7\u00f5es como &#8220;alum\u00ednio&#8221;, &#8220;vidro&#8221; ou &#8220;sil\u00edcio&#8221;.<\/li>\n\n\n\n<li><strong>Atividades (Activities):<\/strong> processos, a\u00e7\u00f5es ou opera\u00e7\u00f5es executadas. No ambiente da web, representam intera\u00e7\u00f5es, como &#8220;comprar&#8221;, &#8220;avaliar&#8221;, &#8220;comparar&#8221; e &#8220;compartilhar&#8221;.<\/li>\n\n\n\n<li><strong>Eventos (Events):<\/strong> ocorr\u00eancias ou fen\u00f4menos situados no tempo, como &#8220;Black Friday&#8221;, &#8220;<a href=\"https:\/\/semantico.com.br\/curso-seo-semantico.html\" target=\"_blank\" rel=\"noreferrer noopener\">Curso de SEO<\/a>&#8221; ou &#8220;Lan\u00e7amento de Campanha&#8221;.<\/li>\n\n\n\n<li><strong>Propriedades (Properties):<\/strong> caracter\u00edsticas, estados ou qualidades inerentes a um objeto. Pode ser o tamanho, a cor prim\u00e1ria, o peso exato ou a capacidade de armazenamento.<\/li>\n\n\n\n<li><strong>Disciplinas (Disciplines):<\/strong> \u00e1reas de estudo ou amplos ramos do conhecimento. Aqui entram categorias tem\u00e1ticas abrangentes, como &#8220;Biblioteconomia&#8221;, &#8220;Engenharia de Software&#8221; e &#8220;Marketing Digital&#8221;.<\/li>\n\n\n\n<li><strong>Medidas (Measures):<\/strong> unidades de dimens\u00e3o, escala ou quantidade, como &#8220;cent\u00edmetros&#8221;, &#8220;gigabytes&#8221;, &#8220;quil\u00f4metros&#8221; ou moedas financeiras.<\/li>\n<\/ul>\n\n\n\n<p>Perceba que, de posse dessas sete categorias, voc\u00ea j\u00e1 pode organizar toda a informa\u00e7\u00e3o de um cat\u00e1logo de produtos. Trabalhe em conjunto com o seu time de desenvolvimento de sistemas ou software e vai poder criar um sistema de busca ou de sugest\u00e3o de produtos de ponta.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Crit\u00e9rios de Semelhan\u00e7a e Dessemelhan\u00e7a: o impacto estrat\u00e9gico na recupera\u00e7\u00e3o de dados<\/h4>\n\n\n\n<p>Antes de seguir em frente, preciso tratar desses dois conceitos sob o ponto de vista da ci\u00eancia da informa\u00e7\u00e3o. Precisamos entender que os conceitos de semelhan\u00e7a e dessemelhan\u00e7a fazem parte dos fundamentos da organiza\u00e7\u00e3o, da recupera\u00e7\u00e3o e da representa\u00e7\u00e3o da informa\u00e7\u00e3o. Eles n\u00e3o s\u00e3o apenas percep\u00e7\u00f5es subjetivas, mas uma forma pr\u00e1tica que permite que sistemas (humanos ou artificiais) identifiquem rela\u00e7\u00f5es entre documentos, <a class=\"wl-entity-page-link\" title=\"palavras-chave\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/palavra-chave\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/palavra-chave\">termos<\/a> ou entidades.<\/p>\n\n\n\n<p>Ent\u00e3o eu apresento uma defini\u00e7\u00e3o t\u00e9cnica e reflexiva sobre esses dois conceitos:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"semelhanca_similarity\"><\/span>Semelhan\u00e7a (similarity)<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>A semelhan\u00e7a \u00e9 o grau de correspond\u00eancia, proximidade ou afinidade entre dois objetos informacionais. Na Ci\u00eancia da Informa\u00e7\u00e3o, ela \u00e9 frequentemente tratada sob duas perspectivas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Semelhan\u00e7a estrutural:<\/strong> foca na forma ou na ocorr\u00eancia f\u00edsica dos elementos (ex.: dois artigos que compartilham as mesmas palavras-chave).<\/li>\n\n\n\n<li><strong>Semelhan\u00e7a sem\u00e2ntica:<\/strong> foca no sentido. Ocorre quando dois termos ou documentos tratam do mesmo conceito, mesmo que utilizem linguagens ou termos diferentes (sinon\u00edmia).<\/li>\n<\/ul>\n\n\n\n<p>Matematicamente, a semelhan\u00e7a \u00e9 frequentemente calculada em um <strong>espa\u00e7o vetorial<\/strong> (<em>te lembra de como funcionam os modelos de IA?<\/em>), em que os documentos s\u00e3o representados por vetores. A m\u00e9trica mais comum \u00e9 a <strong>similaridade de cosseno<\/strong>, que mede o \u00e2ngulo entre dois vetores:<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mtext>sim<\/mtext><mo form=\"prefix\" stretchy=\"false\">(<\/mo><mi>A<\/mi><mo separator=\"true\">,<\/mo><mi>B<\/mi><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mo>=<\/mo><mrow><mi>cos<\/mi><mo>\u2061<\/mo><\/mrow><mo form=\"prefix\" stretchy=\"false\">(<\/mo><mi>\u03b8<\/mi><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mo>=<\/mo><mfrac><mrow><mi>A<\/mi><mo>\u22c5<\/mo><mi>B<\/mi><\/mrow><mrow><mi>\u2016<\/mi><mi>A<\/mi><mi>\u2016<\/mi><mi>\u2016<\/mi><mi>B<\/mi><mi>\u2016<\/mi><\/mrow><\/mfrac><\/mrow><annotation encoding=\"application\/x-tex\">\\text{sim}(A, B) = \\cos(\\theta) = \\frac{A \\cdot B}{\\|A\\| \\|B\\|}<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>Quanto mais pr\u00f3ximo de 1, maior a semelhan\u00e7a entre os objetos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"dessemelhanca_dissimilarity\"><\/span>Dessemelhan\u00e7a (dissimilarity)<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>A dessemelhan\u00e7a \u00e9 a medida de afastamento, diferen\u00e7a ou diverg\u00eancia entre objetos. Na pr\u00e1tica, ela \u00e9 o inverso da semelhan\u00e7a, mas possui um valor estrat\u00e9gico fundamental na <strong>categoriza\u00e7\u00e3o e classifica\u00e7\u00e3o<\/strong>.<\/p>\n\n\n\n<p>Enquanto a semelhan\u00e7a agrupa, a dessemelhan\u00e7a separa, sendo \u00e9 essencial para:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Evitar redund\u00e2ncia:<\/strong> em sistemas de busca, mostrar resultados muito semelhantes pode ser ineficiente; a dessemelhan\u00e7a ajuda a garantir a diversidade dos resultados.<\/li>\n\n\n\n<li><strong>Identifica\u00e7\u00e3o de outliers:<\/strong> detectar informa\u00e7\u00f5es que n\u00e3o se enquadram em nenhum padr\u00e3o estabelecido.<\/li>\n<\/ul>\n\n\n\n<p>Em termos m\u00e9tricos, a dessemelhan\u00e7a \u00e9 frequentemente expressa como uma &#8220;dist\u00e2ncia&#8221;. A <strong>dist\u00e2ncia euclidiana<\/strong> \u00e9 uma das formas de calcular essa diverg\u00eancia:<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>d<\/mi><mo form=\"prefix\" stretchy=\"false\">(<\/mo><mi>x<\/mi><mo separator=\"true\">,<\/mo><mi>y<\/mi><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mo>=<\/mo><msqrt><mrow><mrow><munderover><mo movablelimits=\"false\">\u2211<\/mo><mrow><mi>i<\/mi><mo>=<\/mo><mn>1<\/mn><\/mrow><mi>n<\/mi><\/munderover><\/mrow><mo form=\"prefix\" stretchy=\"false\">(<\/mo><msub><mi>x<\/mi><mi>i<\/mi><\/msub><mo>\u2212<\/mo><msub><mi>y<\/mi><mi>i<\/mi><\/msub><msup><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mn>2<\/mn><\/msup><\/mrow><\/msqrt><\/mrow><annotation encoding=\"application\/x-tex\">d(x, y) = \\sqrt{\\sum_{i=1}^{n} (x_i &#8211; y_i)^2}<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>A dial\u00e9tica entre semelhan\u00e7a e dessemelhan\u00e7a permite a cria\u00e7\u00e3o de <strong>taxonomias e ontologias<\/strong>.<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li><strong>Agrupamento (clustering):<\/strong> objetos com alta semelhan\u00e7a interna e alta dessemelhan\u00e7a externa formam uma classe ou categoria s\u00f3lida.<\/li>\n\n\n\n<li><strong>Carga cognitiva:<\/strong> uma organiza\u00e7\u00e3o de informa\u00e7\u00f5es eficiente utiliza esses conceitos para reduzir o esfor\u00e7o mental do usu\u00e1rio. Quando a semelhan\u00e7a entre as op\u00e7\u00f5es de um menu \u00e9 muito alta (ambiguidade), a carga cognitiva aumenta, pois o usu\u00e1rio n\u00e3o consegue distinguir a rota correta.<\/li>\n\n\n\n<li><strong>Recupera\u00e7\u00e3o de informa\u00e7\u00e3o:<\/strong> motores de busca modernos utilizam <strong>processamento de linguagem natural (nlp)<\/strong> e <strong>modelos de linguagem de grande escala<\/strong> para refinar essa percep\u00e7\u00e3o, indo al\u00e9m da simples contagem de palavras para entender a &#8220;proximidade conceitual&#8221;.<\/li>\n<\/ol>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Ponto de reflex\u00e3o:<\/strong> na ci\u00eancia da informa\u00e7\u00e3o, nada \u00e9 &#8220;igual&#8221;, apenas &#8220;altamente semelhante&#8221;. A identidade absoluta \u00e9 rara; trabalhamos sempre com graus de aproxima\u00e7\u00e3o que definem a relev\u00e2ncia de uma resposta para uma consulta.<\/p>\n<\/blockquote>\n\n\n\n<h4 class=\"wp-block-heading\">Formando grupos por semelhan\u00e7a ou dessemelhan\u00e7a<\/h4>\n\n\n\n<p>A forma\u00e7\u00e3o de grupos l\u00f3gicos, sem\u00e2nticos e funcionais depende estritamente da distin\u00e7\u00e3o entre as caracter\u00edsticas intr\u00ednsecas (o que o objeto ou a entidade realmente \u00e9 em sua ontologia) e extr\u00ednsecas (como ele \u00e9 utilizado, percebido ou aplicado pelo usu\u00e1rio final). A falha em definir e isolar esses crit\u00e9rios gera um imenso &#8220;ru\u00eddo&#8221; algor\u00edtmico, prejudicando os rastreadores (crawlers) e degradando severamente a precis\u00e3o da busca.<\/p>\n\n\n\n<p><strong>Mas vamos esclarecer esses conceitos complicados.<\/strong><\/p>\n\n\n\n<p>Eu costumo dizer que um e-commerce sem uma distin\u00e7\u00e3o clara entre o que <strong>um produto \u00e9<\/strong> e o que <strong>um produto representa<\/strong> \u00e9 apenas um dep\u00f3sito digital, n\u00e3o uma estrat\u00e9gia de vendas.<\/p>\n\n\n\n<p>Vamos usar um exemplo de uma garrafa t\u00e9rmica de alta procura (como uma Stanley ou similar). Imagine que estamos organizando a taxonomia e a sem\u00e2ntica dessa loja:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"a_visao_intrinseca_a_ontologia_do_objeto\"><\/span>A vis\u00e3o intr\u00ednseca (a ontologia do objeto)<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Aqui, o grupo \u00e9 formado pela semelhan\u00e7a do que o objeto \u00e9 de fato. N\u00e3o importa quem compra ou para qu\u00ea.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Caracter\u00edsticas:<\/strong> a\u00e7o inoxid\u00e1vel, isolamento a v\u00e1cuo, capacidade de 500 ml, tampa rosque\u00e1vel.<\/li>\n\n\n\n<li><strong>Agrupamento l\u00f3gico:<\/strong> cozinha &gt; recipientes &gt; garrafas t\u00e9rmicas.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"a_visao_extrinseca_a_percepcao_e_aplicacao_do_usuario\"><\/span>A vis\u00e3o extr\u00ednseca (a percep\u00e7\u00e3o e aplica\u00e7\u00e3o do usu\u00e1rio)<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Aqui, a dessemelhan\u00e7a f\u00edsica \u00e9 ignorada em favor da semelhan\u00e7a funcional. O grupo \u00e9 formado pelo <strong>contexto<\/strong>.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Cen\u00e1rio A<\/strong> (<em>o entusiasta de camping<\/em>): a garrafa \u00e9 agrupada com barracas, sacos de dormir e lanternas. Ela n\u00e3o &#8220;parece&#8221; uma barraca, mas serve ao mesmo prop\u00f3sito extr\u00ednseco: sobreviv\u00eancia e conforto <em>outdoor<\/em>.<\/li>\n\n\n\n<li><strong>Cen\u00e1rio B (<\/strong><em>o profissional de escrit\u00f3rio<\/em><strong>):<\/strong> a garrafa \u00e9 agrupada com agendas, organizadores de mesa e mouses ergon\u00f4micos. Aqui, ela \u00e9 um acess\u00f3rio de produtividade e status.<\/li>\n<\/ul>\n\n\n\n<p>Na minha experi\u00eancia profissional, percebi que o erro comum \u00e9 tentar for\u00e7ar o usu\u00e1rio a pensar apenas na ontologia (intr\u00ednseca). Se o seu cliente quer &#8220;presentes para pais aventureiros&#8221;, ele n\u00e3o quer navegar por &#8220;a\u00e7o inoxid\u00e1vel &gt; 500 ml&#8221;.<\/p>\n\n\n\n<p>Se a arquitetura da informa\u00e7\u00e3o n\u00e3o reflete essa carga cognitiva do usu\u00e1rio, que busca por <strong>uso<\/strong> e n\u00e3o por <strong>mat\u00e9ria-prima<\/strong>, o sistema de busca interna falha, o NLP n\u00e3o consegue conectar os pontos e a convers\u00e3o despenca. A semelhan\u00e7a extr\u00ednseca \u00e9 o que gera o desejo; a intr\u00ednseca \u00e9 o que valida a compra t\u00e9cnica.<\/p>\n\n\n\n<p>Ent\u00e3o, estrategicamente, se os atributos categorizados forem amb\u00edguos, a consulta ao banco de dados ou a um motor de busca retornar\u00e1 resultados fora de contexto, for\u00e7ando o visitante a uma filtragem manual e extremamente exaustiva, o que, invariavelmente, aumenta a <a class=\"wl-entity-page-link\" title=\"Bounce Rate\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/taxa-de-rejeicao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/taxa-de-rejeicao\">taxa de rejei\u00e7\u00e3o<\/a>.<\/p>\n\n\n\n<p>A identifica\u00e7\u00e3o rigorosa daqueles atributos NISO \u00e9 um dos fatores que permitem que um sistema de navega\u00e7\u00e3o facetada diferencie perfeitamente &#8220;Atividades&#8221; de &#8220;Disciplinas&#8221; nos filtros de <a class=\"wl-entity-page-link\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/navegacao\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/navegacao\">navega\u00e7\u00e3o<\/a> lateral.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">O papel da extra\u00e7\u00e3o de entidades no conte\u00fado<\/h4>\n\n\n\n<p>Outro ponto indispens\u00e1vel nesses fundamentos \u00e9 a &#8220;Extra\u00e7\u00e3o de Entidade&#8221; (Entity Extraction). No SEO Sem\u00e2ntico, precisamos identificar constantemente entidades (pessoas, lugares, organiza\u00e7\u00f5es, conceitos) presentes no texto completo de um documento e garantir que elas se alinem aos conceitos identificados na an\u00e1lise do dom\u00ednio do conhecimento e \u00e0 taxonomia criada para o site.<\/p>\n\n\n\n<p>Ao aplicarmos rotinas de Processamento de Linguagem Natural, fazemos infer\u00eancias precisas sobre essas entidades, consolidando o dom\u00ednio sem\u00e2ntico da <a class=\"wl-entity-page-link\" title=\"P\u00e1ginas\" href=\"https:\/\/semantico.com.br\/blog\/Vocabulario\/pagina-web\/\" data-id=\"http:\/\/data.wordlift.io\/wl0221\/entity\/pagina-web\">p\u00e1gina<\/a> e atestando ao buscador que nosso conte\u00fado \u00e9 uma autoridade s\u00f3lida nesse campo de conhecimento. O SEO Sem\u00e2ntico j\u00e1 usava IA no SEO muito antes desse assunto virar moda.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p>Essa \u00e9 a primeira parte do artigo que trata sobre como a arquitetura da informa\u00e7\u00e3o \u00e9 importante para projetos de SEO. <strong>A segunda parte vai ser publicada em breve.<\/strong><\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<figure class=\"wp-block-image alignwide size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1920\" height=\"1080\" src=\"https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO.png\" alt=\"\" class=\"wp-image-9249\" title=\"\" srcset=\"https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO.png 1920w, https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO-600x338.png 600w, https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO-768x432.png 768w, https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO-100x56.png 100w, https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO-1536x864.png 1536w, https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2025\/10\/Curso-SEO-Semantico-Semantico-SEO-1200x675.png 1200w\" sizes=\"auto, (max-width: 1920px) 100vw, 1920px\" \/><\/figure>\n\n\n\n<div class=\"wp-block-columns are-vertically-aligned-center is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-vertically-aligned-center is-layout-flow wp-block-column-is-layout-flow\">\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button has-custom-width wp-block-button__width-100\"><a class=\"wp-block-button__link has-white-color has-text-color has-background wp-element-button\" href=\"https:\/\/semantico.com.br\/curso-seo-semantico.html\" style=\"background-color:#590050\" target=\"_blank\" rel=\"noreferrer noopener\">Saiba Mais<\/a><\/div>\n<\/div>\n<\/div>\n<\/div>\n\n\n","protected":false},"excerpt":{"rendered":"<p>Neste artigo, vou escrever sobre um assunto que, \u00e0 primeira vista, parece distante do SEO. Costumeiramente falamos sobre assuntos t\u00e9cnicos, indexa\u00e7\u00e3o, updates de algoritmo e mais recentemente de IA. Mas \u00e9 sobre outro tipo de IA que quero tratar aqui: a Arquitetura da Informa\u00e7\u00e3o. Mas vamos tratar sob um novo ponto de vista: vem comigo! [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":9602,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"wl_entities_gutenberg":"","episode_type":"","audio_file":"","podmotor_file_id":"","podmotor_episode_id":"","cover_image":"","cover_image_id":"","duration":"","filesize":"","filesize_raw":"","date_recorded":"","explicit":"","block":"","itunes_episode_number":"","itunes_title":"","itunes_season_number":"","itunes_episode_type":"","footnotes":""},"categories":[623],"tags":[],"wl_entity_type":[51],"series":[],"class_list":["post-9306","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-organizacao-do-conhecimento","wl_entity_type-article"],"episode_featured_image":"https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2026\/03\/O-custo-invisivel-da-desordem.webp","episode_player_image":"https:\/\/semantico.com.br\/blog\/wp-content\/uploads\/2026\/03\/Capa-podcast.png","download_link":"","player_link":"","audio_player":false,"episode_data":{"playerMode":"dark","subscribeUrls":{"apple_podcasts":{"key":"apple_podcasts","url":"","label":"Apple Podcasts","class":"apple_podcasts","icon":"apple-podcasts.png"},"google_podcasts":{"key":"google_podcasts","url":"","label":"Google Podcasts","class":"google_podcasts","icon":"google-podcasts.png"},"pocketcasts":{"key":"pocketcasts","url":"","label":"PocketCasts","class":"pocketcasts","icon":"pocketcasts.png"},"podbean":{"key":"podbean","url":"","label":"Podbean","class":"podbean","icon":"podbean.png"},"stitcher":{"key":"stitcher","url":"","label":"Stitcher","class":"stitcher","icon":"stitcher.png"},"iheartradio":{"key":"iheartradio","url":"","label":"iHeartRadio","class":"iheartradio","icon":"iheartradio.png"}},"rssFeedUrl":"https:\/\/semantico.com.br\/blog\/feed\/podcast\/seo-semantico-podcast","embedCode":"<blockquote class=\"wp-embedded-content\" data-secret=\"o5OcTluQGr\"><a href=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/\">O custo invis\u00edvel da desordem: como a arquitetura da informa\u00e7\u00e3o estanca preju\u00edzos com SEO<\/a><\/blockquote><iframe sandbox=\"allow-scripts\" security=\"restricted\" src=\"https:\/\/semantico.com.br\/blog\/o-custo-invisivel-da-desordem-como-a-arquitetura-da-informacao-estanca-prejuizos-com-seo\/embed\/#?secret=o5OcTluQGr\" width=\"500\" height=\"350\" title=\"&#8220;O custo invis\u00edvel da desordem: como a arquitetura da informa\u00e7\u00e3o estanca preju\u00edzos com SEO&#8221; &#8212; Blog Sem\u00e2ntico\" data-secret=\"o5OcTluQGr\" frameborder=\"0\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\" class=\"wp-embedded-content\"><\/iframe><script type=\"text\/javascript\">\n\/* <![CDATA[ *\/\n\/*! This file is auto-generated *\/\n!function(d,l){\"use strict\";l.querySelector&&d.addEventListener&&\"undefined\"!=typeof URL&&(d.wp=d.wp||{},d.wp.receiveEmbedMessage||(d.wp.receiveEmbedMessage=function(e){var t=e.data;if((t||t.secret||t.message||t.value)&&!\/[^a-zA-Z0-9]\/.test(t.secret)){for(var s,r,n,a=l.querySelectorAll('iframe[data-secret=\"'+t.secret+'\"]'),o=l.querySelectorAll('blockquote[data-secret=\"'+t.secret+'\"]'),c=new RegExp(\"^https?:$\",\"i\"),i=0;i<o.length;i++)o[i].style.display=\"none\";for(i=0;i<a.length;i++)s=a[i],e.source===s.contentWindow&&(s.removeAttribute(\"style\"),\"height\"===t.message?(1e3<(r=parseInt(t.value,10))?r=1e3:~~r<200&&(r=200),s.height=r):\"link\"===t.message&&(r=new URL(s.getAttribute(\"src\")),n=new URL(t.value),c.test(n.protocol))&&n.host===r.host&&l.activeElement===s&&(d.top.location.href=t.value))}},d.addEventListener(\"message\",d.wp.receiveEmbedMessage,!1),l.addEventListener(\"DOMContentLoaded\",function(){for(var e,t,s=l.querySelectorAll(\"iframe.wp-embedded-content\"),r=0;r<s.length;r++)(t=(e=s[r]).getAttribute(\"data-secret\"))||(t=Math.random().toString(36).substring(2,12),e.src+=\"#?secret=\"+t,e.setAttribute(\"data-secret\",t)),e.contentWindow.postMessage({message:\"ready\",secret:t},\"*\")},!1)))}(window,document);\n\/\/# sourceURL=https:\/\/semantico.com.br\/blog\/wp-includes\/js\/wp-embed.min.js\n\/* ]]> *\/\n<\/script>\n"},"_wl_alt_label":[],"wl:entity_url":"http:\/\/data.wordlift.io\/wl0221\/post\/-9306","_links":{"self":[{"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/posts\/9306","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/comments?post=9306"}],"version-history":[{"count":0,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/posts\/9306\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/media\/9602"}],"wp:attachment":[{"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/media?parent=9306"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/categories?post=9306"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/tags?post=9306"},{"taxonomy":"wl_entity_type","embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/wl_entity_type?post=9306"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/semantico.com.br\/blog\/wp-json\/wp\/v2\/series?post=9306"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}