Por que a IA generativa nos força a repensar o SEO?

Por qué la IA generativa nos obliga a repensar el SEO

Entramos en la era de las respuestas y presenciamos la muerte de las fuentes. En este artículo, vamos a teorizar sobre las diversas nociones de búsqueda, sus recursos y su evaluación a la luz de la IA generativa.

Vivimos un momento de inflexión en la historia de la Web. La introducción masiva de modelos de lenguaje de gran tamaño (LLMs), como Gemini, y su integración directa en los motores de búsqueda desafiaron décadas de conceptos establecidos. Para nosotros, profesionales de SEO, el cambio es comparable a un terremoto. Repensamos de manera fundamental la forma en que concebimos la búsqueda, las fuentes y la evaluación.

El SEO cambió para siempre

Durante años, el mantra del SEO fue “crear contenido de calidad” para que Google nos considerara una fuente con autoridad (authoritative source) y nos presentara al usuario. Pero, como señala un artículo reciente de Olaf Sundon, profesor de estudios de la información, surge una pregunta fundamental: “¿Qué sucede cuando los sistemas de información con IA proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?”

Antes te invito a ver el video a continuación:

(Video embed)

El video analiza el artículo de conferencia “Theorising Notions of Searching, (Re)Sources, & Evaluation in Light of Generative AI”, de Olaf Sundon, profesor de estudios de la información. El objetivo principal del artículo es discutir los conceptos de búsqueda, fuentes y evaluación en una infraestructura de información cada vez más influida por la inteligencia artificial generativa.

Se hace una distinción crucial entre la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (hechos o información directa). En el artículo, Sundon utiliza un enfoque sociomaterial, tratando la información no como algo abstracto, sino como un participante activo en la construcción de nuestro mundo, citando ejemplos históricos como los de Suzanne Brier y Paul Otlet. Se presenta una historia técnica de las infraestructuras de búsqueda, desde las bibliotecas antiguas y los catálogos de fichas hasta los motores de búsqueda de internet y sus evoluciones.

Después de leer el artículo, que encontré gracias al video que te invité a ver, me hice tres preguntas:

  1. ¿Qué sucede cuando los sistemas de información con IA proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?
  2. ¿Podemos comparar la noción positivista de Otlet de extraer hechos abstractos de documentos (o fuentes de información) con la tendencia creciente de los sistemas de información a proporcionar respuestas en lugar de fuentes?
  3. ¿Cómo puede una comprensión sociomaterial de la información ayudarnos a entender la infraestructura de información cada vez más infundida por la IA desde la perspectiva de la biblioteconomía y la ciencia de la información?

Movido por estas preguntas, inspirado por este artículo y el video que lo explica, decidí sumergirme de lleno en esta cuestión.

Te invito a explorar el análisis teórico de Sundon y conectarlo directamente con nuestro trabajo de SEO Semántico. La infraestructura de la información está cambiando y nuestra capacidad de ser encontrados (nuestro discoverability) depende de que entendamos este cambio.

Desde que existen sistemas de información, bibliotecas e instituciones similares para organizar información, los principios y métodos para presentar y encontrar información desempeñan un papel fundamental. Existen bibliografías, listas, catálogos de fichas, índices de libros, OPACs, sistemas de clasificación, tesauros con vocabularios controlados, portales web, bases de datos bibliográficas, sistemas de gestión de referencias y así sucesivamente. Estos sistemas organizan y controlan el acceso a las fuentes de información. Tecnologías nuevas y antiguas a menudo se fusionan. Los mecanismos de búsqueda en la web dependen de su índice, que contiene solo parte de la web. Esto significa que, cuando usamos la Búsqueda de Google, estamos buscando en un índice, no en la web en línea, y el tamaño y la actualidad del índice son criterios centrales de calidad (Lewandowski, 2023, p. 41). Estos sistemas de información siempre traen consigo una perspectiva particular, una visión del mundo, ya sea la representación de temas en catálogos de bibliotecas (Olson, 2002), mecanismos de búsqueda en la web (Lewandowski, 2023, p. 265; Noble, 2018) o IA generativa (Sun et al., 2024).

SUNDIN, Olof. Theorising notions of searching, (re)sources and evaluation in the light of generative AI. Information Research: an international electronic journal, [S. l.], v. 30, p. 291-302, 2025. DOI: 10.47989/ir30CoLIS52258.

La tradición de la recuperación de la información y la búsqueda de fuentes

Para entender la ruptura, primero necesitamos definir qué es lo que rompe. La tradición predominante de la Biblioteconomía y Ciencia de la Información (LIS) y, por extensión, del SEO tradicional, siempre ha sido construir sistemas que proporcionan al usuario una fuente de información.

Como nos recuerda el artículo de Sundon y Hartel, la historia técnica de la búsqueda comienza con bibliotecas y catálogos de fichas. Cuando ibas a una biblioteca, el bibliotecario (o el catálogo) no te daba la “respuesta”; te daba un libro, un documento o una publicación periódica. Te dirigía a la fuente. La información estaba contenida en un documento.

Los motores de búsqueda de internet, en su concepción original, siguieron exactamente este modelo.

Un mecanismo de búsqueda como Google era, y en gran parte sigue siendo, un sistema de recuperación de información que rastrea, indexa y clasifica documentos (páginas web). El trabajo de SEO consistía en garantizar que nuestro documento fuera considerado la fuente más pertinente para una consulta específica. El producto final era un enlace a una página.

Había una distinción clara: entre la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (hechos o información directa). El trabajo del SEO consistía en ser el mejor intermediario.

El cambio semántico: del enlace a la respuesta directa

Esta distinción comenzó a difuminarse mucho antes de la IA generativa. Como señala el propio artículo de Sundon, Google inició un cambio sustancial en 2012. Este cambio marcó la introducción del Knowledge Graph (o grafo de conocimiento).

¿Quieres saber más sobre las actualizaciones del algoritmo de Google?

Google dejó de ser solo un “indexador de páginas” para convertirse en un “organizador de hechos”. Comenzó la transición de un motor de búsqueda a un motor de respuestas. Vimos, entonces, el nacimiento de lo que hoy llamamos SEO semántico.

Esta transición tiene raíces en ideas muy anteriores, como las de Paul Otlet, quien soñaba con extraer “hechos abstractos” de documentos para crear un “libro universal del conocimiento”. El Knowledge Graph de Google materializa digitalmente esa idea positivista. Pasó a mostrar “respuestas directas”, como los Featured Snippets.

Desde entonces, nuestro trabajo como profesionales de SEO ha cambiado. Fue en esa época cuando entendí que ya no bastaba con optimizar para las keywords. Después de años de intentos y frustración, entendí cómo estructurar los datos de los proyectos, conectar sus entidades usando datos estructurados, pero solo más tarde descubrí cómo usar taxonomías y ontologías en ese proceso. Uno de los objetivos pasó a ser alimentar el Grafo de Conocimiento de Google con mi información. ¡En ese momento nació el Flujo de Trabajo Semántico!

Sin embargo, incluso en ese modelo, la fuente todavía era (generalmente) visible en las SERPs. El Featured Snippet contenía un enlace. El Knowledge Panel citaba fuentes como Wikipedia. Pero entonces llegó la IA generativa, que representa la cúspide de un cambio radical, y aquí es donde la conexión con la fuente se rompe.

La ruptura generativa y las respuestas sin fuentes rastreables

El artículo de Olaf Sundon identifica con precisión la diferencia entre un motor de búsqueda tradicional y una aplicación de LLM.

  1. Motores de búsqueda tradicionales: proporcionan enlaces a documentos. Son sistemas de recuperación.
  2. Chatbots de IA generativa: generan contenido. Son sistemas de generación.

Shah y Bender (2022) observan que esta nueva interacción conversacional “tiene el costo del acceso directo a las fuentes”. El resultado de la IA generativa está “desprovisto de conexiones rastreables a las fuentes”. Esto se relaciona con cómo construyeron los modelos o, más aún, con cómo funciona el Transformer.

Esto es lo que Bender et al. (2021) llamaron “loro estocástico”, un término que se hizo muy conocido. Como explica el video de Hartel, el LLM no “entiende” el significado en el sentido humano. Es un modelo estadístico entrenado para generar “secuencias de palabras que suenan plausibles” a partir de los patrones observados en sus datos de entrenamiento.

El resultado parece coherente, pero no posee significado real ni una conexión verificable con una fuente estable. Para la ciencia de la información, esto es una “ruptura significativa”. Para el SEO, es una pesadilla de atribución.

La crisis de la evaluación

¿Cómo confiar en un loro?

El argumento principal del artículo de Sundon es que, con este cambio, “las fuentes se vuelven cada vez más invisibles”. Esto nos lleva al próximo pilar que se derrumbó: la evaluación.

La alfabetización informacional tradicional, como el método SIFT (Stop, Investigate the source, Find better coverage, Trace claims), se basa enteramente en la capacidad de investigar la fuente.

Cuando manejamos la información recuperada, preguntamos:

  • ¿Quién es el autor?
  • ¿Cuál es la reputación de esta publicación?
  • ¿Cuál es la fecha de publicación?
  • ¿Cuáles son sus fuentes?

Como señala el artículo que originó mi investigación, el ascenso de la IA generativa vuelve esta evaluación tradicional “casi imposible”. Cuando un LLM genera una respuesta, no hay autor. No hay fecha de publicación. No hay “origen de la fuente” más allá del propio modelo.

Desde que Sundon escribió su texto hasta hoy, Google ha implementado algunos cambios, principalmente. Ahora tenemos, la mayoría de las veces (limitado a los modos AI Overview y Modo IA), la cita de las fuentes, pero de forma descontextualizada, ya que no sabemos exactamente qué parte del texto de cada fuente fue responsable de la generación por IA.

El usuario recibe un texto que suena plausible, pero puede ser una “alucinación”: un collage estadístico de hechos descontextualizados, factualmente incorrectos, pero que parecen verdad. El problema es que, sin una fuente para rastrear (trace), el usuario no sabe cómo saberlo.

Esto tiene implicaciones profundas para estudiantes, investigadores y, por supuesto, para el público en general. ¿Cómo podemos navegar teóricamente este escenario? La respuesta, para mí, está en redoblar la apuesta por los principios del SEO Semántico.

El papel del SEO semántico en la recuperación de la información en la era generativa

Si la IA generativa es el nuevo intermediario, ¿cómo garantizamos nosotros, creadores de contenido y propietarios de sitios, que encuentren nuestra información y, con suerte, nos den crédito?

La respuesta no es intentar “engañar” al LLM. O recalentar estrategias antiguas, sino en convertir nuestro contenido en la fuente de datos más limpia, estructurada y semánticamente rica posible para el entrenamiento y la indexación (indexing) de estos modelos.

Es aquí donde la Recuperación de la Información se encuentra con el SEO Semántico.

Cuando hablo de SEO semántico, me refiero a enfocarnos en el significado, a estructurar la información y a moldear el contenido de modo que los algoritmos puedan entenderlo conceptualmente. Hablo de aplicar un modelo de trabajo semántico de principio a fin.

Esta es la nueva realidad. El SEO se ha vuelto infinitamente más complejo. La SERP, compuesta por un “ranking” de enlaces, está muriendo lentamente y nosotros estamos optimizando para ser la fuente de hechos más confiable y semánticamente comprensible para los algoritmos que alimentan los modelos de IA.

Siento si te generé ansiedad. Después de todo, ¿cómo hacemos esto?

Para eso estoy creando el Curso de SEO Semántico – El Flujo de Trabajo Semántico. Te invito a seguirme en LinkedIn; por allí iré actualizando sobre su lanzamiento.

La responsabilidad de la fuente en la nueva Web Semántica

El artículo de Olaf Sundon y el análisis de Jenna Hartel son una alerta determinante para la comunidad de ciencia de la información. Pero yo argumento que es una alerta aún más urgente para nosotros, los profesionales de SEO.

Estamos entrando en una era en la que la información se divorcia de su origen. La consecuencia de esto es la erosión de la confianza. Si un LLM me da una respuesta incorrecta, ¿a quién culpo? ¿Cómo lo corrijo? La “caja negra” del “loro estocástico” está herméticamente cerrada.

El artículo de Sundon termina con una observación esencial: “No dar las fuentes de nuestras afirmaciones era complicado antes, pero podíamos hacer el camino inverso y llegar a la fuente. Hoy, con la generativa, no siempre es posible. Entonces, todo el mundo que tiene compromiso con la información de calidad necesita proporcionar las fuentes de sus afirmaciones.”

Como profesionales de SEO, nuestro papel evolucionó de “constructores de enlaces” (link builders) a “arquitectos de la información”. Ahora, debemos convertirnos en “curadores del conocimiento”.

Nuestro trabajo no es solo lograr que Google encuentre nuestro sitio; es garantizar que la IA tenga acceso a hechos verificables y estructurados. Y, lo más importante de todo, debemos abogar y construir sistemas que expongan sus fuentes, que recompensen la transparencia y que permitan al usuario hacer lo que la biblioteconomía y la ciencia de la información siempre defendieron: evaluar la fuente de la información.

Curso SEO Semantico Semantico SEO

Olá, eu sou o Alexander Rodrigues Silva, especialista SEO e autor do livro "SEO Semântico: Fluxo de trabalho semântico". Atuo há mais de duas décadas no universo digital, com foco em otimização de sites desde 2009. Minhas escolhas me levaram a aprofundar na intersecção entre experiência do usuário e estratégias de marketing de conteúdo, sempre com o foco no aumento do tráfego orgânico no longo prazo.Minhas pesquisas e especialização se concentram no SEO Semântico, onde investigo e aplico a semântica e os dados conectados na otimização de websites. É um campo fascinante que me permite unir minha formação em publicidade com a biblioteconomia.Nesta minha segunda graduação, em Biblioteconomia e Ciência da Informação, busco expandir meus conhecimentos em Indexação, Classificação e Categorização da Informação, por ver uma conexão intrínseca e de grande aplicação desses conceitos ao trabalho de SEO. Tenho pesquisado e conectado ferramentas da Biblioteconomia (como Análise de Domínio, Vocabulário Controlado, Taxonomias e Ontologias) com as novas ferramentas da Inteligência Artificial (AI) e os Modelos de linguagem de grande escala (LLMs), explorando desde Grafos de Conhecimento até o papel dos Agentes autônomos.No meu papel de consultor em SEO, busco trazer uma nova perspectiva para a otimização, integrando a visão de longo prazo, a engenharia de conteúdo e as possibilidades que a inteligência artificial oferece. Para mim, o trabalho de SEO é uma estratégia que precisa estar alinhada com os objetivos do seu negócio, mas que exige um conhecimento profundo sobre o funcionamento dos motores de busca e uma capacidade de entender os resultados da pesquisa.

Publicar comentário

Blog Semântico
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.