Por qué la IA generativa nos obliga a replantearnos el SEO
Entramos en la era de las respuestas y presenciamos la desaparición de las fuerzas dominantes. En este artículo, teorizaremos sobre las distintas nociones de búsqueda, sus recursos y su evaluación a la luz de la IA generativa.
Estamos viviendo un momento crucial en la historia de la web. La introducción masiva de grandes modelos de lenguaje (LLM), como Gemini, y su integración directa en los motores de búsqueda han puesto en entredicho décadas de conceptos establecidos. Para nosotros, los profesionales del SEO, el cambio es comparable a un terremoto. Nos replanteamos radicalmente la forma en que concebimos la búsqueda, sus fuentes y su evaluación.
El SEO cambió para siempre
Durante años, el mantra del SEO ha sido «crear contenido de calidad» para que Google nos considere una fuente de autoridad y lo presente al usuario. Sin embargo, como se observa en un artículo reciente de Olaf Sundon, profesor de estudios de la información, surge una pregunta fundamental: «¿Qué sucede cuando los sistemas de información con inteligencia artificial proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?».
En primer lugar, les invito a ver el siguiente vídeo:
(Vídeo insertado)
El vídeo analiza la ponencia presentada en la conferencia «Teorizando las nociones de búsqueda, (re)fuentes y evaluación a la luz de la IA generativa», de Olaf Sundon, profesor de estudios de la información. El objetivo principal de este artículo es analizar los conceptos de búsqueda, las fuentes y la evaluación en una infraestructura de información cada vez más influenciada por la inteligencia artificial generativa.
Existe una distinción crucial entre la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (información directa). En el artículo, Sundon adopta un enfoque sociomaterial, tratando la información no como algo abstracto, sino como un participante activo en la construcción de nuestro mundo, citando ejemplos históricos como los de Suzanne Brier y Paul Otlet. Se presenta una historia técnica de las infraestructuras de búsqueda, desde las antiguas bibliotecas y catálogos de fichas hasta los motores de búsqueda de internet y su evolución.
Tras leer el artículo, que encontraste gracias al vídeo que te invito a ver, me surgieron tres preguntas:
- ¿Qué sucede cuando los sistemas de información basados en IA proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?
- ¿Podemos comparar la noción positivista de Otlet de extraer fragmentos abstractos de los documentos (las fuentes de información) con la creciente tendencia de los sistemas de información a proporcionar respuestas en lugar de fuentes?
- ¿Cómo puede una comprensión sociomaterial de la información ayudarnos a comprender la infraestructura informativa cada vez más influenciada por la IA desde la perspectiva de la biblioteconomía y la ciencia de la información?
Movido por estas preguntas, inspirado por este artículo y el vídeo que lo explica, decidí reflexionar sobre esta cuestión.
Les invito a explorar el análisis teórico de Sundon y a relacionarlo directamente con nuestro en SEO semántico . La infraestructura de la información está cambiando y nuestra visibilidad depende de que comprendamos este cambio.
Mientras existan sistemas de información, bibliotecas e instituciones similares que organicen la información, los principios y métodos para presentarla y encontrarla desempeñarán un papel fundamental. Existen bibliografías, listas, catálogos de fichas, índices de libros, catálogos en línea (OPAC), sistemas de clasificación, tesauros con vocabularios controlados, portales web, bases de datos bibliográficas, sistemas de gestión de referencias, etc. Estos sistemas organizan y controlan el acceso a las fuentes de información. A menudo, se fusionan tecnologías nuevas y antiguas. Los mecanismos de búsqueda web dependen de su índice, que solo contiene una parte de la web. Esto significa que, cuando usamos la Búsqueda de Google, buscamos en un índice, no en la web en línea, y el tamaño y la actualización del índice son criterios de calidad esenciales (Lewandowski, 2023, p. 41). Estos sistemas de información siempre traen consigo una perspectiva particular, una visión del mundo, incluyendo la representación de temas en catálogos de bibliotecas (Olson, 2002), mecanismos de búsqueda web (Lewandowski, 2023, p. 265; Noble, 2018) o IA generativa (Sun et al., 2024).
SUNDIN, Olof. Teorizando las nociones de búsqueda, (re)recursos y evaluación a la luz de la IA generativa. Information Research: an international electronic journal, [S. l.], v. 30, p. 291-302, 2025. DOI: 10.47989/ir30CoLIS52258.
La tradición de la recuperación de información y la búsqueda de fuentes
Para comprender la ruptura, primero debemos definir qué es lo que se rompe. La tradición predominante de la Biblioteconomía y la Documentación (BD) y, por extensión, del SEO tradicional, siempre ha consistido en construir sistemas que proporcionen al usuario una fuente de información.
Como nos recuerda el artículo de Sundon y Hartel, la historia técnica de la búsqueda comienza con las bibliotecas y los ficheros. Cuando uno acude a una biblioteca, esta (o el catálogo) no proporciona la respuesta; no ofrece un libro, un documento o una publicación periódica. Uno se dirige a la fuente. La información se encontraba en un documento.
Los motores de búsqueda de Internet, en su diseño original, seguían exactamente este modelo.
Un motor de búsqueda como Google era, y en gran medida sigue siendo, un sistema de recuperación de información que rastrea, indexa y clasifica documentos (páginas web). El trabajo de SEO consistía en asegurar que nuestro documento se considerara la fuente más relevante para una consulta específica. El resultado final era un enlace a una página.
Existía una clara distinción: entre la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (información directa). El trabajo de SEO consistía en ser el mejor intermediario.
El cambio semántico: del enlace a la respuesta directa
Esta distinción comenzó a difundirse mucho antes de la IA generativa. Como indica el propio artículo de Sundon, Google inició un cambio sustancial en 2012. Este cambio marcó la introducción del Gráfico de Conocimiento (Knowledge Graph).
¿Quieres saber más sobre las actualizaciones del algoritmo de Google?
Google dejó de ser un simple indexador de páginas para convertirse en un organizador de contenido. Inició así la transición de motor de búsqueda a motor de respuestas . Fue entonces cuando surgió lo que hoy conocemos como SEO semántico.
Esta transición tiene sus raíces en ideas mucho más antiguas, como las de Paul Otlet, quien soñaba con extraer «detalles abstractos» de documentos para crear un «libro universal del conocimiento». El Gráfico de Conocimiento de Google materializa digitalmente esta idea positivista. Pasó mostrando «respuestas directas», como los Fragmentos Destacados .
Desde entonces, nuestro trabajo como profesionales del SEO ha cambiado. Fue entonces cuando comprendí que no bastaba con optimizar para palabras clave. Tras años de esfuerzo y frustración, aprendí a estructurar los datos del proyecto entidades mediante datos estructurados , pero solo más tarde descubrí cómo usar taxonomías y ontologías en este proceso. Uno de los objetivos es Gráfico de Conocimiento
Sin embargo, incluso en este modelo, la fuente seguía siendo (generalmente) visible en los resultados de búsqueda. El fragmento destacado contenía un enlace. El panel de conocimiento citaba fuentes como Wikipedia. Pero luego consideré la IA generativa, que representa el inicio de un cambio radical, y es aquí donde se rompe la conexión con la fuente.
La ruptura generativa y las respuestas sin fuentes rastreables
El artículo de Olaf Sundon identifica con precisión la diferencia entre un motor de búsqueda tradicional y una aplicación LLM.
- Los motores de búsqueda tradicionales proporcionan enlaces a documentos. Son sistemas de recuperación de información .
- Chatbots de IA generativa: general . Son sistemas de generación .
Shah y Bender (2022) observan que esta nueva interacción conversacional «tiene el inconveniente del acceso directo a las fuentes». El resultado de la IA generativa es «inexistente, sin conexiones rastreables con las fuentes». Esto se relaciona con cómo se construyeron los modelos o, más aún, con cómo funciona el Transformer.
Esto es lo que Bender et al. (2021) denominaron «conocimiento estocástico», un término muy conocido. Como explica el vídeo de Hartel, el LLM no «comprende» el significado en el sentido humano. Se trata de un modelo estadístico diseñado para generar «secuencias de palabras plausibles» a partir de los patrones observados en sus datos de entrenamiento.
El resultado parece coherente, pero carece de significado real y de una conexión verificable con una fuente estable. Para la ciencia de la información, esto representa una ruptura significativa. Para el SEO, es una tarea ardua.
La crisis de la evaluación
¿Cómo puedes confiar en un loro?
El argumento principal del artículo de Sundon es que, con este cambio, “las fuentes se vuelven cada vez más invisibles”. Esto nos lleva al siguiente pilar que se derrumba: la evaluación .
La alfabetización informacional tradicional, como el método SIFT (Detenerse, Investigar la fuente, Encontrar mejor cobertura, Rastrear las afirmaciones), se basa enteramente en la capacidad de investigar la fuente.
Cuando procesamos la información recuperada, nos preguntamos:
- ¿Quién es el autor?
- ¿Qué reputación tiene esta publicación?
- ¿Cuándo es la fecha límite de publicación?
- ¿cuál son sus fuentes?
Como evidencia el artículo que dio origen a mi investigación, el auge de la IA generativa vuelve esta evaluación tradicional prácticamente imposible. Cuando un modelo de aprendizaje automático genera una respuesta, no hay autor. No hay publicación. No existe un origen definido, sino que todo se reduce al modelo en sí.
Desde que Sundon escribió su texto hoy, Google ha implementado algunos cambios, principalmente. Ahora, en la mayoría de los casos (limitado a los modos de Vista general de IA y Modo IA), se citan las fuentes, pero de forma descontextualizada, ya que no sabemos con exactitud qué parte del texto de cada fuente fue la responsable de la generación por parte de la IA.
El usuario recibe un texto que parece plausible, pero que podría ser una alucinación: un collage estadístico de datos descontextualizados, objetivamente incorrectos, pero que parecen ciertos. El problema es que, sin una fuente que rastrear , el usuario no sabe cómo averiguarlo.
Esto tiene profundas implicaciones para estudiantes, investigadores y, por supuesto, para el público en general. ¿Cómo podemos abordar teóricamente este escenario? La respuesta, en mi opinión, reside en reforzar la solución basada en los principios del SEO semántico .
El papel del SEO semántico en la recuperación de información en la era generativa
Si la IA generativa es el nuevo intermediario, ¿cómo garantizamos que nosotros, los creadores de contenido y los propietarios de sitios web, encontremos nuestra información y, en consecuencia, se nos reconozca la autoría?
La respuesta no pretende engañar al LLM. Recuperar estrategias antiguas implica convertir nuestro contenido en la fuente de datos más limpia, estructurada y semánticamente rica posible para el entrenamiento e indexación de estos modelos.
Aquí es donde la recuperación de información se encuentra con el SEO semántico .
Cuando hablo de SEO semántico, me refiero a centrarme en el significado, estructurar la información y dar forma al contenido para que los algoritmos puedan comprenderlo conceptualmente. Puedo aplicar un modelo de trabajo semántico de principio a fin.
Esta es la nueva realidad. El SEO se ha vuelto infinitamente más complejo. La página de resultados del motor de búsqueda (SERP), compuesta por un ranking de enlaces, crece lentamente y nos estamos optimizando para ser la fuente de datos más fiable y semánticamente comprensible para los algoritmos que alimentan los modelos de IA.
Siento que si generas ansiedad... Después de todo, ¿cómo hacemos esto?
Para ello estoy creando el curso de SEO Semántico: El Flujo de Trabajo Semántico. Les invito a seguirme en LinkedIn ; así les mantendré informados sobre su lanzamiento.
La responsabilidad del poder en la nueva Web Semántica
El artículo de Olaf Sundon y el análisis de Jenna Hartel constituyen una alerta crucial para la comunidad de la ciencia de la información. Sin embargo, considero que se trata de una alerta aún más urgente para nuestros colegas profesionales del SEO.
Estamos entrando en una era donde la información se ha desvinculado de su origen. Esto conlleva una erosión de la confianza. Si un experto en matemáticas me da una respuesta incorrecta, ¿de quién es la culpa? ¿Cómo lo soluciono? La «caja negra» del conocimiento estocástico permanece herméticamente cerrada.
El artículo de Sundon concluye con una observación esencial: «Antes, no revelar las fuentes de nuestras afirmaciones resultaba complicado, pero podíamos optar por el camino inverso y llegar directamente al origen. Hoy, con la generatividad, esto no siempre es posible. Por lo tanto, toda persona comprometida con la información de calidad debe proporcionar las fuentes de sus afirmaciones».
Como profesionales del SEO, nuestro rol evolucionó de "creadores de enlaces" a "arquitectos de la información". Ahora, debemos convertirnos en "curadores del conocimiento".
Nuestro trabajo no se limita a lograr que Google encuentre nuestro sitio; se trata de garantizar que la IA tenga acceso a datos verificables y estructurados. Y, lo más importante, debemos promover y construir sistemas que expongan sus fuentes, que recompensen la transparencia y que permitan al usuario hacer lo que la bibliotecología y la ciencia de la información siempre defenderán: evaluar la fuente de información.



Publicar comentario