¿Por qué la IA generativa nos está obligando a replantearnos el SEO?
Hemos entrado en la era de las respuestas y presenciado la desaparición de las fuentes. En este artículo, teorizaremos sobre las diversas nociones de búsqueda, sus recursos y su evaluación a la luz de la IA generativa.
Estamos viviendo un momento crucial en la historia de la web . La introducción masiva de modelos de lenguaje de programación a gran escala ( LLM ), como Gemini, y su integración directa en los motores de búsqueda han puesto en entredicho décadas de conceptos establecidos. Para los del SEO , el cambio es comparable a un terremoto. Nuestra forma de concebir la búsqueda, las fuentes y la evaluación se está transformando radicalmente.
El SEO ha cambiado para siempre.
Durante años, el mantra del SEO ha sido "crear contenido de calidad de la información , surge una pregunta fundamental: "¿Qué sucede cuando los sistemas de información impulsados por IA proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?".
Antes de comenzar, les invito a ver el siguiente video:
El vídeo analiza la ponencia presentada en la conferencia « Teorizando las nociones de búsqueda, (re)fuentes y evaluación a la luz de la IA generativa », de Olaf Sundon, profesor de estudios de la información. El objetivo principal del trabajo es analizar los conceptos de búsqueda, fuentes y evaluación en una infraestructura de información cada vez más influenciada por la inteligencia artificial .
Se establece una distinción crucial entre la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (hechos o información directa). En el artículo, Sundon adopta un enfoque sociomaterial, tratando la información no como algo abstracto, sino como un participante activo en la construcción de nuestro mundo, citando ejemplos históricos como los de Suzanne Brier y Paul Otlet. Se presenta una historia técnica de las infraestructuras de búsqueda, desde las antiguas bibliotecas y catálogos de fichas hasta los motores de búsqueda de internet y su evolución.
Tras leer el artículo, que encontré gracias al vídeo que os invité a ver, me planteé tres preguntas:
- ¿Qué sucede cuando los sistemas de información impulsados por IA proporcionan cada vez más respuestas en lugar de dirigir a las personas a las fuentes?
- ¿Puede compararse la noción positivista de Otlet de extraer hechos abstractos de documentos (o fuentes de información) con la creciente tendencia de los sistemas de información a proporcionar respuestas en lugar de fuentes?
- ¿Cómo puede una comprensión sociomaterial de la información ayudarnos a comprender la infraestructura informativa cada vez más impregnada de IA desde la perspectiva de la Biblioteconomía y la Documentación?
Impulsado por estas preguntas, inspirado por este artículo y el vídeo que lo explica, busqué profundizar en este tema.
Les invito a explorar el análisis teórico de Sundon y a relacionarlo directamente con nuestro en SEO semántico . La infraestructura de la información está cambiando, y nuestra visibilidad depende de comprender este cambio.
Dado que los sistemas de información, las bibliotecas e instituciones similares existen para organizar la información, los principios y métodos para presentarla y encontrarla han desempeñado un papel fundamental. Existen bibliografías, listas, catálogos de fichas, índices de libros, catálogos en línea (OPAC), sistemas de clasificación, tesauros con vocabularios , portales web, bases de datos bibliográficas , sistemas de gestión de referencias, etc. Estos sistemas organizan y controlan el acceso a las fuentes de información. Las tecnologías nuevas y antiguas a menudo se fusionan. Los motores de búsqueda web dependen de su índice, que contiene solo una parte de la web. Esto significa que cuando usamos la Búsqueda de Google, buscamos en un índice, no en la web en línea, y el tamaño y la actualización del índice son criterios de calidad esenciales (Lewandowski, 2023, p. 41). Estos sistemas de información siempre traen consigo una perspectiva particular, una cosmovisión, ya sea la representación de temas en catálogos de bibliotecas (Olson, 2002), motores de búsqueda web (Lewandowski, 2023, p. 265; Noble, 2018) o IA generativa (Sun et al., 2024).
SUNDIN, Olof. Teorizando las nociones de búsqueda, (re)recursos y evaluación a la luz de la IA generativa. Information Research: an international electronic journal, [S. l.], v. 30, p. 291-302, 2025. DOI: 10.47989/ir30CoLIS52258.
La tradición de la recuperación de información y la búsqueda de fuentes.
Para comprender esta disrupción, primero debemos definir con precisión qué es lo que altera. La tradición predominante en Biblioteconomía y Documentación, y por extensión, en el SEO tradicional, siempre ha consistido en crear sistemas que proporcionen al usuario una fuente de información.
Como nos recuerda el artículo de Sundon y Hartel, la historia técnica de la búsqueda comienza con las bibliotecas y los ficheros. Cuando uno iba a una biblioteca , el bibliotecario (o el catálogo) no daba la «respuesta»; proporcionaba un libro, un documento o una publicación periódica. Indicaba la fuente. La información estaba contenida en un documento.
Los motores de búsqueda de Internet, en su concepción original, seguían exactamente este modelo.
Un buscador como Google era, y en gran medida sigue siendo, un sistema de recuperación de información que rastrea, indexa y clasifica documentos ( páginas ). La labor de SEO consistía en asegurar que nuestro documento se considerara la fuente más relevante para una consulta específica. El resultado final era un enlace a una página.
Existía una clara distinción: la búsqueda de fuentes (documentos que contienen información) y la búsqueda de respuestas (los hechos o la información directa). La labor del SEO era ser el mejor intermediario .
El cambio semántico: de enlace a respuesta directa
Esta distinción comenzó a difuminarse mucho antes de la IA generativa. Como señala el propio artículo de Sundon, Google inició un cambio sustancial en 2012. Este cambio fue la introducción del Gráfico de Conocimiento .
¿Quieres saber más sobre las actualizaciones del algoritmo de Google?
Google dejó de ser un simple indexador de páginas para convertirse en un organizador de información. Inició así la transición de buscador a motor de respuestas . Posteriormente, presenciamos el nacimiento de lo que hoy conocemos como SEO semántico.
Este cambio tiene sus raíces en ideas mucho más antiguas, como las de Paul Otlet, quien soñaba con extraer «hechos abstractos» de documentos para crear un «libro universal del conocimiento». El Gráfico de Conocimiento de Google es la encarnación digital de esta idea positivista. Comenzó mostrando «respuestas directas», como los Fragmentos Destacados .
Desde entonces, nuestro trabajo como profesionales del SEO ha cambiado. Fue por esa época cuando comprendí que optimizar simplemente para palabras clave . Tras años de ensayo y error y frustración, aprendí a estructurar los datos del proyecto entidades mediante datos estructurados , pero solo más tarde aprendí a usar taxonomías y ontologías en este proceso. Uno de los objetivos se convirtió en alimentar el Gráfico de Conocimiento de Google con mi información. ¡Así nació el Flujo de Trabajo Semántico!
Sin embargo, incluso en este modelo, la fuente seguía siendo (generalmente) visible en los resultados de búsqueda. El fragmento destacado contenía un enlace. El panel de conocimiento citaba fuentes como Wikipedia . Pero entonces llegó la IA generativa, que representa la culminación de un cambio radical, y es aquí donde se rompe la conexión con la fuente.
Disrupción generativa y respuestas sin fuentes rastreables.
El artículo de Olaf Sundon identifica con precisión la diferencia entre un motor de búsqueda tradicional y una solicitud para un máster en Derecho (LLM).
- Los motores de búsqueda tradicionales proporcionan enlaces a documentos. Son de recuperación de información .
- Chatbots con IA generativa: generan contenido. Son de generación .
Shah y Bender (2022) observan que esta nueva interacción conversacional «se produce a costa del acceso directo a las fuentes». El resultado de la IA generativa «carece de conexiones rastreables con las fuentes». Esto se relaciona con cómo se construyeron los modelos o, incluso más, con cómo funciona Transformer.
Esto es lo que Bender et al. (2021) denominaron un «loro estocástico», un término que se ha popularizado. Como se explica en el vídeo de Hartel, el LLM no «comprende» el significado en el sentido humano. Se trata de un modelo estadístico entrenado para generar «secuencias de palabras con una sonoridad plausible» a partir de patrones observados en sus datos de entrenamiento.
El resultado parece coherente, pero carece de significado real y de una conexión verificable con una fuente estable. Para la ciencia de la información, esto supone una disrupción significativa. Para el SEO, es una pesadilla en cuanto a la atribución.
La crisis de evaluación
¿Cómo puedes confiar en un loro?

El argumento principal del artículo de Sundon es que, con este cambio, "las fuentes se están volviendo cada vez más invisibles". Esto nos lleva al siguiente pilar que se ha derrumbado: la evaluación .
La alfabetización informacional tradicional, como el método SIFT (Detenerse, Investigar la fuente, Encontrar mejor cobertura, Rastrear las afirmaciones), se basa enteramente en la capacidad de investigar la fuente.
Al trabajar con la información recuperada, nos preguntamos:
- ¿Quién es el autor?
- ¿Qué reputación tiene esta publicación?
- ¿Cuál es la fecha de publicación?
- sus fuentes ?
Como señala el artículo que inspiró mi investigación, el auge de la IA generativa hace que esta evaluación tradicional sea prácticamente imposible. Cuando un modelo de aprendizaje automático genera una respuesta, no hay autor. No hay fecha de publicación. No existe un origen más allá del propio modelo.
Desde que Sundon escribió su texto, Google ha realizado varios cambios, principalmente. Ahora, en la mayoría de los casos (limitados a la Descripción general de la IA y el Modo de IA), se citan fuentes, pero de forma descontextualizada, ya que no se sabe con exactitud qué parte del texto de cada fuente se utilizó para generar la IA.
El usuario recibe un texto que parece plausible, pero podría tratarse de una «alucinación»: un collage estadístico de datos descontextualizados e incorrectos que aparentan ser ciertos. El problema radica en que, sin una fuente que rastrear, el usuario no tiene forma de saberlo.
Esto tiene profundas implicaciones para estudiantes, investigadores y, por supuesto, el público en general. ¿Cómo podemos abordar teóricamente este escenario? La respuesta, en mi opinión, reside en reforzar los principios del SEO semántico .
El papel del SEO semántico en la recuperación de información en la era generativa.
Si la IA generativa es el nuevo intermediario, ¿cómo podemos nosotros, como creadores de contenido y propietarios de sitios web, asegurarnos de que nuestra información sea encontrada y, con suerte, reconocida?
La respuesta no reside en intentar "engañar" al LLM, ni en reciclar estrategias antiguas, sino más bien en hacer de nuestro contenido la fuente de datos más limpia, estructurada y semánticamente rica posible para entrenar e indexar estos modelos.
Aquí es donde la recuperación de información se encuentra con el SEO semántico .
Cuando hablo de SEO semántico, me refiero a centrarme en el significado, estructurar la información y dar forma al contenido para que los algoritmos puedan comprenderlo conceptualmente. Me refiero a aplicar un modelo de trabajo semántico de principio a fin.
Esta es la nueva realidad. El SEO se ha vuelto infinitamente más complejo. La página de resultados del motor de búsqueda (SERP), compuesta por un " ranking " de enlaces , está desapareciendo lentamente, y nos estamos optimizando para ser la fuente de información más fiable y semánticamente comprensible para los algoritmos que alimentan los modelos de IA.
Lamento haberte puesto nervioso/a. Después de todo, ¿cómo se logra eso?
Por eso estoy creando el curso de SEO Semántico: El Flujo de Trabajo Semántico. Te invito a seguirme en LinkedIn ; allí publicaré novedades sobre su lanzamiento.
La responsabilidad de la fuente en la nueva Web Semántica
El artículo de Olaf Sundon y el análisis de Jenna Hartel constituyen una llamada de atención crucial para la comunidad de Ciencias de la Información. Pero sostengo que es una advertencia aún más urgente para nosotros, los profesionales del SEO.
Estamos entrando en una era donde la información se ha desvinculado de su origen. La consecuencia es la erosión de la confianza. Si un máster en Derecho me da una respuesta errónea, ¿a quién culpo? ¿Cómo lo corrijo? La «caja negra» del «loro estocástico» está herméticamente sellada.
El artículo de Sundon concluye con una observación esencial: “Antes, no citar las fuentes de nuestras afirmaciones era complicado, pero podíamos rastrear el origen y encontrarlo. Hoy, con la computación generativa, eso no siempre es posible. Por lo tanto, todo aquel comprometido con la información de calidad debe citar sus fuentes”.
Como profesionales del SEO, nuestro rol ha evolucionado de "creadores de enlaces" a "arquitectos de la información". Ahora, debemos convertirnos en "curadores del conocimiento".
Nuestro trabajo no consiste solo en lograr que Google encuentre nuestro sitio web ; se trata de garantizar que la IA tenga acceso a información verificable y estructurada. Y, lo que es más importante, debemos promover y desarrollar sistemas que expongan sus fuentes, recompensen la transparencia y permitan a los usuarios hacer lo que la bibliotecología y la ciencia de la información siempre han defendido: evaluar la fuente de la información.





Publicar comentario