La recuperación de información (RI) es un área de la informática que se ocupa del almacenamiento de documentos y la recuperación automática de la información asociada a ellos. Mediante la recuperación de información, los usuarios tienen acceso a representaciones del contenido de los documentos existentes en bases de datos o en cualquier entorno que almacene dicho contenido.
Es una ciencia que investiga la búsqueda de información en documentos, la búsqueda de los mismos documentos, la búsqueda de metadatos que los describen y la búsqueda en bases de datos, que pueden ser relacionales, aisladas o interconectadas en una red hipermedia, como la World Wide Web. Los medios pueden estar disponibles en forma de texto, sonido, imágenes o datos.
Sin embargo, existe mucha confusión entre los términos y conceptos de “recuperación de datos”, “recuperación de documentos”, “recuperación de información” y “recuperación de texto”. De hecho, cada uno de ellos es un área especializada con su propio cuerpo de conocimiento.