Conteúdos
El concepto de web semántica
La web semántica es una web de datos. Es el futuro de la Web, un proyecto en marcha que depende del trabajo de todos los que creemos en el poder de la Web como algo más que una herramienta, sino como una plataforma que puede liberar el conocimiento humano como nunca antes.
El objetivo del desarrollo de la Web Semántica es hacer evolucionar nuestra web actual transformándola en una gran base de datos global, interconectada y fácilmente inteligible tanto por humanos como por ordenadores.
En este nuevo escenario será posible realizar búsquedas independientemente del tipo, formato y fuente de los datos y se encontrará el resultado.
Y el resultado encontrado será rico por los datos semánticamente interrelacionados obtenidos, generando información, mucho más allá de la lista actual de sitios, desconectados entre sí.
Vea el siguiente vídeo con Tim Berners-Lee en TED Talks antes de continuar, aquí en esta página.
Tim Berners-Lee explica la Web de datos semánticos
Historia de la web semántica
La historia de la Web semántica está entrelazada con la de la propia Web. Los fundadores de la “world wide web” son prácticamente los mismos que definieron y respondieron la pregunta:
¿Qué es la web semántica?
Fue entonces cuando Tim Berners-Lee, James Hendler y Ora Lassila publicó en 2001 un artículo en la revista Scientific American titulado La web semántica – Una nueva forma de contenido web con sentido para los ordenadores desencadenará una revolución de nuevas posibilidadesen portugués “Web semánticaun nuevo formato para contenido para la Web que tenga sentido para los ordenadores iniciará una revolución de nuevas posibilidades”¹ que la idea de Web Semántica.
Obtenga más información sobre la Historia de la Web y sepa quiénes son Tim Berners-Lee, James Hendler y Ora Lassila.
Desde el concepto inicial de web (una red de ordenadores que servían documentos alojados en una base de datos) hasta su fase actual, es decir, una red de contenidos integrados que genera información, se ha recorrido un largo camino. Muchos profesionales brillantes han contribuido con su trabajo a que yo esté aquí escribiendo y usted leyéndome.
Antes, cuando queríamos algo, teníamos que hacer una búsqueda basada en palabras clave. Escribías en el cuadro de búsqueda y aparecían una serie de enlaces.
Hoy en día ese escenario cambia a cada momento, ¡rápidamente!
Más que una red de documentos
Esta nueva web, que nace del trabajo de la comunidad de desarrolladores, creadores de contenidos, científicos y otros, será el resultado del desarrollo de este trabajo colectivo. La nueva Web será una Web de datos, donde se interpretarán los documentos en línea y de su conexión extraeremos el significado, el nexo.
En resumen, la web semántica es una extensión de la World Wide Web que permite a los humanos trabajar entre sí y con los ordenadores en un estado de plena cooperación.
Al interconectar los documentos a través de sus significados, al asignar sentido a estos contenidos, estamos creando el futuro entorno de la adquisición y puesta en común de toda la información humana sobre la Tierra. Una fuente prácticamente infinita de creación de conocimiento.
Esta es mi visión del futuro, que comparten otros miles de profesionales que se ocupan de la semántica y construyen contenidos y proyectos para esta nueva Web.
Ya sea creando una capa de contenidos publicados en Internet, comprensible tanto para humanos como para ordenadores, o programando y desarrollando lenguajes que permitan esta conversación hombre-máquina, todo el mundo puede formar parte de este movimiento.
El futuro de la Web es semántico
Esta nueva web se denomina web semántica por el significado que un correcto marcado semántico aporta a los contenidos disponibles en internet.
Pierre Lévy prevé dos grandes retos en el camino hacia la transformación de la web en un sistema semántico:
La primera es la ausencia de profesionales cualificados que trabajen en la organización de la información;
La segunda es la necesidad de adoptar una norma para la llamada”web semántica”, que permitirá coordinar automáticamente todo el conocimiento por conceptos, y ya no por los enlaces entre documentos.
De cómo resolvamos estos problemas depende en parte el éxito, o no, de la web semántica .
Más allá de la clásica “Red de documentos
Organizaciones como el W3C ( World Wide Web Consortium ) trabajan para crear la tecnología necesaria para la “ Web de datos “.
Comparto la opinión del W3C en lo que respecta a la web semántica:
- La información en la red tiene un significado exacto
- La información de la web puede ser comprendida y procesada por ordenadores
- Los ordenadores pueden integrar información de la web
Científicos de todo el mundo trabajan ahora para que los ordenadores hagan un trabajo más útil creando un sistema que permita interacciones fiables en red.
Pero, ¿qué significa la web semántica?
El término “Web semántica” también se refiere a la visión del W3C de la Web de datos enlazados.
La Web Semántica amplía la Web, mediante el uso de datos estructurados, para que los ordenadores entiendan el contenido de su sitio web tanto como los humanos.
Alex Rodrigues
Las tecnologías de la web semántica permiten crear almacenes de datos en la red, crear vocabularios y escribir reglas para manejar los datos.
Los datos enla zados están potenciados por tecnologías como RDF, SPARQL, OWL y SKOS.
“Esto significaría el fin de la fragmentación de la red de información, actualmente dividida a causa de las barreras lingüísticas y las diversas opciones de sistemas de organización” – Pierre Lévy
Pero, ¿qué es hoy la web semántica?
Las cosas pueden resultar un poco confusas para usted, que quizá se pregunte qué es realmente esto de la web semántica.
Quizá la definición más inteligible sea la del propio Berners-Lee, en su artículo de 2001:
“La web semántica es una extensión de la web actual en la que se dota a la información de un significado bien definido”.
Los que trabajamos en la construcción de esta nueva web más semántica tenemos una idea correcta de lo que significan las palabras anteriores cuando vemos la Torre de la Web Semántica:
La pila de la web semántica
Para crear esta fase en la Web se necesitan capas y capas de metadatos, lógica y seguridad para que los Los bloques básicos de construcción de la semántica.
En la representación visual anterior, tenemos las capas rodeando una pila, una torre de bloques, que representa todo el proceso.
Esta pila cambia y evoluciona a medida que se desarrollan los conceptos que componen la Web Semántica.
Los elementos básicos de la semántica
En el artículo, Tim explica cuáles son las “capas” de esta torre:
Los bloques básicos, formados por Unicode y URI, llegan hasta XML, alcanzando las capas más sofisticadas, como los vocabularios ontológicos y RDF.
Aún queda mucho trabajo por hacer.
Si ya entiende de qué estamos hablando, entiende cómo funcionan las cosas. Pero si espera que todo esto esté a disposición de su empresa, debe tomárselo con calma.
Aún queda mucho trabajo por hacer, a pesar de la velocidad de desarrollo de la Web Semántica. Muchas de las tecnologías que lo componen deben definirse mejor, desarrollarse. Tecnologías como RDF, RDF Schema, Ontologías y Sistemas de Integración necesitan más tiempo de trabajo para estar listas al 100%.
Pero si la Web Semántica aún no ha despegado, ¿qué hacemos para que deje de ser un proyecto y pase a la acción?
El primer problema: la gente quiere participar
Volvamos a la definición de Web Semántica:
La web semántica es una ampliación de la web actual que permitirá a ordenadores y personas trabajar en cooperación mediante la significación de la información.
El simple hecho de que la Web Semántica sea una extensión de la red actual (que también se sigue construyendo), nos crea un problema: la parte computacional evoluciona bien, pero la gente tiene que estar dispuesta a trabajar en cooperación.
Para usted y para mí (y para el resto de los usuarios de la Web), poco importa si RDF especifica correctamente los datos, o si XML está bien construido, ahora queremos utilizar todas las capacidades de la nueva Web. Queremos utilizar por fin los ordenadores que hemos creado, al máximo de sus posibilidades.
El segundo problema: las normas son para las máquinas
Cada vez que una norma técnica alcanza la madurez necesaria para hacer avanzar la web semántica nos acercamos más al objetivo final, pero esto sólo sirve para que la semántica sea cada vez más sofisticada.
El aspecto técnico seguirá evolucionando para llevar la web semántica al nivel que necesitamos.
Pero son para máquinas, se han programado para funcionar en sistemas que no hablan entre sí y por eso es tan urgente crear una “capa semántica” o “lenguaje semántico universal” que tienda puentes entre los datos y las personas.
El tercer problema: la integración hombre-máquina
Adaptar las tecnologías a las necesidades de las personas es el tercer problema por resolver. Es necesario establecer la conexión entre estos dos mundos aparentemente separados: las personas y los ordenadores.
Necesitamos madurar las tecnologías implicadas en la web semántica. Cuando terminemos esta fase, la absurda cantidad de datos que generamos cada día estará realmente a disposición de las personas que la necesitan.
El cuarto problema: lidiar con el desorden de la Red de Datos
En el artículo“Dealing with the messiness of the web of data“, de Stefan Schlobach y Craig A. Knoblock¹, encontré un cuarto y complejo problema. Explican:
La investigación sobre la Web Semántica, ahora en su segunda década, ha conseguido animar a la gente a publicar datos en la Web de forma estructurada, enlazada y normalizada. El éxito de lo que ahora se ha convertido en la Web de los Datos queda patente en el gran número de tripletes disponibles en las iniciativas Linked Open Data, Linked Life Data y Open Government.
Sin embargo, este aumento de los datos hace que muchas de las hipótesis establecidas resulten inadecuadas y ofrece un sinfín de nuevos retos de investigación.
En marcado contraste con las primeras aplicaciones de la Web Semántica, que manejaban pequeñas ontologías y conjuntos de datos hechos a mano, la nueva Web de Datos llega con una plétora de visiones del mundo contradictorias y contiene otras incompletas, incoherentes, incorrectas, cambiantes y opinables en ciernes.
Esta información no sólo procede de fuentes académicas e instituciones creíbles, sino que a menudo es creada, copiada o traducida por la comunidad.
En resumen, los datos son confusos y difíciles de utilizar. Este número especial está dedicado a esa confusión y a cómo afrontarla. Los planteamientos de este documento pueden clasificarse a grandes rasgos en dos clases: en primer lugar, proporcionar directrices o mejores prácticas para evitar el desorden en primer lugar, y en segundo lugar, ofrecer a los usuarios una infraestructura y técnicas para crear aplicaciones útiles a pesar del desorden.
El futuro de la web semántica
Para organizar la información disponible hoy en día contamos con la ayuda de la inteligencia artificial (y otras nuevas tecnologías), de este modo se utilizarán nuevas técnicas para dar sentido a los contenidos distribuidos por internet.
Pero para que la web alcance el nivel de madurez que necesitamos no se trata sólo de que sea capaz de relacionar contenidos. Quienes trabajan creando contenidos deben tener la disposición y los conocimientos técnicos necesarios para utilizar tecnologías como RDF, SPARQL, OWL y SKOS.
La Web Semántica es una red de datos enlazados
Imagínese estas tecnologías como ventanas al contenido que su empresa ha creado durante años (o creará) y que hoy está inactivo, inaccesible en su sitioLa información se almacena en una base de datos en ordenadores de la empresa, pero puede ser utilizada por personas de todo el mundo para generar información.
Vocabularios para organizar los datos
Este trabajo de organización de los datos es extremadamente importante. Con OWL (para construir vocabularios u “ontologías”) y SKOS (para crear sistemas de organización del conocimiento) es posible enriquecer los datos dotándolos de nuevos significados. Esto permite que más personas (y más máquinas) hagan más con los datos disponibles.
Información sobre consultoría en todo el mundo
Los lenguajes de consulta son los mejores amigos de los datos.
Antes hemos visto que la web semántica es una web de datos. Así que para acceder a todos estos datos necesitamos crear un lenguaje que consulte, que busque, información en estas bases de datos.
SPARQL es el lenguaje de consulta de la web semántica.
Modelo basado en la PNL y la web semántica para la recuperación de información
En este directo, que forma parte de la serie sobre Inteligencia Artificial y Web Semántica, Sueliton Ribeiro (Senior Specialist Leader en CI&T) y Caio Saraiva Coneglian hablan sobre la recuperación de información utilizando dos estrategias diferentes.
Sueliton habla de la creación de Bots Conversacional y Caio muestra el resultado de su tesis doctoral “MODELO COMPUTACIONAL DE RECUPERACIÓN DE INFORMACIÓN PARA REPOSITORIOS DIGITALES MEDIANTE ONTOLOGÍAS” y ahí es donde me gustaría que se fijara en su charla para ver cómo el uso de las herramientas de la Web Semántica junto con las Ontologías y la Inteligencia Artificial y el Aprendizaje Automático pueden dar forma al futuro de la Web Semántica.
¿Cómo puede ayudar la web semántica a su empresa?
¿Qué pueden hacer las microempresas y las pequeñas empresas para participar en esta evolución de la Web?
Veamos el trabajo que el W3C ha venido realizando con diferentes industrias.
Trabaja con empresas de sanidad, ciencias humanas y de la vida, administración electrónica y energía para mejorar la colaboración, la investigación y el desarrollo, y la adopción de la innovación y la web semántica.
Por ejemplo, al facilitar la toma de decisiones en la investigación clínica, las tecnologías de la web semántica conectarán muchas formas de información biológica y médica entre instituciones.
Piense conmigo: ¿su empresa genera datos? Todo el tiempo, ¿correcto? Basta con mirar cuántas hojas de cálculo hay en tu ordenador.
Pero, ¿qué tipo de información generan estos datos para usted, para las empresas con las que trabaja, para el mercado en el que opera?
¿Sabías que dentro de tu ordenador se encuentran los datos necesarios para que tu empresa comience un excelente trabajo de SEO?
¿Qué es la web semántica?
Más información sobre SEO semántico y la Web semántica.
¡Sí! Exactamente lo que he afirmado: la enorme cantidad de datos que cada empresa genera a diario es el principio de un trabajo que llamamos SEO semántico.
En este proceso creamos un vocabulario para su negocio, con los temas importantes para su mercado, y creamos contenidos (basados en datos) para que los motores de búsqueda inteligentes de hoy en día entiendan que su sitio es lo suficientemente relevante como para aparecer en las búsquedas.
SEO y la web semántica
Mucho ha cambiado desde la invención de la Web y desde que Tim Berners-Lee desarrolló los fundamentos de la Web Semántica. La web ha pasado de un puñado de sitios web a millones de plataformas y miles de millones de páginas. Antes estaba limitado al acceso de unos pocos beneficiados, que estaban en Universidades o en casas que podían permitirse comprar un ordenador.
Hoy, en la mayoría de los lugares, muchos tienen acceso a una red de acceso (casi) ilimitado, con páginas, plataformas y sistemas de los tipos más variados. Todo ello es rastreado, clasificado, ordenado y mostrado por los modernos motores de búsqueda, basándose en potentes algoritmos que ni siquiera sus programadores están seguros de cómo funcionan.
¿Cómo se optimiza un sitio web para la web semántica?
La web semántica supone un reto y una oportunidad para los propietarios de sitios web. El reto consiste en crear contenidos que vayan más allá del texto suelto en páginas y entradas de blog. Lo que hay que hacer es pensar en el mercado en el que se está, qué entidades forman parte de ese dominio (campo de conocimiento) y crear contenidos en torno a él.
Pero, ¿qué es esta supuesta entidad?
Pues es sencillo: estos son los temas básicos de su mercado. ¿Ponemos un ejemplo?
Mi mercado es el SEO, y en ese ámbito, el de la optimización de sitios web, tenemos:
- Motor de búsqueda;
- Desarrollo de sitios web;
- SEO en la página;
- Construcción de enlaces;
- Marketing de contenidos;
- Motor de búsqueda;
- OEA;
- Algoritmos;
- y mucho más …
Son las entidades, temas específicos y básicos de un mercado (adaptando un concepto básico de la Web Semántica), que siempre utilizamos pero que hay que explicar y definir para nuestro público, que suele ser lego en la materia.
Esa es la estrategia que llamamos SEO semántico.
La web semántica, como ya he dicho, es una red de significados. Los documentos que hoy están en la web empiezan a rastrearse, clasificarse, ordenarse y mostrarse de formas que antes no eran posibles.
Los fragmentos enriquecidos que aparecen a continuación son una muestra de lo que se puede hacer cuando un motor de búsqueda entiende su contenido:
Lo que hay que hacer es tener un sitio web con un código bien elaborado, páginas planificadas y desarrolladas según estrategias de SEO semántico y crear contenidos que expliquen y conecten a las entidades que están en su mercado.
Pero ese es otro tema y puede leerlo todo sobre SEO aquí, en nuestro blog.
Una sugerencia de lectura avanzada
Web 2.0 y web semántica
por Vladan Devedžić, Dragan Gaševic
Web 2.0 describe la tendencia de la tecnología y el diseño web que pretende aumentar la creatividad, el intercambio de información y, sobre todo, la colaboración entre usuarios.
La Web Semántica se refiere a la interacción inteligente entre sistemas y aplicaciones en la Web, implementando ontologías, anotaciones semánticas del contenido Web y razonamiento.
Su objetivo último es hacer los datos comprensibles para los ordenadores y abrirse así a una utilidad y manipulación mucho mayores.
Editado por dos autores de Springer, este número especial de AoIS presentará investigaciones punteras sobre estas tendencias a menudo opuestas en informática y apoyará el debate sobre las sinergias y controversias inherentes a las dos tecnologías, al tiempo que considerará lo que otras tecnologías pueden aportar a ambas.
Los espectaculares avances en arquitecturas orientadas a servicios, ingeniería basada en modelos y tecnologías de minería web son sólo algunos de los avances que pueden tener un impacto considerable en la Web 2. 0 y la Web Semántica, y todos ellos se abordarán en este volumen.
Se trata de un material importante para cualquiera que investigue tecnologías de minería de datos y web, desarrollo de aplicaciones basadas en web, IA aplicada o arquitecturas orientadas a servicios.
- Editor: Springer US
- Idioma: inglés
- Web 2.0 y web semántica
- Autor: Vladan Devedžić, Dragan Gaševic
- Publicado por Springer US
- ISBN: 978-1-4419-1218-3
Índice:
- TagFusion: un sistema de integración y aprovechamiento de etiquetado colaborativo
- Mejora semántica de los sistemas de etiquetado social
- Técnicas de adaptación y recomendación para mejorar la calidad de las anotaciones y la pertinencia de los recursos en la Web 2.0 y las aplicaciones basadas en la web semántica
- Aplicaciones de Internet sofisticadas, adaptativas y reactivas
- Hacia una mayor facilidad de uso de las interfaces de lenguaje natural para bases de conocimiento
- Modelo de documento semántico para mejorar la interoperabilidad de datos y conocimientos
- Minería de datos basada en ontologías en bibliotecas digitales
- Un sistema de evaluación en la web semántica
Para comprar:
¹Berners-Lee, Tim &amn”>p; Hendler, James & Lassila, Ora. (2001). La web semántica: una nueva forma de contenido web con sentido para los ordenadores desencadenará una revolución de nuevas posibilidades. ScientificAmerican.com.
¹ S. Schlobach, C.A. Knoblock, Dealing with the messiness of the web of data, Web Semantics: Science, Services and Agents on the World Wide Web (2012), doi:10.1016/j.websem.2012.05.001
Preguntas frecuentes
Qué es la web semántica
La web semántica es una web de datos, pero va mucho más allá de una web de documentos: es una extensión de la World Wide Web que permite a ordenadores y humanos trabajar en cooperación. A través de ella, los ordenadores comprenderán el significado de los contenidos que los humanos publican en la web.
¿Qué es la integración persona-máquina?
La integración hombre-máquina se produce en tres etapas. La primera en la que la máquina hace una cosa cada vez. En la segunda logrará varias cosas al mismo tiempo. La tercera es la superinteligencia, el momento de la singularidad.
¿Qué es la Inteligencia Artificial?
La inteligencia artificial es la inteligencia similar a la humana desplegada por mecanismos o programas informáticos, y es también un campo de estudio académico.
¿Qué es el lenguaje de marcado?
El lenguaje de marcado, o Markup, es un sistema moderno de anotación de textos para que sean distinguibles sintácticamente. La idea y la terminología evolucionaron a partir del “marcado” de manuscritos, es decir, las instrucciones para la revisión por parte de los editores, escritas tradicionalmente con bolígrafo azul en los manuscritos de los autores.