Conteúdos
O Conceito da Web Semântica
A Web Semântica é uma Web de Dados. Ela é o futuro da Web, um projeto em andamento que depende do trabalho de todos nós que acreditamos no poder da Web mais do que uma ferramenta, mas como uma plataforma que pode libertar o conhecimento humano como nunca existiu.
O objetivo por trás do desenvolvimento da Web Semântica é desenvolver a nossa web atual a transformando numa grande base de dados global, interconectada e facilmente inteligível tanto por seres humanos quanto por computadores.
Neste novo cenário será possível realizar pesquisas independente do tipo, formato e fonte dos dados e o resultado será encontrado.
E o resultado encontrado vai ser rico por conta da obtenção dos dados semanticamente inter-relacionados, gerando informação, muito além da atual lista de sites, desconectados entre si.
Veja o vídeo abaixo com Tim Berners-Lee no TED Talks antes de continuarmos, aqui nesta página.
Tim Berners-Lee explica A Web dos dados semânticos
A história da Web Semântica
A história da Web Semântica se confunde com a história da própria Web. Os fundadores da “rede mundial de computadores” são praticamente os mesmos que definiram e responderam a pergunta:
O que é Web Semântica?
Foi quando Tim Berners-Lee, James Hendler e Ora Lassila publicaram, em 2001, um artigo na revista Scientific American, chamado de The Semantic Web – A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities, em português “Web Semântica: um novo formato de conteúdo para a Web que tem significado para computadores vai iniciar uma revolução de novas possibilidades”¹ que nasceu a ideia da Web Semântica.
Saiba mais sobre a História da Web e saiba que são Tim Berners-Lee, James Hendler e Ora Lassila.
Desde o conceito inicial da web (uma rede de computadores servindo documentos hospedados em uma base de dados) até o atual estágio atual, ou seja, uma rede de conteúdos integrados que geram informações, um longo caminho foi trilhado. Muitos profissionais brilhantes contribuíram com o seu trabalho para que eu esteja aqui escrevendo e você me lendo.
Antes, quando queríamos alguma coisa, era preciso fazer uma busca baseada em palavras chaves. Você digitava na caixa de busca e uma série de links aparecia.
Hoje em dia esse cenário muda a cada momento, rapidamente!
Muito além de uma web de documentos
Esta nova web, que está nascendo do trabalho da comunidade de desenvolvedores, criadores de conteúdo, cientistas e outros, será a resultante do desenvolvimento deste trabalho coletivo. A nova Web será uma Web de Dados, onde os documentos online serão interpretados e da sua conexão tiraremos sentido, nexo.
Em resumo, a web semântica é uma extensão da World Wide Web que permite aos humanos que trabalhem entre si e com os computadores, em total estado de cooperação.
Interligando documentos através de seus significados, atribuindo significado a esses conteúdos, estamos criando o ambiente futuro da aquisição e compartilhamento de toda a informação humana na Terra. Uma fonte virtualmente infinita de criação de conhecimento.
Esta é a minha visão de futuro, que é compartilhada por milhares de outros profissionais que lidam com semântica e construção de conteúdos e projetos para essa nova Web.
Seja criando uma camada de conteúdos publicados na Internet, compreensíveis tanto pelo humano como por computadores, ou programando e desenvolvendo linguagens que permitiram essa conversa homem-máquina, todos podem fazer parte deste movimento.
O Futuro da Web é semântico
Esta nova web é chamada de Web Semântica por conta do sentido que uma marcação semântica correta traz aos conteúdos disponíveis na internet.
Pierre Lévy prevê dois grandes desafios no caminho da transformação da web num sistema semântico:
O primeiro é a ausência de profissionais habilitados para trabalharem na organização das informações;
O segundo a necessidade da adoção de um padrão para a chamada “web semântica” – que permitirá que todo o conhecimento seja coordenado automaticamente por conceitos, e não mais pelos links entre documentos.
Como resolveremos esses problemas é parte do sucesso, ou não, da Web Semântica.
Além da clássica “Web de documentos”
Organizações como W3C – World Wide Web Consortium – estão trabalhando para construir a tecnologia necessária para dar suporte a “Web of data“.
Eu compartilho da visão do W3C quando se trata de Web Semântica:
- As informações da web têm um significado exato
- As informações da web podem ser entendidas e processadas por computadores
- Os computadores podem integrar informações da web
Cientistas de todo mundo, neste momento trabalham para que os computadores consigam fazer um trabalho mais útil, através da criação de um sistema que suportem as interações confiáveis na rede.
Mas o que significa Web Semântica?
O termo “Web Semântica” refere-se também à visão da W3C da Web de dados vinculados.
A Web Semântica expande a Web, através do uso de dados estruturados, para que computadores entendam o conteúdo do seu site tanto quanto os humanos compreendem.
Alex Rodrigues
As tecnologias da Web semântica permitem que as pessoas criem armazenamentos de dados na Web, criem vocabulários e escrevam regras para o tratamento de dados.
Os dados vinculados são capacitados por tecnologias como RDF, SPARQL, OWL e SKOS.
“Isso significaria o fim da fragmentação da rede de informações, atualmente dividida por conta de barreiras de linguagem e escolhas diversas de sistemas de organização” – Pierre Lévy
Mas o que é a Web Semântica hoje?
As coisas podem estar um pouco confusas para você, que deve estar se perguntando o que é realmente essa tal de Web Semântica.
Talvez a definição mais inteligível é que o próprio Berners-Lee, no artigo de 2001:
“A Web Semântica é uma extensão da rede atual na qual a informação recebe um significado bem definido.”
Nós que estamos trabalhando na construção desta nova web, mais semântica, temos a ideia certa do significado das palavras acima quando vemos a Torre Semântica da Web:
A pilha da Web Semântica
Para criar esta na fase da Web são necessárias camadas e camadas de metadados, lógica e segurança para tornar a Os blocos básico da semântica.
Na representação visual acima, temos as camadas que envolvem uma pilha, uma torre de blocos, representando o conjunto do processo.
Esta pilha muda e evolui conforme os conceitos que formam a Web Semântica se desenvolvem.
Os blocos básico da semântica
No artigo Tim continua explicando quais são as “camadas” desta torre:
Os blocos básicos, compostos pelas Unicode e URIs indo até o XML, chegando nas camadas mais sofisticadas como vocabulários ontológicos e o RDF.
Muito trabalho ainda precisa ser feito!
Se você já entendeu do que estamos falando, percebeu como as coisas funcionam. Mas se está esperando que tudo isso esteja à disposição da sua empresa, precisa ir com calma.
Ainda é necessário muito trabalho a ser feito, apesar da velocidade do desenvolvimento da Web Semântica. Muitas das tecnologias que a compõem precisam ser melhor definidas, desenvolvidas. Tecnologias como o RDF, RDF Schema, Ontologias e Sistemas de integração precisam ser trabalhados por mais algum tempo para que estejam 100% prontos.
Mas se a Web Semântica ainda não decolou, o que fazer para ela sair dos planos e ir para a ação?
O primeiro problema: as pessoas querem participar
Vamos voltar a definição de Web Semântica:
A Web Semântica é uma extensão da web atual que permitirá que computadores e pessoas trabalhem em cooperação significando a informação.
O simples fato da Web Semântica ser uma extensão da rede atual (que também continua a ser construída), nos cria um problema: a parte computacional evolui bem, mas as pessoas precisam estar prontas para trabalhar em cooperação.
Para eu e você (e o restante dos usuários da Web), pouco importa se o RDF especifica corretamente os dados, ou se o XML está bem construído, nós queremos usar agora todas as capacidade desta nova Web. Queremos finalmente usar os computadores que criamos, no máximo das suas capacidades.
O segundo problema: os padrões são para as máquinas
A cada vez que um padrão técnico atinge a maturidade necessária para fazer a Web Semântica avançar ficamos mais perto do objetivo final, mas isso só serve para deixar a semântica cada vez mais sofisticada.
O aspecto técnico vai continuar evoluindo levando Web Semântica ao nível que precisamos.
Mas eles são para as máquinas, foram programados para rodar em sistemas que não conversam uns com os outros e por isso é tão urgente criar uma “camada semântica” ou “linguagem universal semântica” que faça o meio de campo entre os dados e as pessoas.
O terceiro problema: a integração homens-máquinas
A adaptação das tecnologias às necessidades das pessoas é o terceiro problema a ser resolvido. A conexão entre esses dois mundos aparentemente separados: pessoas e computadores precisa ser feita.
Precisamos amadurecer as tecnologias envolvidas na Web Semântica. Assim que finalizarmos esta etapa, a quantidade absurda de dados que geramos todos os dias, estará realmente a disposição das pessoas que precisam deles.
O quarto problema: lidar com a bagunça da Web de Dados
No artigo, “Dealing with the messiness of the web of data” de Stefan Schlobach e Craig A. Knoblock¹, encontrei um quarto e complexo problema. Eles explicam:
A pesquisa na Web Semântica, que agora está em sua segunda década, tem tido sucesso em encorajar as pessoas a publicar dados na Web de formas estruturadas, vinculadas e padronizadas. O sucesso do que agora se tornou a Web of Data pode ser visto pelo grande número de triplos disponíveis nas iniciativas Linked Open Data, Linked Life Data e Open Government.
No entanto, esse aumento de dados torna muitas das suposições estabelecidas inadequadas e oferece uma série de novos desafios de pesquisa.
Em total contraste com os primeiros aplicativos da Web Semântica que lidavam com pequenas ontologias e conjuntos de dados feitos à mão, a nova Web of Data vem com uma infinidade de visões de mundo contraditórias e contém incompletas, inconsistentes, incorretas, mutáveis e opinativas em formação.
Essas informações não vêm apenas de fontes acadêmicas e instituições confiáveis, mas muitas vezes são criadas, copiadas ou traduzidas pela comunidade.
Resumindo, os dados são confusos e difíceis de usar. Esta edição especial é dedicada a essa confusão e como lidar com ela. As abordagens neste documento podem ser amplamente classificadas em duas classes: primeiro, para fornecer diretrizes ou melhores práticas para evitar a confusão em primeiro lugar, e, em segundo lugar, dando aos usuários uma infraestrutura e técnicas para construir aplicativos úteis, apesar da bagunça.
O Futuro da Web Semântica
Para organizar as informações disponíveis hoje em dia contamos com a ajuda da inteligência artificial (e outras novas tecnologias), desta forma serão utilizadas novas técnicas para dar significado para os conteúdos distribuídos pela internet afora.
Mas para a web chegar ao nível de amadurecimento que precisamos não se trata somente dela ser capaz de relacionar conteúdos. Quem trabalha criando conteúdo precisam ter a vontade e o conhecimento técnico para usar tecnologias como como RDF, SPARQL, OWL e SKOS.
A Web Semântica é uma rede de dados vinculados
Imagine essas tecnologias como janelas para os conteúdos que sua empresa tem criado por anos a fio (ou vai criar) e que hoje em dia estão paradas, inacessíveis no seu site, em um banco de dados em computadores na empresa, mas que poderiam estar sendo usados por pessoas do mundo todo, para gerar informação.
Vocabulários para organizar dados
É extremamente importante esse trabalho de organização dos dados. Usando o OWL (para construir vocabulários ou “ontologias”) e o SKOS (para criar sistemas de organização do conhecimento) é possível enriquecer dados incrementando-os com novos significados. Isso permite que mais pessoas (e mais máquinas) façam mais com os dados disponíveis.
Consultando a Informação do Mundo todo!
As linguagens deconsulta são as melhores amigas dos dados.
Anteriormente vimos que a Web Semântica é uma Web de Dados. Então para ter acesso a todos esses dados precisamos criar uma linguagem que consulte, que procure, nesses bancos de dados atrás de informação.
SPARQL é a linguagem de consulta da Web Semântica.
Modelo baseado em NLP e Web Semântica para Recuperação da Informação
Nesta live, que faz parte da série sobre Inteligência Artificial e Web Semântica, Sueliton Ribeiro (Líder Especialista Sênior na CI&T) e o Bots Conversacionais e o Caio mostra o resultado da tese de Doutorado “MODELO COMPUTACIONAL DE RECUPERAÇÃO DA INFORMAÇÃO PARA REPOSITÓRIOS DIGITAIS UTILIZANDO ONTOLOGIAS” e é nesse ponto que gostaria que visse a sua fala para ver como o uso das ferramentas da Web Semântica em conjunto com Ontologias e Inteligência Artificial e Aprendizado de Máquina podem moldar o futuro da Web Semântica.
Como uma Web semântica pode ajudar a sua empresa?
O que as micro e pequenas empresas poderiam fazer para participar desta evolução da Web?
Vamos ver o trabalho que o W3C vem fazendo com diferentes indústrias.
Trabalhando com empresas de saúde, ciências humanas e da vida, Governo Eletrônico e Energia para melhorar a colaboração, pesquisa e desenvolvimento, e adoção de inovação e Web Semântica.
Por exemplo, auxiliando na tomada de decisões em pesquisa clínica, as tecnologias da Web Semântica irão conectar muitas formas de informação biológica e médica em todas as instituições.
Agora pense comigo: a sua empresa gera dados? O tempo todo correto? Basta olhar para a quantidade de planilhas que estão no seu computador.
Mas que tipo de informação esses dados geram para você, para as empresas com que você trabalha, para o mercado onde está inserido?
Sabia que dentro do seu computador estão os dados necessários para a sua empresa começar um excelente trabalho de SEO?
O que é Web Semântica?
Saiba mais sobre o SEO Semântico e a Web Semântica.
Sim! Exatamente isso o que eu afirmei: a quantidade enorme de dados que toda empresa gera diariamente é o início de um trabalho que chamamos de SEO Semântico.
Nesse processo criamos um vocabulário para o seu negócio, com os temas importantes para o seu mercado, e criamos conteúdos (baseados em dados) para que os buscadores inteligentes de hoje em dia, entendam que o seu site é relevante o suficiente para aparecer nas buscas.
O SEO e a Web Semântica
Muita coisa mudou desde a invenção da Web e desde que Tim Berners-Lee desenvolveu as bases da Web Semântica. A web passou de um punhado de sites para milhões de plataformas e bilhões de páginas. Antes era limitada ao acesso de uns poucos beneficiados, que estavam nas Universidades ou em casas que podiam comprar um comprar um computador.
Hoje, na maioria dos lugares, muitos têm acesso a uma rede de acesso (quase) irrestríto, com páginas, plataformas e sistemas dos mais variados tipos. Tudo isso sendo rastreado, ranqueado, classificado e mostrado por modernos ferramentas de buscas, baseadas em algorítimos poderosos, que nem os seus programadores tem a certeza de como eles funcionam.
Como é otimizar um site para uma web semântica?
Existe um desafio e uma oportunidade na web semântica para donos de sites. O desafio é criar conteúdos que vão além de textos separados em an páginas e posts de blog. O que precisa ser feito é pensar no mercado que está inserido, quais as entidades que fazem parte deste domínio (campo do conhecimento) e criar conteúdo em volta dele.
Mas o que é essa tal de entidade?
Bom, é simples: são os temas básicos do seu mercado. Vamos a um exemplo?
O meu mercado é o SEO, e nesse domínio, o da de otimização de sites, temos:
- Search Engine;
- Desenvolvimento de sites;
- SEO On-page;
- Link Building;
- Marketing de Conteúdo;
- Search Engine;
- AEO;
- Algoritmos;
- e muito mais…
Essas são as entidades, temas específicos, básicos, de um mercado (adaptando um conceito básico da Web Semântica), que usamos sempre mas que precisam ser explicados e definidos para o nosso público, que muitas vezes é leigo no assunto.
Então, essa é a estratégia que chamamos de SEO Semântico!
A Web Semântica, como já disse, é uma Web de sentido. Os documentos que estão na web hoje começam a ser rastreados, ranqueados, classificados e mostrados de formas que antes não eram possíveis.
Rich snippets abaixo são uma mostra o que pode ser feito quando um buscador entende o seu conteúdo:
O que você precisa fazer é ter um site com um código bem feito, páginas planejadas e desenvolvidas segundo as estratégias do SEO Semântico e criar conteúdo que explique e conecte as entidades que estão no seu mercado.
Mas isso já é outro assunto e você pode ler tudo sobre SEO aqui no nosso blog!
Uma sugestão de leitura avançada
Web 2.0 and Semantic Web
by Vladan Devedžić, Dragan Gaševic
A Web 2.0 descreve a tendência da tecnologia e do design da Web que visa aumentar a criatividade, o compartilhamento de informações e, principalmente, a colaboração entre os usuários.
A Web Semântica refere-se à interação inteligente entre sistemas e aplicativos na Web, implementando ontologias, anotações semânticas de conteúdo da Web e raciocínio.
Seu objetivo final é tornar os dados compreensíveis para os computadores e, assim, se abrir para uma utilidade e manipulação muito maiores.
Editada por dois autores da Springer, esta edição especial do AoIS apresentará pesquisas de ponta sobre essas tendências muitas vezes opostas na computação e apoiará a discussão sobre as sinergias e controvérsias inerentes às duas tecnologias, ao mesmo tempo considerando quais outras tecnologias podem contribuir para ambos.
Avanços dramáticos em arquiteturas orientadas a serviços, engenharia orientada a modelos e tecnologias de mineração da Web são apenas alguns dos desenvolvimentos que podem ter um impacto considerável na Web 2.0 e na Web Semântica, e todos eles serão abordados neste volume.
Esse é um material importante para qualquer pessoa que esteja pesquisando dados e tecnologias de mineração na Web, desenvolvimento de aplicativos baseados na Web, AI aplicada ou arquiteturas orientadas a serviços.
- Publisher: Springer US
- Language: English
- Web 2.0 & Semantic Web
- Author: Vladan Devedžić, Dragan Gaševic
- Published by Springer US
- ISBN: 978-1-4419-1218-3
Table of Contents:
- TagFusion: A System for Integration and Leveraging of Collaborative Tagurns
- Semantic Enhancement of Social Tagging Systems
- Adaptation and Recommendation Techniques to Improve the Quality of Annotations and the Relevance of Resources in Web 2.0 and Semantic Web-Based Applications
- Adaptive Reactive Rich Internet Applications
- Towards Enhanced Usability of Natural Language Interfaces to Knowledge Bases
- Semantic Document Model to Enhance Data and Knowledge Interoperability
- Ontology-Based Data Mining in Digital Libraries
- An Assessment System on the Semantic Web
Para comprar:
¹Berners-Lee, Tim &amn”>p; Hendler, James & Lassila, Ora. (2001). The Semantic Web: A New Form of Web Content That is Meaningful to Computers Will Unleash a Revolution of New Possibilities. ScientificAmerican.com.
¹ S. Schlobach, C.A. Knoblock, Dealing with the messiness of the web of data, Web Semantics: Science, Services and Agents on the World Wide Web (2012), doi:10.1016/j.websem.2012.05.001
Perguntas Frequentes
O que é Web Semântica
A Web Semântica é uma Web de Dados mas vai muito além de uma web de documentos, é uma extensão da World Wide Web que permite aos computadores e humanos trabalharem em cooperação. Através dela computadores vão entender o sentido dos conteúdos que os humanos publicam na web.
O que é Integração homem-máquina?
A Integração homem-máquina se dá em três estágios. O primeiro onde a máquina faz uma coisa por vez. No segundo ela vai realizar várias coisas ao mesmo tempo. O terceiro é a superinteligência, o momento da singularidade.
O que é Inteligência Artificial?
Inteligência artificial é a inteligência similar à humana exibida por mecanismos ou software, além de também ser um campo de estudo acadêmico.
O que é Linguagem de Marcação?
Linguagem de marcação, ou Markup, é um sistema moderno para anotação de um texto de modo que ele seja sintaticamente distinguível. A ideia e terminologia evoluíram da “marcação” de manuscritos, isto é, das instruções de revisão pelos editores, tradicionalmente escritas com caneta azul nos manuscritos dos autores.