Resumo:
No âmbito da gestão de recursos informacionais os modelos e métodos de
organização e recuperação de informações sempre estiveram condicionados às
tecnologias utilizadas, de modo que a partir do desenvolvimento e
intensificação da utilização dos meios digitais uma nova gama de
possibilidades vem sendo incorporada, atingindo um estágio em que os modelos
clássicos de organização e recuperação de informações precisam ser
(re)pensados sob diferentes perspectivas, evidenciando a necessidade de
novos métodos que possibilitem otimizar a recuperação de informações. Este
artigo compreende uma discussão de literatura, de caráter interdisciplinar,
com o objetivo de favorecer a “desmistificação” dos conceitos e tecnologias
subjacentes ao projeto Web Semântica, avaliando em que medida a área de
Ciência da Informação pode contribuir para sua concretização e ressaltando
os reflexos das novas abordagens tecnológicas de representação e recuperação
de recursos informacionais no corpus teórico da área de Ciência da
Informação.
Palavras-chave: Web semântica; Recuperação de
informação; Ontologia; Sistemas de informação; Gestão de recursos
informacionais.
Abstract: In the field of information resources
management, the models and methods of information organization and retrieval
have always been linked to the current technologies in a way that a new
range of possibilities have appeared from the development and improvement on
the use of digital means, reaching a stage in which the classical models of
information organization and retrieval must be (re)thought under different
perspectives, highlighting the need of new methods that allow to optimize
the information retrieval. This article brings out an interdisciplinary
literature discussion, aiming to clarify the concepts and technologies
related to the Semantic Web project, evaluating how the Information Science
area can contribute to its concretization, as well as bringing out the
consequences of new technological approaches of information resources
representation and retrieval in the Information Science theoretical corpus.
Keywords:
Semantic web; Information retrieval; Ontology; Information system;
Information resources management.
Introdução
É inegável o fato de que a ambiente o Web constitui-se como uma das mais ricas fontes de informações da atualidade, apresentando-se também como um ambiente interativo que possibilita a troca de informações em escala global. Tal fato, que à primeira vista apresenta ser o seu maior apelo, é ao mesmo tempo um de seus fatores críticos.
Nos últimos anos, o avanço exponencial na quantidade de recursos
informacionais disponíveis no ambiente Web vêm conduzindo a um estágio em
que os modelos clássicos de representação e recuperação de informações
precisam ser (re)pensados sob diferentes perspectivas, pois considerando a
representação como elemento fundamental, para a garantia de qualidade na
recuperação, apresenta-se como desafio a necessidade de singularização
contextual na reconstrução do conhecimento, a partir da determinação de
requisitos de qualidade e relevância das informações, que permitam
categorizar e organizar, de maneira eficiente, o “oceano” de dados
disponíveis, favorecendo a identificação de informações que realmente
interessam ao usuário.
Tradicionalmente a Internet, uma infra-estrutura de redes, servidores e
canais de comunicação, popularizada principalmente a partir do
desenvolvimento da World Wide Web, ou simplesmente Web, tem como uma
de suas principais funcionalidades a tarefa de disponibilizar conteúdos
informacionais de modo que estes possam ser visualizados e interpretados por
usuários humanos.
Contudo, a partir do final da década de 1990, começaram a formalizar-se pesquisas relacionadas ao desenvolvimento de uma nova geração da Web, com o objetivo de possibilitar a incorporação de ligações semânticas aos recursos informacionais, de modo que os próprios computadores possam “compreendê-las” de forma automatizada. Machine understandable information, com esta sucinta expressão Berners-Lee (1998) impulsionou os primeiros estudos em direção ao projeto da Web Semântica.
Esta investigação compreende uma discussão de literatura acerca o projeto
Web Semântica, buscando favorecer a “desmistificação” dos conceitos e
tecnologias subjacentes e avaliar em que medida a área de Ciência da
Informação pode contribuir para sua concretização, ressaltando os reflexos
das novas abordagens tecnológicas de representação e recuperação de recursos
informacionais no corpus teórico da área de Ciência da Informação.
Na próxima seção busca-se identificar a fundamentação teórica inerente ao
projeto Web Semântica, descrevendo as principais tecnologias necessárias
para sua concretização e como estas se relacionam em sua arquitetura de
camadas. Na seção 3 são apresentadas e discutidas novas abordagens
tecnológicas de representação e recuperação de recursos informacionais,
contextualizando-as a partir do enfoque da área de Ciência da Informação. A
seção 4 apresenta os desafios e responsabilidades dos profissionais da
informação no âmbito do projeto Web Semântica, a partir de um “Espectro
Funcional” de sua arquitetura de camadas, proposto com o intuito de
omitir detalhes técnicos e facilitar a compreensão de suas principais
características. Ainda neste trabalho são apresentadas as conclusões da
análise realizada.
Arquitetura da Web Semântica
Desde seus primórdios o projeto Web Semântica foi concebido como um conjunto
de tecnologias relacionadas, de modo que no ano de 2000 o World Wide Web
Consortium (W3C) [L], tendo como seu maior expoente
Tim Berners-Lee ,
divulgou publicamente a primeira proposta de arquitetura da
Web Semântica, com
base em uma série de camadas sobrepostas, onde cada camada ou tecnologia
deveria obrigatoriamente ser complementar e compatível com as camadas
inferiores, ao mesmo tempo em que não deveria depender das camadas
superiores, possibilitando assim uma estrutura idealmente escalonável, que
indicasse os passos e as tecnologias necessários para a concretização do
projeto Web Semântica.
Segundo Bernes-Lee (1999), o primeiro passo para o desenvolvimento da Web
Semântica seria a inclusão de dados em um formato que os sistemas
computacionais pudessem naturalmente compreender de forma direta ou
indireta. Após a publicação desta definição, em seu livro Weaving the Web, a
expressão “Web Semântica” passou a ser disseminada como um título genérico
que representa uma série de pesquisas que têm como objetivo principal
possibilitar um melhor aproveitamento das potencialidades do ambiente Web,
onde por meio do uso intensivo de linguagens computacionais e instrumentos
de metadados espera-se obter o acesso automatizado às informações de maneira
mais precisa, a partir da utilização de processamentos semânticos e
heurísticas automáticas.
Conforme afirmam Berners-Lee et al. (2001, p.2,
tradução nossa): “A Web Semântica é uma extensão da Web atual, onde a
informação possui um significado claro e bem definido, possibilitando uma
melhor interação entre computadores e pessoas”. Assim, observa-se que
comparando com as abordagens tradicionalmente desenvolvidas, o projeto Web
Semântica constitui-se como uma tentativa inversa de solução que tem como
objetivo desenvolver meios para que as máquinas possam servir aos humanos de
maneira mais eficiente, mas para isso torna-se necessário construir
instrumentos que forneçam sentido lógico e semântico aos computadores.
Com o intuito de ilustrar as dificuldades encontradas nos processos de
recuperação de informações na Web atual pode-se analisar os resultados de
uma busca realizada por meio dos tradicionais “motores de busca” (search
engines), como por exemplo, a busca de textos científicos de um determinado
autor. Utilizando-se, por exemplo, “Arlindo Machado” como expressão de busca
ter-se-ia como resultado todos os tipos de documentos que contenham “Arlindo
Machado” em alguma parte de seu conteúdo.
Caso esta mesma busca seja realizada utilizando-se apenas o sobrenome deste autor o problema se agravaria ainda mais, pois “Machado” pode igualmente se referir ao sobrenome de uma pessoa, com também a um instrumento cortante utilizado para rachar madeira e a Web atual não fornece condições que possibilitem distinguir entre os vários significados semânticos que um termo pode comportar, o que favorece a recuperação de uma grande quantidade de documentos irrelevantes ou não relacionados com a busca realizada, tornando algumas vezes inexeqüível a tarefa de localizar informações específicas no ambiente Web.
Segundo Koivunen e Miller (2001), um dos princípios fundamentais do projeto
Web Semântica é o fato de que “tudo” pode ser identificado por um Uniform
Resource Identifier (URI), de modo que pessoas, lugares e elementos do mundo
físico possam ser referenciados a partir de tais identificadores.
Possibilitando assim identificar uma instituição a partir do URI de
sua página Web, por exemplo, ou uma pessoa por meio do URI de sua caixa de
e-mail.
Conforme afirmam Berners-Lee et al. (1994) e
Fielding (1995), um URI é um padrão conjunto que abarca os conceitos de
Uniform Resource Lacator (URL) e do Uniform Resource Name (URN), de modo que
pode ser representado por qualquer um destes, ou por ambos. Fazendo uma
analogia de um recurso disponível no ambiente Web com um livro armazenado em
uma biblioteca, pode-se considerar o URN de um recurso como o número
ISBN de
um livro, os quais fornecem uma identificação exclusiva, porém não
oferecendo informações a respeito de onde o livro/recurso pode ser obtido.
Do mesmo modo, pode-se considerar que o código que identifica onde um livro está localizado, em meio ao acervo de uma biblioteca, desempenha a mesma função do URL de um recurso no ambiente Web, indicando o local onde o livro/recurso pode ser obtido. Segundo Krishnamurthy e Rexford (2001, p.183), o modo mais popular de apresentação de um URI é utilizando um URL, o qual pode ser considerado como uma cadeia de caracteres formada por componentes padronizados.
Outra característica importante do projeto Web Semântica é que os links
podem possuir diferentes tipos, possibilitando a definição de conceitos
úteis para as máquinas, como por exemplo, indicando que um recurso é uma
versão de outro recurso ou que contém informações a respeito de uma
determinada pessoa. A Web atual também consiste de recursos e links, porém
estes links são criados apenas para o uso de seres humanos, de modo que é
relativamente simples para um ser humano identificar se um link, contido em
um determinado recurso, referencia uma fatura, um romance ou um trabalho
científico, contudo tais informações não estão acessíveis para as máquinas,
pois os links na Web atual não indicam formalmente quais são os tipos de
relações existentes entre os recursos referenciados.
Devido ao grande número de pesquisadores envolvidos no projeto Web
Semântica, não tardou para que a arquitetura proposta inicialmente pelo The
World Wide Web Consortium, W3C
sofresse modificações, sendo que em 2005 foi publicada uma nova proposta de
arquitetura incorporando novas tecnologias, com o intuito de possibilitar
uma maior integração entre as camadas e facilitar a realização de consultas
semânticas. Como pode ser verificado na figura 1.
FIGURA 1 – Arquitetura da web semântica proposta em 2005

Fonte: Berners-Lee, 2005. p.17
Para fins deste estudo, baseando-se na proposta de arquitetura apresentada
acima, pode-se descrever as principais tecnologias e camadas inerentes ao
projeto Web Semântica, sucintamente, da seguinte maneira:
URI: Conforme apresentado anteriormente, tal componente consiste de um Identificador Único de Recursos que possibilita a definição e adoção, de maneira precisa, de nomes aos recursos e seus respectivos endereços na Internet.
UNICODE: Esquema padronizado de codificação dos caracteres, que diminui consideravelmente a possibilidade de redundâncias dos dados, pois funciona independentemente da plataforma utilizada.
Signature: Conjunto de tecnologias desenvolvidas com o intuito de substituir em ambiente computacional a função exercida pela assinatura formal de uma pessoa em um suporte físico. Segundo Pfützenreuter (2004), a assinatura digital garante a integridade dos dados e a comprovação da procedência dos recursos.
Encryption: Consiste de um processo em que as informações são cifradas de modo que não possam ser interpretadas por qualquer pessoa ou sistema computacional, garantindo assim a confidencialidade das informações. Segundo Nakamura e Geus (2003, p.287), “[...] encryption é o processo de disfarçar a mensagem original, [...], de tal modo que sua substância é escondida em uma mensagem com texto cifrado”.
XML: É uma linguagem computacional que possibilita a estruturação dos dados por meio da definição de elementos e atributos, e que permite a descrição de regras sintáticas para a análise e validação dos recursos.
Namespace: Coleção de nomes, identificados por um URI, que são utilizados em documentos XML para validar elementos e atributos.
RDF Core: Núcleo que compreende as especificações do modelo e a sintaxe da Resource Description Framework (Estrutura de Descrição de Recursos), possibilitando a descrição dos recursos por meio de suas propriedades e valores. Segundo Daum e Merten (2002), a RDF pode ser vista como uma tecnologia de capacitação para a modelagem semântica, sobre a qual podem ser criadas linguagens computacionais específicas.
RDF Schema: Utilizada para a descrição do vocabulário RDF, possibilitando a definição de taxonomias de recursos em termos de uma hierarquia de classes. Segundo Brickley (2004), a RDF Schema é uma extensão semântica do código RDF, fornecendo mecanismos para descrever grupos de recursos e os relacionamentos existentes entre eles.
SparQL: Segundo alguns pesquisadores pertencentes ao W3C, (Prud'hommeaux e Seaborne, 2005; Clark, 2005), SparQL é uma linguagem computacional utilizada para realizar consultas a partir de estruturas RDF, favorecendo a recuperação de informações de maneira mais eficaz. Tal linguagem ainda não se encontra completamente padronizada, motivo pelo qual não é recomendada oficialmente pelo W3C, sendo denominada como uma tecnologia candidata à recomendação.
DLP: A DLP também é uma tecnologia candidata à recomendação e constitui a intersecção entre os dois principais paradigmas utilizados atualmente para desenvolver sistemas computacionais baseados em representação do conhecimento, Lógica Descritiva (OWL DL) e Programação Lógica (F-Logic), fornecendo uma estrutura extremamente flexível. (Grosof , (2003) e Vrandecic. (2005)). Deste modo, a DLP ainda não é considerada uma linguagem de representação do conhecimento, mas sim como uma “ponte” que possibilita a união entre os dois principais paradigmas utilizados.
OWL: Linguagem computacional recomendada pelo W3C para o desenvolvimento de ontologias. Segundo McGuinness e Harmelen (2004), a linguagem OWL permite descrever formalmente, de modo mais eficiente, os aspectos semânticos dos termos utilizados e seus respectivos relacionamentos, possibilitando representações mais abrangentes das linguagens RDF e RDF Schema e favorecendo uma maior interoperabilidade.
Rules: Permite a definição de regras lógicas relacionadas aos recursos informacionais. Segundo Daconta, Obrst e Smith (2003), esta camada possibilita uma espécie de “Introdução Lógica”, enquanto que a camada superior, Logic Framework, possibilita a incorporação de “Lógicas Avançadas”.
Logic Framework: Camada para a definição de regras mais abrangentes, utilizadas no tratamento das informações descritas nos níveis inferiores, possibilitando que agentes computacionais possam realizar inferências automáticas a partir das relações existentes entre os recursos informacionais, podendo inclusive inferir novas informações.
Proof: Espera-se que esta camada possibilite a verificação/comprovação da coerência lógica dos recursos, de modo que os aspectos semânticos das informações estejam descritos de maneira consideravelmente adequada, atendendo a todos os requisitos das camadas inferiores.
Trust: Camada de Confiança, a partir da qual se espera garantir que as informações estejam representadas de modo correto, possibilitando um certo grau de confiabilidade.
A partir de tais definições observa-se que o projeto Web Semântica
encontra-se em constante desenvolvimento, de modo que muitas das tecnologias
propostas em sua arquitetura ainda estão em fase de avaliação e verificação
de seus resultados. Assim sendo, poucos meses após a publicação da
arquitetura descrita acima foram apresentadas críticas e sugestões de
alterações para a mesma. Segundo Horrocks (2005), algumas das
linguagens apresentadas nesta arquitetura não são semanticamente compatíveis
de forma direta, como a
Description Logic Programs (DLP) e a linguagem de
desenvolvimento de ontologias
Web Ontology Language, OWL, de modo que tais tecnologias deveriam ser
apresentadas paralelamente ao invés de sobrepostas, formando duas torres em
uma parte da arquitetura, conforme figura 2, a seguir.
FIGURA 2 – Sugestão de alteração na arquitetura proposta para web semântica

adaptado de: Berners-Lee , 2005, p.17 e Horrocks et al., 2005, p. 3.
Por se tratar de um projeto em fase de desenvolvimento verifica-se que
provavelmente a arquitetura da Web Semântica ainda sofrerá modificações,
para comprovar esta tendência basta observar que as camadas “Logic
Framework” e “Prof” ainda não possuem sequer tecnologias recomendadas para
suas implementações, pois apesar da padronização da linguagem
Web Ontology Language, OWL, como
recomendação para o desenvolvimento de ontologias, atualmente ainda não está
muito claro como esta camada irá relacionar-se com as demais camadas da
arquitetura, informação esta imprescindível para o desenvolvimento das
camadas superiores.
É importante ressaltar que apesar das novas tecnologias incorporadas na
proposta de arquitetura publicada em 2005 pelo
Wide Web Consortium,,W3C e das críticas e
sugestões de alterações de tal arquitetura, é possível identificar aspectos
que não devem ser alterados no projeto Web Semântica, afinal novas
tecnologias estarão sempre sendo desenvolvidas, mas os conceitos básicos que
norteiam o desenvolvimento do projeto Web Semântica tendem a permanecer
estáveis.
Novas abordagens de representação e recuperação de recursos
informacionais
Atualmente, verifica-se uma tendência de aproximação entre as áreas de
Ciência da Informação e Ciência da Computação, principalmente no que tange
ao desenvolvimento de novos instrumentos de representação e recuperação de
recursos informacionais. Segundo Saracevic (1996), a recuperação de
informação pode ser considerada como a vertente tecnológica da Ciência da
Informação.
No entanto, apesar de relacionadas, é possível identificar um distanciamento
teórico entre tais Ciências. Ferneda (2003, p.1-2) ao comentar sobre as
relações existentes entre a Ciência da Informação e a Ciência da Computação,
ressalta que: “[...] a informação, objeto de comum interesse de ambas as
ciências, é paradoxalmente o que mais as distancia”.
Tal afirmação sustenta-se no fato de que ambas as Ciências utilizam
diferentes conceitos ao se referir ao termo informação. Segundo
Le Coadic
(1996, p.5), para a área de Ciência da Informação, a informação “[...]
comporta um elemento de sentido. É um significado transmitido a um ser
consciente por meio de uma mensagem inscrita em um suporte espaço-temporal:
impresso, sinal-elétrico, onda sonora, etc.”. Em contra partida, para a área
de Ciência da Computação o conceito de informação tradicionalmente
restringe-se aos conceitos relacionados com a Teoria Matemática da
Informação, mais especificamente com os fundamentos estabelecidos por
Shannon e Weaver (1949), presentes no artigo intitulado The Mathematical
Theory of Communication, onde é apresentada uma teoria matemática para a
transmissão de mensagens e troca de sinais, a qual não se preocupa com a
semântica dos dados, porém adequada para a construção de sistemas
computacionais, onde a informação possa ser quantificada, processada e
transmitida por máquinas. Conforme afirma Shannon (1948, p.3):
“the theory
of computing machines”.
A identificação de tal enfoque na área de Ciência da Computação pode ser
comprovada a partir da análise de sua literatura e dos resultados práticos
identificados no seu campo de atuação. No contexto nacional também é
possível verificar tal abordagem nas diretrizes curriculares de cursos na
área de Computação e Informática elaboradas pela Comissão de Especialistas
de Ensino em Computação e Informática (CEEInf, 1999) e disponibilizadas pelo
Ministério da Educação (MEC), assim como no currículo de referência para
cursos de graduação em Computação, proposto pela Sociedade Brasileira de
Computação (SBC, 1999, p.14), no qual figura como parte do currículo básico
para cursos de computação, o estudo de:
Princípios da teoria da informação: codificação da informação e sua medida,
entropia de código. Transmissão da informação e modelagem do sistema de
transmissão, maximização do fluxo de informação por um canal. Processamento
digital de sinais, análise espectral. Transmissão analógica e digital.
Segundo Capurro (2003), embora a área de Ciência da Informação também tenha
sido influenciada em seu campo teórico pela assim chamada “information theory” de
Shannon e Weaver, a mesma não se limita a esta visão puramente
fisicista, abarcando também outros aspectos: contextuais, semânticos,
sociais e culturais.
Contextualizando tais definições, verifica-se que a Ciência da Computação
tradicionalmente preocupa-se com o desenvolvimento de sistemas
computacionais que possibilitem “manusear” informações, sem necessariamente
preocupar-se com os aspectos semânticos subjacentes, enquanto que a Ciência
da Informação preocupa-se com a natureza das informações, assim como sua
comunicação e uso.
Utilizando como exemplo um processo de recuperação de informação no ambiente
Web, pode-se verificar que no âmbito da área de Ciência da Informação é
necessário levar em consideração os componentes semânticos inerentes a tal
processo, no entanto, de acordo com o enfoque da área de Ciência da
Computação, observa-se que os tradicionais “motores de busca”,
search engines, baseiam-se exclusivamente na recuperação de dados, não levando em
consideração as semânticas contidas nas páginas da Web, recuperando apenas
seqüências de caracteres que satisfaçam determinadas condições de busca.
Um dos principais “slogans” do projeto Web Semântica baseia-se na
possibilidade de permitir a classificação de recursos informacionais
disponíveis no ambiente Web, “rotulando-os” a partir de categorias que
possam ser “interpretadas” automaticamente pelos computadores. Analisando
tal definição sob o prisma da área de Ciência da Informação pode-se fazer
uma analogia à definição apresentada por Lancaster (2004, p. 21):
No campo do armazenamento e recuperação de informação a classificação de documentos refere-se à formação de classes de itens com base no conteúdo temático. Tesauros, cabeçalhos de assuntos e esquemas de classificação bibliográfica são essencialmente listas de rótulos com os quais se identificam e, por ventura, se organizam essas classes.
Para tornar possível a classificação e categorização dos recursos informacionais disponíveis no ambiente Web, a ponto de permitir a realização de inferências automáticas, como esperam os idealizadores e defensores do projeto Web Semântica, é necessário primeiramente que os computadores sejam capazes de captar as informações descritivas e temáticas inerentes a tais recursos. Tal fato justifica o motivo pelo qual o projeto Web Semântica tem alavancado uma forte demanda de desenvolvimento de modelos/instrumentos de representação no âmbito computacional.
Conforme apresenta Campos (2004), no contexto da área de Ciência da
Computação, espera-se que os instrumentos de representação auxiliem na
implementação de estruturas computáveis, que possibilitem aos computadores a
realização de tarefas mais sofisticadas de forma automatizada, enquanto que
no âmbito da área de Ciência da Informação, os modelos de representação são
utilizados há muito tempo na elaboração de linguagens documentárias verbais
e notacionais, visando à recuperação de informação e à organização dos
conteúdos informacionais dos documentos.
Nos últimos anos, diferentes abordagens computacionais têm sido propostas
com o objetivo de favorecer o aperfeiçoamento dos processos de representação
e classificação de recursos informacionais, contudo pode-se destacar o
desenvolvimento de ontologias como um dos principais temas que vem
despertando o interesse de pesquisadores, das mais variadas áreas do
conhecimento, empenhados no estudo desta nova e instigante categoria de
instrumentos de representação. Segundo Ramalho (2006, p.97), no âmbito do
projeto Web Semântica pode-se definir ontologia como:
Um artefato tecnológico que descreve um modelo conceitual de um determinado domínio em uma linguagem lógica e formal, a partir da descrição dos aspectos semânticos de conteúdos informacionais, possibilitando a realização de inferências automáticas por programas computacionais.
Entre as inúmeras iniciativas relacionadas ao desenvolvimento de
instrumentos de representação e recuperação de recursos informacionais
pode-se destacar os estudos desenvolvidos no
Semantic Web Advanced
Development for Europe2 (SWAD-E)[2], que têm demonstrado um forte interesse de
pesquisadores ligados ao W3C nos instrumentos de representação
tradicionalmente utilizados no âmbito da área de Ciência da Informação,
conforme pode ser identificado na SWAD-E Thesaurus Activity [3], uma iniciativa
que tem como objetivo principal desenvolver tecnologias que permitam
expressar, de maneira formal, a estrutura básica e o conteúdo de tesauros e
vocabulários controlados, possibilitando a sua utilização de forma
automatizada em Knowledge Organization Systems (KOS), Sistemas de
Organização do Conhecimento.
Segundo Binding e Tudhope (2004), é possível identificar nos últimos anos
uma crescente demanda por pesquisas relacionadas a Knowledge Organization
Systems, KOS, devido
principalmente ao rápido crescimento de comunidades científicas empenhadas
no desenvolvimento de projetos relacionados com: Web Semântica,
Semantic
Grid e Bibliotecas Digitais.
Várias iniciativas têm sido propostas com o intuito de atualizar os padrões
de tesauros internacionais para que considerem esses desenvolvimentos
on-line, paralelamente o W3C tem se empenhado no desenvolvimento de padrões
que dêem suporte ao uso de Knowledge Organization Systems, KOS a partir da estrutura da Web Semântica, entre
os quais pode-se destacar o Simple Knowledge Organisation System (SKOS).
Segundo trabalhos apresentados por pesquisadores ligados ao
Wide Web Consortium, W3C (Miles e Brickley, 2005), o
Simple Knowledge Organisation System, SKOS representa desde estruturas simples utilizadas para
expressar sistemas de organização do conhecimento, até estruturas mais
complexas e abrangentes, fornecendo um modelo para expressar a estrutura
básica e o conteúdo de tesauros, esquemas de classificação, lista de
cabeçalho de assunto, taxonomias e também outros esquemas conceituais.
O Simple Knowledge Organisation System, SKOS é um modelo, ainda em fase de desenvolvimento, que compreende um
conjunto de propriedades descritas em
Resource Description Framework, RDF, a partir de classes RDFS, que
podem ser utilizadas para expressar o conteúdo e a estrutura de um esquema
de conceito como um gráfico RDF, possibilitando descrever formalmente os
termos e relacionamentos existentes em um tesauro, conforme apresentado na
seguir na figura 3.
FIGURA 3 – Parte de um tesauro representado a partir do SKOS

Fonte: Miles e Brickley (2005).
Segundo Garcia Jiménez (2004, p.90,): “As relações entre
ontologias e tesauros parecem demonstrar uma tendência evidente: a intenção
por parte de diversos especialistas em elaborar determinadas ontologias a
partir de um tesauro”. Seguindo esta tendência, verifica-se também o
crescente desenvolvimento de projetos no âmbito de bibliotecas digitais que
utilizam-se das tecnologias relacionadas ao projeto Web Semântica, tais como
o JeromeDL e o
MarcOnt.
Conforme Kruk, (2005) apresentam no artigo sugestivamente intitulado
como JeromeDL - Reconnecting Digital Libraries and the Semantic Web, o
projeto JeromeDL consiste de uma biblioteca digital de código aberto baseada
nas principais tecnologias presentes no projeto Web Semântica, permitindo a
descrição de recursos a partir da linguagem computacional Resource
Description Framework, RDF e a realização
de buscas semânticas baseadas em ontologias, possibilitando uma melhora
considerável na precisão das buscas e um maior nível de interoperabilidade.
Quanto ao projeto MarcOnt. segundo
Synak e Kruk (2005), seu principal
objetivo é o desenvolvimento de uma ontologia capaz de tornar-se um padrão
de representação de informações para bibliotecas digitais, possibilitando a
descrição dos aspectos semânticos dos conteúdos e favorecendo a integração
de bibliotecas. Estando ainda em fase de implementação e avaliação, a
ontologia MarcOnt vem sendo desenvolvida a partir da linguagem Web
Ontology Language, OWL, de modo
que se espera que tal ontologia seja compatível com o formato
MARC 21,
permitindo que as descrições semânticas possam ser convertidas para outros
formatos, possibilitando grande interoperabilidade a partir do
reaproveitamento das bases de conhecimento e por meio da incorporação de
outras ontologias que sigam os mesmos critérios de desenvolvimento.
Assim, verifica-se que muitos dos conceitos inerentes aos métodos
convencionais de representação podem ser aproveitados no desenvolvimento de
novas abordagens voltadas para o ambiente Web, do mesmo modo que muitas
tecnologias desenvolvidas a partir do desenvolvimento do projeto Web
Semântica não limitam seu escopo de aplicabilidade ao ambiente Web, como por
exemplo, a linguagem computacional XML e mais recentemente o desenvolvimento
de ontologias que têm despertado o interesse de inúmeros pesquisadores da
área de Ciência da Informação, conforme pode ser observado nos trabalhos de
Qin e Paling (2001), Alvarenga (2001),
Ding e Foo (2002), Soergel (2002),
Almeida e Bax (2003), Ferneda (2003),
Golbeck (2003), Pincemin
(2003), Arano e Codina (2004), Campos (2004),
Garcia Gimenez (2004), Pérez Agüera (2004),
Souza e Alvarenga (2004), Moreira e Oliveira (2005),
Ramalho, Vidotti e Fujita (2005), entre outros.
Conforme afirmam Souza e Alvarenga (2004, p. 139), no artigo intitulado: A
Web Semântica e suas contribuições para a ciência da informação: “Tudo
indica que os padrões que estão sendo desenhados para esta nova Web também
sejam adotados na arquitetura de bibliotecas digitais e de novos sistemas de
informação”.
Web Semântica e os profissionais da informação
Segundo Alvarenga (2001), novos desafios vêm sendo apresentados aos
profissionais da informação, a partir do aumento das possibilidades de
disponibilização e processamento de informações no meio digital, e muitas
vezes a formação convencional no campo da biblioteconomia garante pouca
fundamentação matemática e computacional a tais profissionais, sendo
necessário o estabelecimento de parcerias e a formação de equipes
interdisciplinares.
Conforme afirma Garcia-Gimenez (2004), deve-se lembrar que as novas
tecnologias informacionais relacionadas à organização e recuperação de
informações nasceram imersas nos ambientes computacionais, de modo que tal
imbricação e dependência tecnológica exigem de seus criadores determinados
conhecimentos e habilidades próprias em um contexto técnico e qualificado,
para que possam representar o conhecimento e permitir sua posterior
recuperação a partir de métodos que superem os tradicionais, melhorando sua
eficácia.
No âmbito do projeto Web Semântica também observa-se a necessidade de uma
maior familiarização dos profissionais da informação com as novas
tecnologias, para que as mesmas também possam ser desenvolvidas a partir de
princípios éticos sociais e não baseadas única e exclusivamente em
conhecimentos e processos puramente técnicos. Afinal as tecnologias
subjacentes ao projeto Web Semântica e os instrumentos de representação de
informações desenvolvidos no âmbito da área de Ciência da Informação possuem
como objetivo comum propiciar meios mais adequados de representar e
organizar conteúdos informacionais, possibilitando responder de maneira mais
eficiente às buscas realizadas diretamente pelos usuários finais.
É importante observar que muitos dos conceitos apresentados na arquitetura
do projeto Web Semântica constituem uma nova “roupagem tecnológica” para
métodos e técnicas que já são utilizados há décadas na área de Ciência da
Informação. Assim, propõe-se um “Espectro Funcional” da arquitetura da Web
Semântica, figura 4, desenvolvido a partir do enfoque da área de Ciência da
Informação e baseado nos conceitos básicos das principais tecnologias
presentes na arquitetura da Web Semântica, apresentados na figura 1 - pág.
4, com o intuito de omitir detalhes técnicos e facilitar a compreensão de
tal arquitetura.
FIGURA 4 – Espectro Funcional da Arquitetura da Web Semântica

De acordo com a figura acima pode-se observar que para a concretização do
projeto Web Semântica torna-se necessária primeiramente a identificação dos
recursos a partir da “Camada Estrutural”, a qual permite identificar cada
recurso de forma única e padronizada e possibilita meios seguros de
transmissão e armazenamento das informações.
A “Camada Sintática” possibilita a descrição dos recursos, por meio da
definição e validação de regras sintáticas formalmente descritas,
possibilitando a estruturação dos recursos informacionais. Analisando esta
camada pode-se destacar o forte embasamento da área de Ciência da Informação
no que se refere a práticas de catalogação e indexação que podem ser de
grande valia para o desenvolvimento do projeto Web Semântica.
Quanto à “Camada Semântica”, é nesta camada que se espera que sejam
desenvolvidos vocabulários que permitam descrever os aspectos semânticos
inerentes aos recursos informacionais e sistemas de conceitos que definam
formalmente as relações existentes, de modo que a partir de tais
vocabulários possam ser definidas, na “Camada Lógica”, as regras a serem
interpretadas computacionalmente, possibilitando a realização de inferências
automáticas e a verificação do nível de coerência lógica dos recursos.
Cabe ressaltar que a partir dos instrumentos de representação utilizados tradicionalmente no âmbito da área de Ciência da Informação (tesauros, lista de cabeçalhos de assunto, taxonomias, etc), é possível o desenvolvimento de ontologias, permitindo a representação formal dos relacionamentos existentes entre os termos e conceitos.
Observa-se então que para a concretização do projeto Web Semântica é
necessária a utilização intensiva de lógicas computacionais, para que assim
possa ser realizada, na “Camada de Confiança”, a comprovação de que os
aspectos semânticos dos recursos estão descritos de modo consideravelmente
adequado, atendendo a todos os requisitos das camadas anteriores e
possibilitando um certo grau de confiança das informações.
É importante ressaltar que muitas vezes devido às pressões para o
desenvolvimento em curto prazo de novas tecnologias, buscando atender
demandas de mercado, as metodologias propostas a partir da área de Ciência
da Computação podem não abarcar as devidas preocupações quanto às possíveis
conseqüências que tais tecnologias possam acarretar, subestimando uma das
principais preocupações da área de Ciência da Informação, quanto à indexação
de informações.
Conforme relata Fujita (2003, p.180):
Uma das principais preocupações dos pesquisadores em indexação é a rápida evolução das técnicas de recuperação automática, acarretando o aumento da responsabilidade do indexador na determinação do assunto do documento. Novas formas de recuperação exigem maior aprofundamento teórico do indexador para que se evite o risco de uma prática descompromissada com a representação do contexto do documento e do sistema de recuperação de informação.
Os profissionais da informação têm grandes responsabilidades dentro deste contexto, desempenhando um importante papel de agentes sociais, de modo que um de seus principais desafios é favorecer a diminuição das desigualdades no acesso à informação, a partir da utilização das novas tecnologias de acordo com princípios éticos que respeitem as especificidades, subjetividades e os valores de cada indivíduo ou comunidade.
Segundo Fernández-Molina e Guimarães (2002), quando tratamos das questões
éticas que envolvem os profissionais da informação e as novas tecnologias,
em geral levamos os conceitos e aplicações dentro de um nível restrito,
deixando desta forma de gerar análises mais abrangentes sobre seu uso em uma
esfera global. Assim, é evidente que o projeto Web Semântica, a partir da
criação de categorias para a classificação dos recursos informacionais
disponíveis no ambiente Web, trará no bojo de seu desenvolvimento novos
dilemas éticos em uma escala global.
Buchanan (1999) afirma que os profissionais da informação têm a obrigação
moral de responder aos novos dilemas éticos emergentes e de se esforçar para
balancear as limitações práticas e tecnológicas de fornecimento e uso da
informação.
Conclusões
A partir da análise da literatura apresentada, pode-se constatar que o
projeto Web Semântica constitui uma evolução no modo como as informações são
organizadas no ambiente Web, projetado com o intuito de possibilitar a
incorporação de aspectos semânticos aos dados, favorecendo a
contextualização das informações de forma automatizada, de acordo com o
“contexto” no qual os dados estão inseridos e os critérios da busca
realizados.
Observou-se que considerando os pressupostos da área de Ciência da
Computação, é possível justificar a origem da expressão “Web Semântica”,
devido ao fato que os “motores de busca” e as páginas Web tradicionais não
levam em consideração os aspectos semânticos inerentes aos recursos
informacionais. Fato que não ocorre caso um processo de recuperação de
informação no ambiente Web seja analisado sob o prisma de um usuário que
inegavelmente irá utilizar-se de aspectos semânticos para localizar as
informações que procura.
Verificou-se que os conceitos e tecnologias subjacentes ao projeto Web
Semântica podem ser considerados como uma renovação ou desdobramento dos
tradicionais métodos representação, organização e recuperação de
informações, apontando a possibilidade de contribuições da área de Ciência
de Informação, devido ao seu embasamento teórico referente a formas de
representação e as práticas profissionais identificadas em seu campo de
atuação.
Ao mesmo tempo em que devido ao fato do projeto Web Semântica ter despertado o interesse de profissionais das mais variadas áreas do conhecimento, novos conceitos vêm sendo incorporados ou reformulados na área de Ciência da Computação, constituindo um novo paradigma computacional, segundo o qual os aspectos semânticos estão intrínsecos ao conceito de informação.
Portanto, torna-se evidente o caráter interdisciplinar que delineia o corpus
teórico do projeto Web Semântica, englobando essencialmente áreas como a
Ciência da Informação e a Ciência da Computação, entre outras,
apresentando-se como um campo fértil para pesquisas. Assim, esforços
interdisciplinares são necessários para possibilitar o desenvolvimento de
soluções multidisciplinares, respeitando as especificidades de cada área do
conhecimento e tendo como objetivo comum auxiliar na evolução do
conhecimento humano de forma integral.
Verificou-se também que a partir dos estudos relacionados ao projeto Web
Semântica, torna-se possível uma aproximação do objeto de estudo da Ciência
da Informação com a área da Ciência da Computação, pois a partir do momento
que os pesquisadores da área de Ciência da Computação empenham-se em
desenvolver mecanismos que possibilitem descrever os aspectos semânticos
inerentes aos recursos informacionais, pode-se considerar que estão
trabalhando com o mesmo conceito de informação utilizado pelos pesquisadores
da área de Ciência da Informação. Barreto (2002, p.73) já sinalizava para
tal fato, quando em seu artigo “A condição da Informação” utilizou a
expressão “tecnologista da informação” ao se referir a Tim Berners-Lee,
pesquisador diretamente ligado à área de Ciência da Computação e justamente
o grande precursor do projeto Web Semântica.
Deste modo, é possível considerar que o principal objetivo do projeto Web
Semântica pode ser identificado pelo próprio slogan do Wide Web Consortium, W3C
“Leading the Web
to Its Full Potential”, Conduzir a Web para o Seu Potencial Máximo,
entretanto, verifica-se poucas possibilidades de sua implantação de modo
integral, ao menos em curto prazo, constituindo-se assim como um ideal
abstrato muito mais do que uma possibilidade real a ser concretizada. Tal
afirmação baseia-se no fato de que a concretização de uma Web Semântica
global depende de uma série outros fatores sociais, econômicos, políticos e
culturais, que vão além do desenvolvimento de novas tecnologias e padrões de
representação.
Conforme afirma Codina (2003), atualmente a expressão Web Semântica representa o rótulo de uma aspiração, um projeto de como seria idealmente o ambiente Web. É inegável o fato de que as novas tecnologias têm provocado avanços consideráveis e verdadeiras revoluções em vários setores da sociedade, sendo evidente que o projeto Web Semântica traz no bojo de suas inovações tecnológicas uma série de avanços que podem possibilitar melhorias significativas nos processos de organização e recuperação de informações em ambiente digital.
No entanto, observa-se também que tais tecnologias criam/agravam uma série de problemas sociais, econômicos, políticos e culturais, que em sua maioria ainda não foram enfrentados, ou muitas vezes sequer identificados, tanto no campo teórico quanto prático. Constituindo assim, um dos grandes desafios a ser superado por uma sociedade que almeja ostentar o título de “Sociedade da Informação”.
[1] O W3C consiste de um consórcio mundial liderado por Tim Berners-Lee que reúne empresas, instituições acadêmicas, profissionais e cientistas, com o intuito de padronizar novas tecnologias que possibilitem estender gradativamente as funcionalidades do ambiente Web.
[2] http://www.w3.org/2001/sw/Europe
[3] http://www.w3.org/2001/sw/Europe/reports/thes
Referências Bibliográficas
ALMEIDA, M. B.; BAX, M. P. Uma visão geral sobre
ontologias: pesquisa sobre definição, tipos, aplicações, métodos de
avaliação e de construção. Ciência da Informação, Brasília, v. 32, n.
3, p. 7-20, set/dez. 2003.
ALVARENGA, L. A teoria do conceito revisada em conexão com ontologias e metadados no contexto das Bibliotecas tradicionais e digitais. DataGramaZero, Rio de Janeiro, v. 2, n. 6, dez. 2001. Disponível em: <http://www.dgz.org.br/dez01/Art_05.htm> Acesso em: 15 set. 2005.
ARANO. S.; CODINA, L. La estructura conceptual de los tesauros en el entorno digital: nuevas posibilidades en la representación de la información y el control terminológico. In: JORNADES CATALANES D’INFORMACIÓ I DOCUMENTACIÓ, 9. Barcelona, 2004.
BARRETO, A. de A. A condição da informação. São Paulo em Perspectiva, v.16, n.3, p.67-74, jul/set., 2002.
BERNERS-LEE, T. Semantic Web road map. 1998. Disponível em: <http://www.w3.org/DesignIssues/Semantic.html>. Acesso em: 18 set. 2005.
BERNERS-LEE, T. ;HENDER, J. ;LASSILA, O. The semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, may. 2001.
BERNERS-LEE, T. Information Management: a proposal. CERN, Genebra, mar. 1989. Disponível em: <http://www.w3.org/History/1989/proposal.html>. Acesso em: 20 Set. 2005.
BERNERS-LEE, T. Semantic Web - XML2000. 2000. Disponível em: <http://www.w3.org/2000/Talks/1206-xml2k-tbl>. Acesso em: 18 set. 2005.
BERNERS-LEE, T. Semantic Web Concepts. 2005. Disponível em: Disponível em: <http://www.w3.org/2005/Talks/0517-boit-tbl>. Acesso em: 18 out. 2005.
BERNERS-LEE, T. The Semantic Web. 2002. Disponível em: <http://www.w3.org/2002/Talks/04-sweb-sloan/Overview.html>. Acesso em: 20 set. 2005.
BERNERS-LEE, T. Weaving the Web. San Francisco: Harper, 1999.
BERNERS-LEE, T.; MASINTER, L.; MCCAHILL, M. Uniform Resource Locators (URL). RFC Sourcebook, n.1738, mar. 1994. Disponível em: <http://www.networksorcery.com/enp/rfc/rfc1738.txt>. Acesso em: 20 Set. 2005.
BINDING, C.; TUDHOPE, D. KOS at your Service: Programmatic Access to Knowledge Organisation Systems. Journal of Digital Information, Texas, v. 4, no. 4, 2004.
BRICKLEY, D. et al. RDF vocabulary description language 1.0: RDF schema. . W3C recommendation, 10 Fev. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-rdf-schema-20040210>. Acesso em: 16 set. 2005.
BUCHANAN, E.A. An overview of information ethics issues in a world-wide context. Ethics and Information Technology, Berlin, v.1, no. 3, p. 193-201, sep. 1999.
CAMPOS, M. L. de A. Modelização de domínios de conhecimento: uma investigação de princípios fundamentais. Ciência da informação, Brasília, v. 33, n. 1, p. 22-32, jan./abr. 2004.
CAPURRO, R. Epistemologia e ciência da informação. IN: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO - ENANCIB, 5., 2003. Belo Horizonte. Anais... Belo Horizonte: UFMG, 2003.
CEEInf - Comissão de Especialistas de Ensino de Computação e Informática. Diretrizes Curriculares de cursos da área de Computação e Informática. Brasília: CEEInf/MEC, 1999. Disponível em: <http://www.inf.ufrgs.br/mec/ceeinf.diretrizes.html>. Acesso em: 10 Jan 2006.
CLARK, K. G. SPARQL Protocol for RDF. W3C Working Draft, 14 set.2005. Disponível em: <http://www.w3.org/TR/2005/WD-rdf-sparql-protocol-20050914>. Acesso em: 18 set. 2005.
CODINA, L. La web semántica : una visión crítica. El profesional de la información, Barcelona, v. 12, n. 2, p. 149-152. 2003.
DACONTA, M. C.; OBRST, L. J.; SMITH, K. T. The Semantic Web: a guide to the Future of XML, Web Services, and Knowledge Management. Indianápolis: Wiley Publishing, 2003. 279 p.
DAUM, B.; MERTEN, U. Arquitetura de sistemas com XML. Rio de Janeiro: Campus, 2002.
DING, Y.; FOO, S. Ontology research and development, Part 1 - A review of ontology generation. Journal of Information Science, v. 28, no. 2, p. 123-136. 2002.
FERNÁNDEZ MOLINA, J.C.; GUIMARÃES, J. A Ethical aspects of knowledge organization and representation in the digital environment: their articulation in professional codes of ethics. IN: López-Huertas, M.M., (Ed.). Challenges in knowledge representation and organization for the 21st century: integration of knowledge across boundaries. Wurzburg: ERGON-Verlag, 2002. p. 487-492.
FERNEDA, E. Recuperação de Informação: análise sobre a contribuição da Ciência da Computação para a Ciência de Informação. 2003. 137 f. Tese (Doutorado em Ciência da Informação) – Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2003.
FERNEDA, E. Recuperação de Informação: análise sobre a contribuição da Ciência da Computação para a Ciência de Informação. 2003. 137 f. Tese (Doutorado em Ciências da Comunicação) – Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2003.
FIELDING, R. Relative Uniform Resource Locators. RFC Sourcebook, no.1808, jun. 1995. Disponível em: <http://www.networksorcery.com/enp/rfc/rfc1808.txt>. Acesso em: 20 Set. 2005.
FUJITA, M. S. L. A Leitura Documentária do indexador: aspectos cognitivos e lingüísticos influentes na formação do leitor profissional. 2003. 321f. Tese (Livre-Docência em Análise Documentária e Linguagens Documentárias Alfabéticas) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília.
GARCIA JIMÉNEZ. A. Instrumentos de representación del conocimiento: tesauros versus ontologías. Anales de documentacion, Mucia, n.7, p.79-95, 2004. Disponível em: <http://www.um.es/fccd/anales/ad07/ad0706.pdf>. Acesso em: 10 jan 2006.
GOLBECK et al. The National Cancer Institute’s Thésaurus and Ontology. Journal of Web Semantics, v.1, no.1, p. 75-80, 2003.
GROSOF, B. et al. Description logic programs: Combining logic programs with description logics. In: Proc. of WWW 2003, Budapest, mai 2003, p. 48-57. Disponível em: <http://www.cs.man.ac.uk/~horrocks/Publications/download/2003/p117-grosof.pdf>. Acesso em: 16 set. 2005.
HORROCKS, I., et al. Semantic web architecture: stack or two towers? In: FAGES, F.; SOLIMAN, S. (Ed.). Principles and Practice of Semantic Web Reasoning, (PPSWR 2005), no. 3703 in LNCS, 2005. p. 37-41.
KOIVUNEN, M. R.; MILLER, E. W3C Semantic Web Activity. 2001. Disponível em: <http://www.w3.org./2001/12/semweb-fin/w3csw>. Acesso em: 10 out. 2005.
KRISHNAMURTHY, B.; REXFORD, J. Redes para a Web. Rio de Janeiro: Campus, 2001.
KRUK, S. R. et al. JeromeDL reconnecting digital libraries and the semantic Web. Disponível em: <http://www.marcont.org/marcont/pdf/www2005_jeromedl.pdf>. Acesso em: 10 out. 2005.
LANCASTER, F.W. Indexação e resumo: teoria e prática. Brasília: Briquet de Lemos, 2004. 452 p.
LE COADIC, Y-F. A Ciência da informação. Brasília: Briquet de Lemos, 1996.
MCGUINNESS, D. L.; HARMELEN, F. OWL Web Ontology Language Overview. W3C Recommendation, 10 Feb. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-owl-features-20040210>. Acesso em: 16 set. 2005.
MEY, E. S. A. Bibliotheca Alexandrina. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v .1, n.2, p. 71-91. 2004. Disponível em: <http://server01.bc.unicamp.br/seer/ojs/index.php> Acesso em: 10 de out. 2005.
MILES, A.; BRICKLEY, D. SKOS Core Guide. W3C Working Draft, 02 Nov. 2005. Disponível em: <http://www.w3.org/TR/swbp-skos-core-guide>. Acesso em: 15 jan. 2006.
MOREIRA, A.; OLIVEIRA, A. P. Contribuição da terminologia na modelagem de sistemas computacionais. DataGramaZero, Rio de Janeiro, v. 6, n. 5, out. 2005. Disponível em: <http://www.dgz.org.br/out05/Art_01.htm>. Acesso em: 20 set. 2005.
NAKAMURA, E. T.; GEUS, P. L. Segurança de redes em ambientes corporativos. São Paulo: Futura, 2003.
PÉREZ AGÜERA, J. R. Automatización de tesauros y su utilización en la Web semántica. textos universitaris de biblioteconomia i documentació, n.13, 2004. Disponível em: <http://www.ub.es/bid/13perez2.htm>. Acesso em: 15 jan 2006.
PFÜTZENREUTER, E. Aplicabilidade e desempenho do protocolo de transporte SCTP. 2004. 119 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Santa Catarina, Florianópolis, 2004.
PINCEMIN, B. Thésaurus documentaires et ontologies: divergences et ressemblances. Journée d'étude Web Sémantique. Paris, 2003. Disponível em: <http://www-lli.univ-paris13.fr/membres/biblio/1195_pincemin_ws_0410.pdf>. Acesso em: 10 jan. 2006.
PRUD'HOMMEAUX, E.; SEABORNE, A. SPARQL query language for RDF. W3C working draft, 21 July 2005. Disponível em: <http://www.w3.org/TR/2005/WD-rdf-sparql-query-20050721>. Acesso em: 16 set. 2005.
QIN, J.; PALING, S. Converting a controlled vocabulary into an ontology: the case of GEM. Information Research, v. 6, no. 2, 2001. Disponível em: <http://informationr.net/ir/6-2/paper94.html> . Acesso em: 10 jan 2006.
RAMALHO, R. A. S. Web Semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da Ciência da Informação. 2006. 120 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2006.
RAMALHO, R. A. S.; VIDOTTI, S. A. B. G. ; FUJITA, M. S. L. Bibliotecas Digitais na era da Web Semântica: reflexões no âmbito da gestão de conteúdos informacionais. In: FUJITA, M. S. L. (Org.). A dimensão social da biblioteca digital na organização e acesso ao conhecimento: aspectos teóricos e aplicados. São Paulo:USP/IBICT, 2005, v. 2, p. 91-113.
RAYWARD, W. B. The origins of information science and the International Institute of Bibliography/International Federation for Information and Documentation (FID). Journal of the American Society for Information Science, no. 48, p. 289-300, Apr. 1997. Disponível em: <http://alexia.lis.uiuc.edu/~wrayward/otlet/OriginsofInfoSci.htm>. Acesso em: 8 jan. 2006.
SARACEVIC, T. Ciência da Informação: origem, evolução e relações. Perspectivas em Cência da Informação, Belo Horizonte, v. 1, n. 1, p. 41-62, jan/jun. 1996.
SBC, Sociedade Brasileira de Computação. Currículo de referência da SBC para cursos de graduação em Computação. Campinas, 2003. Disponível em: <www.sbc.org.br/educacao>. Acesso em: 10 jan. 2006.
SHANNON, C ; WEAVER, W. The Mathematical theory of communication. Urbana: University of Illinois Press, 1949. Disponível em: <http://cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf>. Acesso em: 18 ago. 2005.
SHANNON, C. E. A Mathematical theory of communication. The Bell System Technical Journal, v. 27, p.379-423, 623-656, July/Oct. 1948.
SOERGEL, D. Thesauri and ontologies in digital libraries: tutorial. In: EUROPEAN CONFERENCE ON DIGITAL LIBRARIES, (ECDL), 2002, Roma. Disponível em: <http://www.dsoergel.com/cv/B63_rome.pdf>. Acesso em: 10 jan. 2006.
SOUZA, R. R.; ALVARENGA, L. A Web semântica e suas contribuições para a Ciência da Informação. Ciência da Informação, Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004.
SYNAK, M.; KRUK, S. R. MarcOnt initiative the ontology for the librarian world. In: EUROPEAN SEMANTIC WEB CONFERENCE ESWC, 2., 2005, Heraklion, Grécia. Proceedings… Heraklion: 2005.
VRANDEČIĆ, D. et al. DLP: an introduction. 2005. Disponível em: <http://logic.aifb.uni-karlsruhe.de/download/dlpintro.pdf>. Acesso em: 18 set. 2005.
Sobre os autores / About the Author:
Rogério Aparecido de Sá Ramalho
Doutorando do Programa de Pós-Graduação em Ciência da Informação, UNESP, Campus de Marília.
Silvana Aparecida Borsetti Gregorio Vidotti
Professora do Programa de Pós-Graduação em Ciência da Informação, UNESP, Campus de Marília.
Mariângela Spotti Lopes Fujita
Professora do Programa de Pós-Graduação em Ciência da Informação, UNESP, Campus de Marília.