SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

HEREDOGRAMA INFORMACIONAL:

um caminho para combate à desinformação

INFORMATIONAL HEREDOGRAM: A way to combat disinformation

Osvaldo de Souza (1)

(1) Universidade Federal do Ceará, Brasil, osvsouza@gmail.com

Resumo

Neste texto discutimos questões relacionadas à organização e representação do conhecimento no sentido de

propor uma contribuição teórico-metodológica com possíveis impactos positivos na qualidade da

informação. Caracterizando-se como uma pesquisa de natureza qualitativa do tipo exploratória com

levantamento bibliográfico, na qual foram explorados padrões de codificação, modelos conceituais e de

estruturação de dados bibliográficos, destacando-se o BIBFRAME, RDA, RDF e o OWL, os quais foram

combinados para definir uma nova abordagem teórico-metodológicas denominada de Heredograma

Informacional, com aplicação em documentos e textos provenientes de fontes de informações da WEB e

também provenientes de conhecimento registrado, típico de unidades de informação. Foi obtido como

resultado uma proposta que possui propriedades de uma estrutura taxonômica que também produz

informação verificável a respeito dos documentos e seus respectivos conteúdos. Nela considera-se a

atribuição de um Identificador Semântico de Objeto Digital (ISOD) a ser utilizado em associação ao DOI

ou em substituição a este. O Heredograma Informacional prevê a incorporação de elementos funcionais

ativos para a produção automática, com ou sem supervisão humana, de elementos semânticos extraídos dos

conteúdos dos documentos. A proposta produzida como resultado dos trabalhos introduz elementos para a

mitigação dos problemas relacionados à desinformação e a fake news e adiciona elementos provenientes do

processamento de linguagem natural (PLN), inteligência computacional (IC) e inteligência artificial (IA).

Palavras-chave: heredograma informacional. desinformação. inteligência computacional. inteligência

artificial. recuperação da informação. ecossistema informacional.

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

Abstract

In this text we discuss issues related to the organization and representation of knowledge to propose a

theoretical-methodological contribution to positively impact the quality of information. Characterized as

qualitative research of exploratory type with a bibliographic survey about coding, conceptual models and

structuring patterns of bibliographic data, highlighting BIBFRAME, RDA, RDF and OWL, were explored,

which were combined to define a new theoretical-methodological approach called Informational

Heredogram with application in documents and texts coming from WEB information sources and recorded

knowledge typical of library documents. Results obtained has properties of a taxonomic structure which

simultaneously produces trustable information about documents and their respective contents. It considers

the attribution of a Semantic Digital Object Identifier (SDOI) to be used in association with the Digital

Object Identifier (DOI) or replacing it. The Informational Heredogram foresees the incorporation of active

functional elements for the automatic production, with or without human supervision, of semantic elements

regarding the contents of the texts. The proposal obtained in the works introduces elements to mitigate

problems related to disinformation and fake news and adds elements from natural language processing

(NLP), computational intelligence (CI) and artificial intelligence (AI).

Keywords: informational heredogram. disinformation. computational intelligence. artificial intelligence.

information retrieval. informational ecosystem.

1 Introdução

O aumento da disponibilidade de informações na internet, compreendido como um

fenômeno informacional, tem sido amplamente estudado e discutido em literatura científica e

acadêmica, nos quais são explorados aspectos relacionados, abordando desde considerações sobre

a quantidade de dados disponíveis até os efeitos sociais e cognitivos decorrentes dele.

Um exemplo desses estudos pode ser visto em (Boyd; Crawford, 2012, p. 662-679) no qual

podemos observar uma preocupação quanto às questões relacionadas a ética, a privacidade e ao

poder, quando afetados ou quando afetam esse fenômeno.

A percepção do aumento da disponibilidade de informações na internet não é um

acontecimento novo, de fato, já se observam trabalhos discutindo a questão desde que houve a

popularização da Word Wide Web (WEB) e com maior intensidade a partir do fato do surgimento

dos dispositivos móveis denominados de smartphones, o que revolucionou a forma como

passamos a acessar e interagir com a internet (Deursen; Helsper, 2015, p.29-52). Tais dispositivos

móveis, associados a um cenário de conectividade ubíqua à internet, permitem o acesso constante,

independentemente de nossa localização geográfica, a uma vasta quantidade de informações que

estão disponíveis online. Esses dispositivos alteraram a forma das pessoas obterem acesso à

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

informação, bem como afetaram a forma como os autores passaram a produzi-la. Sobre isso nos

falam Vidotti et al. (2019, p. 12):

[...] verifica-se que o ciberespaço se torna um elemento que perpassa as diversas

atividades das organizações e dos indivíduos, tendo uma relação direta com a

virtualidade, o que aprofunda e torna complexo os processos inerentes aos

ambientes como a Web. Tendo como foco tal complexidade, é necessário

compreender o desenvolvimento da Web posteriormente a sua concepção. Neste

sentido, nos seus primeiros anos, a Web se tornou um ambiente com um volume

de dados muito elevado, sem ter uma descrição ou um controle sobre as

informações ali contidas.

Se por um lado temos acesso a um volume crescente de fontes de informações e

documentos, também podemos observar o surgimento e aumento de categorias de problemas

relacionadas à qualidade e propósito da informação, problemas tais como os vistos durante a

pandemia da COVID-19, discutidos em trabalhos como os de Ana Carla e Elisabete Souza

(Mazzeto; Souza, 2022, p. 2-23). Dentre os problemas destacamos a desinformação,

particularmente a fake news, que tem se revelado algo relevante a afligir a sociedade, como

podemos ver no trabalho de Anna Cristina e Arthur Bezerra (Brisola; Bezerra, 2018) no qual os

autores discutem a informação falsa, posta como um ato intencional a prejudicar a credibilidade

do conhecimento científico.

Outro aspecto a ser considerado em relação ao crescimento da disponibilidade de

informações na internet é o correspondente aumento no esforço que o sujeito informacional deve

empreender para estar em contato com as novas publicações em sua área de interesse. De fato, o

volume de informações disponíveis na internet passa a requerer uma elevada disponibilidade de

tempo para uma simples ação de pesquisa bibliográfica abrangente e correspondente seleção de

material e leituras iniciais dos materiais de interesse. Tal disponibilidade de tempo pode se tornar

proibitiva se não houver alguma solução tecnológica que diminua o volume da leitura a ser

realizada, como nos falam De Souza e Fernandes:

Há, portanto, um aumento do tempo necessário para que um potencial usuário de

uma informação a encontre; obviamente isso é proporcional ao volume de

informação disponível. Acreditamos, contudo, que é possível alterar essa relação

com o tempo através do uso de tecnologia que minimize o volume de informações

a serem apreendidas, quer seja pela diminuição do volume de texto a ser lido, ou

pela alteração do tipo de código usado no suporte. Se um determinado documento

puder ser transformado em outro tipo de documento, todavia preservando-se o

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

valor semântico, poderíamos ter, por exemplo, uma condensação dos textos,

criando versões de denso valor semântico que requereriam menor tempo para seu

consumo. (De Souza; Fernandes, 2020, p. 146).

Podemos perceber problemas relacionados ao volume de informações disponíveis, e

também quanto a qualidade dessas informações e até mesmo em alguns casos, problemas quanto

a definição da autoria, pois em alguns casos a verdadeira autoria de um texto pode ser omitida

intencionalmente ou por acidente. Some-se a isso questões de textos, imagens e vídeos que vêm

sendo produzidos por aplicativos de computador construídos com recursos de Inteligência

Artificial (AI). Todos esses problemas dificultam a seleção de material e podem levar o sujeito

informacional a selecionar um material com informação de baixa qualidade.

Há, portanto, a necessidade de discutir meios para mitigar os impactos da desinformação

ou informações imprecisas e do volume de informações disponíveis, procurando caminhos

metodológicos relacionados à organização e a representação do conhecimento, objetivando o

desenvolvimento de contribuições teórico-metodológicas que impactem positivamente a

recuperação do conhecimento. Na busca de soluções devemos avaliar a possibilidade de uso de

aportes teóricos provenientes de outras áreas, especialmente aquelas relacionadas ao

Processamento de Linguagem Natural (PLN), da IA e da Inteligência Computacional (IC). Tudo

no sentido de propor novas abordagens, criando e adicionando metadados a padrões já existentes

ou convergindo na criação de novos padrões. Usar metadados produzidos automaticamente por

recursos computacionais ou por humanos, de forma que combinados possam diminuir os impactos

negativos dos problemas mencionados.

A partir da compreensão dessa necessidade o objetivo deste trabalho é definir elementos

informacionais estruturados em um esquema de metadados. Esse esquema deve estabelecer uma

estrutura taxonômica, referencial e verificável a respeito dos documentos e seus respectivos

conteúdos, origens e autores, constituindo assim um modelo de representação que se possa

denominar de heredograma informacional, cujo conceito teórico e explicação do termo são

apresentados adiante.

Para o alcance desse objetivo é realizada uma investigação em torno dos padrões de

metadados existente e aplicáveis ao registro de dados extraídos de material informacional, sejam

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

eles bibliográficos, textuais ou multimídia, combinando os padrões investigados em uma proposta

de contribuição para a área.

2 Métodos e materiais da pesquisa

Este trabalho caracteriza-se como uma pesquisa de natureza qualitativa do tipo exploratória

com levantamento bibliográfico, os procedimentos foram iniciados com a leitura dos trabalhos de

(Boyd; Crawford, 2012, p. 662-679), (Deursen; Helsper, 2015, p.29-52) e (Mazzeto; Souza, 2022,

p. 2-23). A partir dessas leituras iniciais tornou-se necessário aprofundar os estudos em torno dos

conceitos relativos aos metadados, sendo eleito o termo “metadata” como expressão de busca para

este fim.

Foi então realizada uma pesquisa no Portal de Periódicos da CAPES (PPC) (CAPES, 2023),

os resultados foram classificados em ordem cronológica, do mais antigo para o mais recente

visando identificar os documentos originais sobre o tema. Como resultado da pesquisa no PPC foi

selecionado o primeiro texto no qual fossem abordados conceitos teóricos primordiais sobre o

termo “metadata”, o que resultou na coleta do texto de título Understanding metadata and

metadata schemes (Greenberg, 2005, p. 17-36).

Também foi necessário visitar os conceitos relativos aos esquemas ou padrões de

representação e organização de metadados de registros bibliográficos. Portanto, no sentido de

conhecer pesquisas recentes sobre tais conceitos foram eleitas as expressões de

busca ”bibliographics records representation” e ”bibliographics data representation”, na primeira

expressão de busca foi utilizado a palavra “records” em substituição ao termo “data” pois na época

das primeiras publicações sobre metadados o termo amplamente aceito era “records”. Na pesquisa

com a primeira expressão de busca foram obtidos 2269 registros e 3062 com a segunda. Os

resultados foram organizados por ordem de relevância e dentre eles foram selecionados os

primeiros textos cujos resumos revelassem alguma pesquisa recente sobre padrões para registros

bibliográficos, sendo selecionados:

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

▪ Exploration of Subject Representation and Support of Linked Data in Recently Created

Library Metadata: Examination of Most Widely Held WorldCat Bibliographic Records

(Zavalin; Zavalina; Miksa, 2021);

▪ Implementing Bibliographic Enhancement Data in Academic Library Catalogs: An

Empirical Study (Wu, 2023);

▪ Representing and integrating bibliographic information into the Semantic Web: A

comparison of four conceptual models (Zapounidou; Sfakakis; Papatheodouru, 2017).

A partir da leitura e compreensão desses textos foram relacionados os formatos de

estruturação, codificação e modelos conceituais para dados bibliográficos. Tais formatos são

discutidos nas seções 2.1, 2.2 e 2.3, os quais podem ser vistos na Figura 1. Nas discussões, todavia,

não nos preocuparmos com a cronologia de criação e eventual sucessão entre eles, nos limitaremos

aos aspectos de alcance de representação dos mesmos e a particularidades relativas ao inter-

relacionamento entre documentos e outros elementos informacionais.

Figura 1 - Padrões de estruturação, codificação e modelos de dados bibliográficos

Fonte: Dados da pesquisa (2023)

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

Na Figura 1 incluímos uma menção a vocabulários controlados, ISDB e AACR2, que

pertencem a codificação de dados, apenas para haver coesão entre elementos presentes na literatura

analisada, todavia, tendo em vista que no escopo do presente trabalho não dedicaremos esforços

no sentido de fazer proposições quanto a codificação de dados, não detalharemos esses relevantes

elementos da linguagem documentária. Quanto ao RDA ele foi desenvolvido como resposta do

Steering Committee a um planejamento estratégico para o período de 2005-2009, no qual havia o

objetivo de substituir o padrão AACR2 (SC, 2005) cuja primeira publicação data de 1978. O RDA

é um padrão que define um formato e conjunto de regras usadas para padronizar a descrição

bibliográfica visando o acesso e compartilhamento em todo o mundo, por exemplo, através de

serviços na WWW (Wu, 2023).

2.1 Estruturação de dados

O MARC 21 é atualmente o formato dominante de representação e comunicação de dados

bibliográficos, impõe uma estrutura fortemente definida com possibilidades de expansão, sendo

destinada ao intercâmbio de dados entre máquinas (LOC, 1996). MODS é um formato especificado

em XML e deriva do MARC 21, todavia, é baseado em marcação textual – tags – ao invés da

codificação numérica típica do MARC 21. A criação do MODS (LOC, 2022) foi justificada como

uma iniciativa para aprimorar o MARC 21 pela adição das facilidades existentes no Dublin Core

(DC, 1998) o qual é um padrão de estruturação de dados que foi criado em 1995 e formalizado em

1998 como um documento RFC 5791. É importante evidenciar que o MARC 21, MODS e Dublin

Core são fortemente direcionados ao registro unitário de item bibliográfico, não sendo sua

utilização idealizada para interrelação entre outros itens do catálogo. O uso de apenas esses três

tipos de estruturação de dados bibliográficos implicará na inexistência de recursos para criar uma

estrutura taxonômica, bem como na inexistência de metadados que permitam correlacionar

diretamente os itens do acervo, tanto internamente quanto externamente. A correlação que

eventualmente poderia ser estabelecida seria indireta e dependeria de semelhança de assunto ou

palavra-chave. Uma questão sobre o Dublin Core que deve ser considerada a parte, trata-se de que

sua especificação é intencionalmente direcionada para a simplicidade e essa simplicidade também

é uma fraqueza, pois em uma conversão de Dublin Core para outras formatos de estruturação

existirão muitas lacunas, visto que por exemplo, o MARC 21 e o MODS possuem um número

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

maior de metadados em suas especificações. Embora o Dublin Core tenha evoluído ao longo dos

anos desde seu lançamento, quando possuía inicialmente um conjunto de 15 metadados e

atualmente possa ser ampliado com o uso de esquemas de codificação, uma decisão pela sua

adoção deve considerar que o MODS tem um leque de metadados mais amplo, como os do MARC

21, sendo que a ele foram incorporadas facilidades do Dublin Core.

O BIBFRAME foi criado como um padrão para evoluir a descrição de dados bibliográficos

em um modelo de dados conectados, justamente no sentido de tornar os dados aptos a serem úteis

dentro ou fora da unidade de informação de sua origem. No entanto, não é possível estabelecer

algum tipo de correção referencial ou hierárquica de qualquer tipo entre diferentes dados

bibliográficos. Iniciativas na Biblioteca do Congresso dos EUA avaliam a migração de uma

estruturação de dados de MARC 21 para BIBFRAME, como se vê em (Zavalin; Zavalina; Miksa,

2021, p. 154) trabalho no qual no qual também utilizam o padrão Resource Description and Access

(RDA) na codificação dos dados.

Na seção 3 retornaremos a discussão sobre alguns dos padrões de estruturação de dados.

2.2 Modelos conceituais

Os modelos conceituais estabelecem visões de como os dados bibliográficos podem ser

representados de maneira que a representação favoreça recuperações futuras. Nas subseções

seguintes passamos a analisar aspectos desses modelos que são necessários para as discussões que

ocorrem na seção 3.

2.2.1 A família de modelos Functional Requirements - FR

A família de modelos FR compreende o Functional Requirements for Bibliographic

Records (FRBR), o Functional Requirements for Authority Data (FRAD) e o Requirements for

Subject Authority Data (FRSAD) (IFLA, 2009) e foi desenvolvida utilizando o modelo de

representação de Entidade-Relacionamento (ER) definidos por Chen (Chen, 1976, p. 9-36). O

objetivo principal no desenvolvimento do FRBR foi organizar uma estrutura que reunisse as

diversas partes que compõem os dados bibliográficos. No FRBR foram incluídas entidades tratadas

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

como objetos de potencial interesse dos sujeitos informacionais. Nele os objetos podem ser

abstratos ou concretos e ao todo foram incluídas 10 entidades, distribuídas em três grupos:

▪ Grupo 1 - que traz a identidade do que está sendo descrito, possuindo as seguintes

entidades: Obra, Expressão, Manifestação e item;

▪ Grupo 2 – que traz dados sobre os agentes relacionados as entidades do Grupo 1,

responsáveis intelectuais ou artísticos, etc. pela produção do que é descrito no Grupo

1. O Grupo 2 possui as seguintes entidades: Pessoas e Entidades coletivas;

▪ Grupo 3 - que agrega elementos extras de descrição dos dados do Grupo 1 e inclui as

seguintes entidades: Conceito, Objeto, Lugar e Evento.

Cada uma das entidades é expressa utilizando-se o modelo RDA desde 2009 e continua

assim até os dias atuais, como se vê em (Wu, 2023). Todavia, em 2017 a IFLA propôs uma nova

estruturação, denominada de IFLA-LRM, na qual todos os padrões da família FR foram integrados

em uma única especificação. Dentre as justificativas para essa decisão destacou-se o fato de que

cada um dos três padrões teve desenvolvimentos que seguiram isolados, o que culminou por

acarretar algumas sobreposições e problemas entre os padrões da mesma família.

2.2.2 A IFLA-LRM

A necessidade de consolidação das especificações da família FR tornou-se evidente quando

a IFLA reconheceu dificuldades no uso das três especificações em conjunto:

Inevitavelmente os três modelos de FR, embora todos criados em uma estrutura

de modelagem de relacionamento entre entidades, adotaram pontos de vista

diferentes e soluções distintas para 6 problemas comuns. Ainda que todos os três

modelos se façam necessários em um sistema bibliográfico completo, a tentativa

de adotá-los em um único sistema exigia a solução de problemas complexos de

maneira ad hoc, com orientação mínima dos modelos. (IFLA, 2017, p1).

Assim a partir desse entendimento foi criada a especificação IFLA-LRM (IFLA, 2017) com

foco direcionado a dados bibliográficos dos acervos de bibliotecas:

O IFLA Library Reference Model pretende ser um modelo de referência

conceitual de alto nível desenvolvido dentro de uma estrutura aperfeiçoada de

modelagem entidade-relacionamento. O modelo abrange dados bibliográficos

como entendidos em um sentido amplo e geral. Em termos de abordagem geral e

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

metodologia, o processo de modelagem que resultou no modelo IFLA LRM

incorporou a abordagem adotada no estudo original do FRBR. (IFLA, 2017, p9).

Desta forma, quanto ao fundamental de sua concepção, não se vislumbram diferenças

irreconciliáveis em comparação ao FRBR, sendo válidas as considerações quanto à possibilidade

de expressão dos atributos das entidades em RDA diferindo, no entanto, na divisão e organização

de grupos de objetos e suas respectivas entidades.

2.2.3 O modelo Web Ontology Language - OWL

O OWL (W3C, 2004) idealizado pelo W3C é um modelo de linguagem semântica para

WEB, direcionado ao auxílio da representação das complexas relações do conhecimento que

permeiam elementos abstratos ou concretos presentes no ecossistema informacional (De Souza;

Fernandes, 2020), compreendendo dados sobre elementos individuais, grupos de elementos e

relações entre elementos individuais. Nas discussões deste texto consideraremos apenas a versão

2 do OWL (W3C, 2012). A estruturação do modelo OWL direciona para um modelo de

representação que pode ser facilmente processado por programas de computador, tendo em vista

que sua notação é baseada na construção de uma linguagem lógica.

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

Figura 2 - Ilustração da OWL 2.0

Fonte: Adaptado de (W3C, 2012)

OWL não é um esforço isolado para o controle de dados semânticos para a WWW, na

verdade ele é parte do conjunto de especificações produzidas pela W3C para esse fim, conjunto

esse que inclui: o RDF, o RDFS, o SPARQL e o OWL. RDFS e SPARQL estão fora do escopo

deste trabalho e não serão abordados. Segundo a W3C, a especificação do OWL (W3C, 2012) é

mais abrangente e poderosa do que a especificação do RDF (W3C, 2004).

Na Figura 2 podemos observar o relacionamento entre os elementos da especificação da

OWL 2.0, os quais são detalhados e definidos por cinco documentos que descrevem sua estrutura:

(a) uma estrutura conceitual; (b) uma sintaxe primaria de troca (RDF/XML); (c) duas alternativas

de descrições semântica (Direct e RDF-Based); (d) um conjunto de requisitos de conformidade.

Também há três especificações adicionais que descrevem características que podem ser suportadas

por algumas implementações: (a) uma para os perfiz de linguagem; (b) duas alternativas de

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

especificações de sintaxes concretas (OWL/XML e Manchester). Deste ponto em diante usaremos

a sigla OWL para qualquer referência a OWL 2.0.

A partir das especificações desses documentos é possível estabelecer complexos

mapeamentos de domínios, inclusive conectando diferentes domínios. Esta é uma característica

relevante da OWL para o presente estudo, pois pode ser utilizada para prover o estabelecimento

de relações entre dados de diferentes elementos informacionais, quer sejam bibliográficos ou não,

o que pode ser aproveitado para a construção de estruturas complexa que abranjam um ou mais

domínios semânticos. Inclusive suportando inúmeros relacionamentos entre os conceitos

pertencentes a eles, contemplando até elementos informacionais de diferentes suportes, tais como:

textuais, iconográficos, imagens, sons ou multimidia. Obvio compreender que a OWL, como

modelo conceitual de dados, apenas estabelece uma forma para correlacionar, precisaremos ainda

de um padrão que defina uma estrutura adequada para usar a OWL como parte de dados

informacionais relativos a itens bibliográficos ou itens da WWW.

2.2.4 O modelo Resouce Description Framework - RDF

O modelo RDF (W3C, 2014) é um modelo para intercâmbio de dados na WWW que possui

características que permitem que documentos em RDF possam ser combinados, mesmo quando os

documentos não forem produzidos com o mesmo esquema RDF. A especificação do modelo é

evolutiva, o que significa que novos dados podem ser anexados ou correlacionados sem que isso

implique necessariamente em mudanças em todos os dados previamente existentes. A interrelação

entre especificações em RDF ocorre através da utilização de recurso semelhante ao existente no

modelo WWW, através de Uniform Resources Identifier (URI) ou links. Todavia o RDF amplia

os links tradicionais da WWW ao associar nomes as relações entre os diferentes elementos

(documentos, por exemplo) bem como para nomear as duas pontas da relação. Desta forma, por

exemplo, no básico da especificação estarão presentes a identificação do ponto inicial, do ponto

final e do tipo de relação que há entre esses pontos. Usando os dados básicos da especificação já

se torna possível a construção de um grafo que expresse algo como um modelo mental do domínio

que esteja sendo modelado. Esse modelo mental de domínio retrata a mesma possibilidade de

construção de estruturas complexas discutidas na especificação OWL. Portanto, usando-se RDF

ou OWL torna-se possível o controle de domínios semânticos, suportando inúmeros

SOUZA, Osvaldo de. Heredograma Informacional: um caminho para combate à desinformação. Brazilian Journal of

Information Science: research trends, vol. 18, publicação contínua, 2024, e024010. DOI: 10.36311/1981-

1640.2024.v18.e024010.

relacionamentos entre os conceitos pertencentes a eles. Todavia a OWL possui vantagem sobre o

RDF por nativamente permitir a expressão de relações típicas de ontologias, enquanto o RDF não

tenha sido criado para esse fim. Na seção 3 discutiremos essa particularidade e como ela pode ser

utilizada na proposta contida neste documento.

2.3 Processamento de Linguagem Natural e Inteligência Computacional

Se considerarmos a problemática abordada no presente texto certamente perceberemos que

uma possível solução deverá transcender o conhecimento registrado das bibliotecas. Tal solução

precisa ser aplicável aos acervos das Unidades de Informação, mas, principalmente ao conteúdo

presente em recursos informacionais da WEB. A proposta de qualquer solução deve compreender

documentos e fragmentos informacionais que possam ser disponibilizados em jornais, revistas,

redes sociais, blogs e outros recursos que possam povoar o ecossistema informacional (De Souza;

Fernandes, 2020, p. 145). Isso implica que o volume de documentos será muito maior do que o

volume disponível em acervos tradicionais. Portanto, considerando-se esse volume, um potencial

leitor deverá realizar um grande esforço e dedicar muito tempo para consultar e selecionar

documentos de seu potencial interesse. Sabemos que o tempo necessário para que um sujeito

informacional supra sua necessidade informacional afeta seu comportamento quanto a isso. Se no

passado a pesquisa limitava-se aos domínios do acervo da biblioteca, hoje a pesquisa delimita-se

pela dimensão do tempo disponível pelo interessado, visto que o acervo se tornou imenso. Segundo

De Souza e Fernandes (De Souza; Fernandes, 2020, p. 146):