2
SILVA, Fabiano Couto Corrêa da; WITT, Amanda Santos; UMPIERRE, Larissa Weber; WENDT, Lucas George;
BOHNERT, Michele Krieger; WESSFLL, Wagner Silva. Diagnóstico dos Repositórios de Dados no Brasil.
Brazilian Journal of Information Science: research trends, vol. 17, publicação continua, 2023, e023031. DOI:
10.36311/1981-1640.2023.v17.e023031.
Abstract
Digital data have become essential to leverage scientific research. In part, they serve a functional and
ephemeral role, but their importance becomes permanent and their value as a substrate for scientific
communication can increase or decrease depending on the demands and uses to which they are put. Data
preservation has become a demand for researchers as well as for universities and research centers. In
response, different repositories have emerged in Brazil, which allow storing data in various areas of
knowledge. This research aims to locate repositories that gather primary scientific research data in Brazil.
Searches were undertaken in the directories Re3Data, OpenDoar, ROAR and review of the repositories of
the Federal Universities registered with the Ministry of Education. This made it possible to locate 20
repositories covering data and to analyze their main characteristics in relation to subject coverage areas and
preservation standards. The data obtained show that, although most repositories provide alignment with
international standards, some do not have adequate infrastructures for the datasets provided. It is considered
that there may be a failure in the management of certain repositories, but most offer adequacy to the needs
for availability and search of scientific data in all indicators.
Keywords: Data Repositories; Scientific Communication; Scientific data; Data management; Digital
preservation.
1 Introdução
A tentativa de proporcionar uma definição precisa dos dados científicos é um desafio, pois
implica adaptar-se ao contexto no qual se faz a pergunta. Eles compreendem uma área muito
extensa (todas as disciplinas) e devido a isso a definição pode variar em relação às abordagens dos
diferentes participantes (pesquisadores, instituições, financiadores, etc.) e com os diversos
contextos nacionais (SILVA, 2019). Em quaisquer dos casos, uma definição em termos gerais pode
ser: os dados científicos são definidos como registros de fatos - numéricos, textuais, imagens e
sons - usados como fontes primárias para pesquisa e são cada vez mais aceitos na comunidade
científica como necessários para validar os resultados de pesquisas (OECD, 2007).
O Gerenciamento de Dados Científicos está presente em todas as fases da pesquisa e
abrange coleta, organização, documentação, armazenamento e preservação dos dados utilizados
ou gerados durante um projeto de pesquisa. Desse modo, configuram-se, por exemplo, como dados
estatísticos, medições, respostas de questionários, registros de entrevistas, fotografias e
observações resultantes do trabalho de campo. Especificamente, Arano et al. (2011) distinguem
como dados primários experimentos científicos; modelos e simulações; observações; dados
derivados tanto do processo como da combinação de dados brutos; dados referenciais (por