Perguntas e respostas - Dados

Este conjunto de perguntas e respostas foi pensado para te guiar no processo de gestão de dados de investigação.

Na gestão de dados de investigação, ou curadoria de dados, estão envolvidos diferentes processos, técnicas, intervenientes e responsabilidades, sendo necessárias competências específicas que abrangem várias ações no âmbito do planeamento, criação, documentação, acesso, utilização, armazenamento, partilha e preservação dos dados.

Os benefícios da gestão de dados são:

  • Cumprir os requisitos do financiador;
  • Assegurar a integridade e reprodutibilidade da investigação;
  • Aumentar a eficiência da investigação;
  • Assegurar que os dados e registos de investigação são precisos, completos, autênticos e confiáveis;
  • Economizar tempo e recursos a longo prazo;
  • Aprimorar a segurança dos dados e minimizar o risco da perda de dados;
  • Prevenir a duplicação de esforços, permitindo que outros utilizem os seus dados;
  • Cumprir com as práticas conduzidas na indústria e comércio;
  • Possibilitar a comparação dos dados nos vários momentos do ciclo de investigação.

Os Planos de Gestão de Dados (PGD) são elementos chave para uma boa gestão de um projeto de investigação. Descrevem todo o ciclo de vida dos dados, desde a sua recolha ao seu acesso.

Os PGD garantem:

  • O acesso e compreensão dos dados quando precisar de os usar;
  • Continuidade da investigação após saída de elementos da equipa do projeto, ou na entrada de novos investigadores;
  • Partilha e promovem a colaboração, e, consequentemente, avanços na investigação;
  • Maior visibilidade e transparência no processo de investigação;
  • Validação dos resultados, nomeadamente das publicações;
  • Evitam duplicação de trabalho;
  • Outros investigadores podem citar os seus dados.

Os PGD são documentos que definem:

  • Que dados serão criados ou recolhidos
  • Como os dados serão criados ou gerados;
  • Como serão documentados;
  • Como serão partilhados;
  • Quem poderá aceder aos dados;
  • Onde e como serão guardados;
  • Quem fica responsável pela sua gestão e preservação;
  • Se e como os dados podem ser partilhados e reutilizados;
  • Como lidar com questões éticas, de direitos de autor e propriedade Intelectual.

Ferramentas para a elaboração de PGD disponíveis aqui

Fontes: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020). Disponível online na Plataforma NAU.

Príncipe, Pedro, Moura, Paula, Vieira, André, Pereira, Filipa, Relatório Técnico sobre Ferramentas para a Elaboração de Planos de Gestão de Dados (2020). Disponível em http://hdl.handle.net/1822/67530 Consultado a 09/07/2021.

A FCT encoraja os investigadores a adotarem boas práticas de gestão de dados de investigação e a partilharem os seus resultados com a comunidade científica. Neste sentido, a FCT adotou a política sobre a disponibilização de dados e outros resultados de investigação científica financiada pela FCT.

FCT – Política sobre a Disponibilização de Dados e outros Resultados de Projetos de I&D Financiados Pela FCT (adotada em 5 de maio de 2014)

No Horizonte 2020, foram estabelecidos requisitos que visam melhorar e maximizar o acesso e a reutilização dos dados de investigação gerados por projetos financiados pela Comissão Europeia. Os requisitos de acesso aberto estão descritos no artigo 29.º do H2020 Programme AGA – Annotated Model Grant Agreement. No que diz respeito aos dados:

  • partilhar os dados que validem os resultados apresentados em publicações científicas, bem como outros dados, conforme especificado no plano de gestão de dados;
  • apresentar um Plano de Gestão de Dados nos primeiros 6 meses do projeto e atualizá-lo ao longo do projeto, sempre que houver alterações;
  • depositar os dados num repositório seguro e certificado assim que possível. O repositório Zenodo é adequado para este efeito;
  • atribuição de uma licença CC BY ou equivalente;
  • garantir a descrição dos dados e informação sobre resultados e ferramentas para o seu reuso ou validação.
  • o acesso aos dados deve ser aberto, com exceção de casos de interesse legítimo, segurança, privacidade, propriedade intelectual, de acordo com o princípio “as open as possible, as closed as necessary”.

Saber mais:
H2020 Programme AGA – Annotated Model Grant Agreement http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf. Consultado em 09/07/2021.

Guidelines on Open Access and Research Data in Horizon 2020
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf.Consultado em 09/07/2021.

Practical Guide to the International Alignment of Research Data Management – Extended Edition
https://www.scienceeurope.org/our-resources/practical-guide-to-the-international-alignment-of-research-data-management/. Consultado em 09/07/2021.

A gestão FAIR dos dados da investigação é uma prática mandatória nos projetos financiados no quadro do Horizonte Europa. Os beneficiários de financiamento devem:

  • apresentar um Plano de Gestão de Dados nos primeiros 6 meses do projeto e atualizá-lo ao longo do projeto, sempre que houver alterações;
  • assegurar a gestão responsável dos dados, segundo os princípios FAIR – Findable, Accessible, Interoperable, Reusable;
    depositar os dados num repositório seguro e certificado assim que possível. O repositório Zenodo é adequado para este efeito;
  • atribuição de uma licença CC BY ou equivalente;
  • garantir a descrição dos dados e informação sobre resultados e ferramentas para o seu reuso ou validação.
  • o acesso aos dados deve ser aberto, com exceção de casos de interesse legítimo, segurança, privacidade, propriedade intelectual, de acordo com o princípio “as open as possible, as closed as necessary”,
  • assegurar a referência à agência de financiamento e código de financiamento de acordo com as especificações estipuladas pelo HE.
  • assegurar que os metadados estão completos, incluindo informação sobre licenças e identificadores persistentes.

Saber mais:
Horizon Europe Programme Guide, pp. 38 e ss. https://ec.europa.eu/info/funding-tenders/opportunities/docs/2021-2027/horizon/guidance/programme-guide_horizon_en.pdf. Consultado em 29/04/2021.

Model grant agreement (MGA), Art.º 17 – Communication, dissemination, open science and visibility, pp. 107-09. https://ec.europa.eu/info/funding-tenders/opportunities/docs/2021-2027/common/agr-contr/general-mga_horizon-euratom_en.pdf.Consultado em 29/04/2021.

Horizon Europe Regulation, Art.º 39. https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32021R0695&from=EN. Consultado em 29/04/2021.

Sim, os dados de investigação assumem atualmente uma importância comparável às publicações enquanto resultados de I&D, contribuindo para a reprodutibilidade, impacto, transparência e excelência da investigação levada a cabo nas instituições de ensino superior. Neste sentido, as agências financiadoras do Sistema Científico e Tecnológico nacional, como a FCT e a Comissão Europeia, têm vindo a incluir como requisito para atribuição de financiamento a implementação de práticas de gestão de dados de investigação nos projetos, incluindo a elaboração de planos de gestão de dados e o depósito dos conjuntos de dados em repositórios confiáveis e em acesso aberto, sempre que possível.

FCT – Política sobre a Disponibilização de Dados e outros Resultados de Projetos de I&D Financiados Pela FCT (adotada em 5 de maio de 2014)

Horizonte 2020 – Guidelines on Multi-Beneficiary General Model Grant Agreement

Horizonte Europa – General Model Grant Agreement e Horizon Europe Programme

O depósito num repositório digital tem a função particularmente importante de assegurar a integridade digital dos pacotes de dados a longo prazo, através de variadas medidas de preservação digital. É portanto um passo essencial para o acesso livre e sustentável a longo prazo. Para além disso, a escolha do repositório está relacionada com o esquema de metadados adotado, de forma a garantir que a descrição dos dados corresponda às diretrizes usadas pelo repositório escolhido ou que seja interoperável com o mesmo. Recomenda-se explicitamente a preferência por repositórios de dados certificados, atendendo às diretrizes do respetivo selo de certificação. Existem diferentes agências que certificam repositórios e, por isso, diferentes critérios para a certificação.

Idealmente os dados de investigação deverão ser depositados num repositório institucional,  repositório disciplinar ou num repositório mais generalista. Algumas dicas para encontrares o repositório de dados ideal para o teu projeto de investigação:

  • Usa um repositório disciplinar, se existir;
  • Em alternativa, usa o repositório de dados institucional (caso exista) ou outro que garanta a preservação a longo prazo. Em caso de dúvida, consulta o org e encontra o repositório que melhor se ajusta às necessidades do teu projeto e que reúna as condições exigidas pelo financiador;
  • Usa um repositório generalista como o Zenodo [https://zenodo.org], FigShare [https://figshare.com] ou Dryad [https://datadryad.org/]

Fontes: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020). Disponível online na Plataforma NAU.

Furtado, Filipe, Príncipe, Pedro, Carvalho, José, Kit sobre dados de investigação RCAAP (2017). Disponível em http://hdl.handle.net/1822/46351 Consultado a 09/07/2021. 

Um número crescente de editores e revistas já dispõe de uma política e requisitos específicos para dados científicos que fundamentam os resultados submetidos para publicação. Algumas publicações exigem mesmo a partilha de dados como condição para aceitação dos artigos, cumprindo o procedimento seguinte: envio de dados, depósito em repositório ou na cloud do editor, informação para contacto.

Não é recomendado o depósito de dados na cloud do editor, por razões de ética e salvaguarda a longo prazo. Além de que:

Publishers shouldn’t be determining where authors deposit their data. It should be the researchers (and their funder) that decide the best location for data deposit. This approach gives tremendous control to these publishers to set the bar for repository compliance. Over time, if we cede the control to those publishers, this could (and probably will) lead to only well-resourced repositories being available to authors that publish in those journals.

(https://www.coar-repositories.org/news-updates/input-to-data-repository-selection-criteria-that-matter/)


Políticas de dados de editoras internacionais:

Elsevier: https://www.elsevier.com/authors/tools-and-resources/research-data

PLOS: https://plos.org/open-science/open-data/

SAGE: https://uk.sagepub.com/en-gb/eur/research-data-sharing-policies

SPRINGER: https://support.springer.com/en/support/solutions/folders/6000238326

Taylor & Francis: https://authorservices.taylorandfrancis.com/data-sharing-policies/

Wiley: https://authorservices.wiley.com/open-research/open-data/index.html


Política de dados da Open Research Europe, a plataforma de publicação científica da Comissão Europeia, lançada em 2020-2021

 – https://open-research-europe.ec.europa.eu/for-authors/data-guidelines

 – https://openreseurope.s3.amazonaws.com/resources/ORE-publishing-policies.pdf

 

Findable | Accessible | Interoperable | Reusable

Os princípios FAIR propostos para guiar a gestão dos dados de investigação preconizam quatro princípios basilares que devem guiar o ciclo de vida dos dados no processo de investigação.

 

Findable (Localizáveis)

L1. (meta)dados associados a identificadores globais, únicos e persistentes.

L2. dados descritos com metadados pormenorizados.

L3. (meta)dados registados ou indexados em recursos de pesquisa.

L4. metadados especificando o identificador dos dados.

 

Accessible (Acessíveis)

A1. (meta)dados são recuperáveis através do seu identificador usando um protocolo de comunicações normalizado.

A2. protocolo aberto, gratuito e de implementação universal.

A3. protocolo permite procedimentos de autenticação e autorização, quando necessário.

A4. metadados acessíveis, mesmo quando os dados já não estão disponíveis.

 

Interoperable (Interoperáveis)

I1. (meta)dados utilizam uma linguagem formal, acessível, partilhada e largamente aplicável para representação do conhecimento.

I2. (meta)dados utilizam vocabulários que seguem os princípios FAIR.

I3. (meta)dados contêm referências qualificadas a outros (meta)dados.

 

Reusable (Reutilizáveis)

R1. meta(dados) têm uma grande diversidade de atributos precisos e relevantes.

R1.1. (meta)dados são disponibilizados com uma licença de uso de dados clara e acessível.

R1.2. (meta)dados têm associada a sua proveniência.

R1.3. (meta)dados seguem as normas relevantes na comunidade disciplinar.

Fonte: Príncipe, Pedro, Rodrigues, Eloy, Vieira, André, Correia, Antónia, Carvalho, José, Moura, Paula, MOOC O Essencial da Gestão de Dados de Investigação (2020) disponível online na Plataforma NAU.