Projeto Making Data Count incentiva compartilhamento de dados de pesquisa

O compartilhamento em acesso aberto de dados de pesquisa legível por máquina (machine-readable data) vem atraindo a atenção da comunidade acadêmica, agências de fomento, empresas e da sociedade civil desde 2013, ano em que foi publicado um relatório sobre seu potencial impacto científico, financeiro e para o setor produtivo.

Desde então, tem havido significativos avanços nas discussões sobre as questões tecnológicas, metodológicas, éticas e práticas do compartilhamento de dados. Um periódico científico de acesso aberto e arbitrado por pares – Scientific Data – foi lançado pelo Nature Publishing Group (NPG) para publicar exclusivamente conjuntos de dados (datasets) de pesquisa. Um artigo recente publicado neste periódico se refere à iniciativa Making Data Count1, que objetiva promover o compartilhamento de dados e – principalmente – seu reconhecimento como produção científica passível de citação, bem como aferir métricas de impacto científico destes dados.

Um dos caminhos para incentivar a produção e publicação de dados é o estabelecimento de métricas para avaliar sua significância e impacto, uma vez que o impacto constitui a moeda do mundo acadêmico. A academia utiliza tradicionalmente métricas baseadas em citações, porém mais recentemente, métricas alternativas baseadas nas referências aos artigos nas mídias sociais (‘altmetrics’) proveem avaliação em curto prazo após a publicação, além de diversificar as formas de medir impacto. Vários grupos vêm realizando estudos sobre métricas tradicionais, alternativas e inovadoras para dados de pesquisa.

Making Data Count é resultado da colaboração entre a California Digital Library (CDL), a Public Library of Science (PLoS) e a Data Observation Network for Earth (DataONE), que visa não apenas definir, porém implementar um conjunto de métricas para dados de pesquisa. A homepage da iniciativa afirma “O compartilhamento de dados é demorado e os pesquisadores precisam de incentivos para a realização do trabalho extra. Métricas para dados irão fornecer feedback sobre o uso, visualização e impacto de dados, que irão ajudar a incentivar os cientistas a compartilhar os seus dados. Este projeto irá explorar e testar as métricas (métricas a nível de dados) para coletar de atividade relacionada a dados de pesquisa”.

A criação de Making Data Count foi precedida de uma pesquisa online realizada em novembro e dezembro de 2014, da qual participaram 247 pesquisadores e 73 administradores de repositórios. A maioria dos pesquisadores (78%) pertencia a instituições acadêmicas localizadas nos EUA (57%) e Reino Unido (14%). Entre os administradores, 64% eram de repositórios acadêmicos e 22% de repositórios geridos por governos nos EUA (72%) e Reino Unido (11%).

As questões propostas incluíram a proporção de dados compartilhados pelos autores, onde buscar dados públicos para reutilização, frequência de uso de dados de outros autores, comportamento frente a informação de quem reutiliza seus dados, interesse no impacto dos próprios dados, e quais métricas os repositórios que abrigam seus dados usa/disponibiliza.

Quanto à forma de compartilhar dados, os pesquisadores informaram com frequência atender a requisições pessoais, via e-mail, por exemplo. As desvantagens desta prática vão da possível negativa em atender ao pedido à impossibilidade de medir o impacto de sua utilização. Felizmente, 75% dos entrevistados informaram compartilhar parte dos seus dados através de repositórios especificamente criados para esta finalidade.

No que se refere à procura por dados para reutilização, a maioria dos entrevistados informou realizar buscas em várias fontes, incluindo artigos de periódicos, bases de dados, buscadores da Internet, mídias sociais e fóruns de discussão dentro de suas comunidades.

Os dados abertos são utilizados com certa frequência em alguma etapa do processo de desenvolvimento de um projeto de pesquisa segundo 96% dos respondentes.  Os dados são usados pelos pesquisadores em extensão comparável nas várias etapas da pesquisa, e 70% relata utilizá-los para chegar à principal conclusão. Estes fatos ressaltam a importância dos dados abertos na forma como a pesquisa é realizada atualmente.

Os pesquisadores que compartilham seus dados abertos têm interesse em saber quem os utiliza e para qual finalidade. Os repositórios satisfazem parte deste interesse; cerca da metade requisita informação de contato detalhada (nome, instituição e e-mail) enquanto a outra metade não coleta nenhuma informação. Referente à disponibilização de dados que envolvem confidencialidade, os repositórios requerem dos usuários identificação detalhada, ao passo que o acesso facilitado aos dados os torna mais propensos a serem utilizados. A título de compromisso, os repositórios podem solicitar dos usuários a área de conhecimento na qual pretendem usar os dados abertos, o que permite aos administradores saber onde os dados estão sendo utilizados ao mesmo tempo que preserva a confidencialidade dos usuários.

Métricas a nível de dados abertos interessa potencialmente a gestores, agências de fomento e aos pesquisadores que geraram os dados. A maioria dos pesquisadores (85%) e administradores de repositórios (61%) entrevistados destacam citações como a métrica de maior prestígio, seguido por medidas de download, e por último, visualizações, consistente com o que se observa com métricas de artigos e periódicos. Por último, os administradores relataram quais métricas seus repositórios acompanham e disponibilizam. A quase totalidade acompanha downloads e a maioria visualizações, porém menos da metade mostra estes resultados. Uma pequena percentagem (cerca de 20%) acompanha citações a conjuntos de dados individuais ou a repositórios, de maneira geral, a despeito de seu prestígio, presumivelmente pela dificuldade em obtê-los.

Pesquisadores, principalmente os acadêmicos, valorizam citações, porém sua utilidade para dados abertos é limitada, uma vez que datasets são raramente citados. A maioria deles, entretanto, considera que “citação formal seria uma condição justa para o compartilhamento de dados”1.

A complexa questão do crédito dos dados de pesquisa foi recentemente reunida no documento Joint Declaration of Data Citation Principles (DC1), elaborado pelo grupo de trabalho internacional FORCE11 e anteriormente relatado neste blog2. Até o momento, a Declaração foi assinada por 94 repositórios, publishers, e instituições acadêmicas de prestígio. Considerando os princípios do DC1, a iniciativa Making Data Count recomenda que seja encorajada a citação formal dos dados abertos, além da coleta e disponibilização de medidas de download, mais fáceis de obter e disponibilizar, e que gozam de certa reputação entre pesquisadores. Por último, porém não menos importante é a contabilização de métricas a nível de artigo e métricas alternativas baseadas em bookmarks e mídias sociais como Mendeley, CiteULike, Facebook, Twitter e outros.

Espera-se, desta forma, que o quantificar do impacto de dados abertos para aumentar sua disponibilização e uso pelos pesquisadores, seja atendida por iniciativas como Making Data Count e outras a seguir.

Notas

1. KRATZ, J. E. and STRASSER, C. Making data count. Scientific Data. 2015, nº150039 [online]. DOI: http://dx..org/10.1038/sdata.2015.39

2. SPINAK, E. Princípios para citar dados científicos. SciELO em Perspectiva. [viewed18 September 2015]. Available from: https://blog.scielo.org/blog/2015/01/15/principios-para-citar-dados-cientificos/

Referências

Dataset Level Metrics Subject Group. Consortia Advancing Standards in Research Administration Information (CASRAI). Available from: http://casrai.org/standards/subject-groups/dataset-level-metrics

KRATZ, J. E. and STRASSER, C. Making data count. Scientific Data. 2015, nº150039 [online]. DOI: http://dx..org/10.1038/sdata.2015.39

MARTONE, M. Joint Declaration of Data Citation Principles. FORCE11, Data Citation Synthesis Group, 2014. Available from https://www.force11.org/group/joint-declaration-data-citation-principles-final

NISO Alternative Assessment Metrics (Altmetrics) Initiative. National Information Standards Organization (NISO). Available from: http://www.niso.org/topics/tl/altmetrics_initiative/

RDA/WDS Publishing Data Bibliometrics WG Case Statement. Research Data Alliance. Available from: http://rd-alliance.org/group/rdawds-publishing-data-bibliometrics-wg/case-statement/rdawds-publishing-data-bibliometrics-wg

SCIENTIFIC ELECTRONIC LIBRARY ONLINE. Movimento Open Data se consolida internacionalmente. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2014/07/14/movimento-open-data-se-consolida-internacionalmente/

SPINAK, E. and PACKER, A. Scientific Data: Nature Publishing Group avança a comunicação de dados científicos com nova publicação online em acesso aberto. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2014/02/04/scientific-data-nature-publishing-group-avanca-a-comunicacao-de-dados-cientificos-com-nova-publicacao-online-em-acesso-aberto/

SPINAK, E. Dados Abertos: informação líquida, democracia, inovação… os tempos estão mudando. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2013/11/18/dados-abertos-informacao-liquida-democracia-inovacao-os-tempos-estao-mudando/

SPINAK, E. Intercâmbio de dados de pesquisa continua baixo e aumenta lentamente. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2014/11/12/intercambio-de-dados-de-pesquisa-continua-baixo-e-aumenta-lentamente/

SPINAK, E. Princípios para citar dados científicos. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2015/01/15/principios-para-citar-dados-cientificos/

SPINAK, E. Semana Internacional dos Dados Abertos – o que há de novo?. SciELO em Perspectiva. [viewed 18 September 2015]. Available from: https://blog.scielo.org/blog/2015/01/07/semana-internacional-dos-dados-abertos-o-que-ha-de-novo/

Links Externos

Altmetric – <http://www.altmetric.com/>

Making Data Count: Project to develop Data-Level Metrics – <http://mdc.lagotto.io/>

Scientific Data – <http://www.nature.com/sdata/>

 

lilianSobre Lilian Nassi-Calò

Lilian Nassi-Calò é química pelo Instituto de Química da USP e doutora em Bioquímica pela mesma instituição, a seguir foi bolsista da Fundação Alexander von Humboldt em Wuerzburg, Alemanha. Após concluir seus estudos, foi docente e pesquisadora no IQ-USP. Trabalhou na iniciativa privada como química industrial e atualmente é Coordenadora de Comunicação Científica na BIREME/OPAS/OMS e colaboradora do SciELO.

 

Como citar este post [ISO 690/2010]:

NASSI-CALÒ, L. Projeto Making Data Count incentiva compartilhamento de dados de pesquisa [online]. SciELO em Perspectiva, 2015 [viewed ]. Available from: https://blog.scielo.org/blog/2015/10/01/projeto-making-data-count-incentiva-compartilhamento-de-dados-de-pesquisa/

 

One Thought on “Projeto Making Data Count incentiva compartilhamento de dados de pesquisa

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation