Hacia una ciencia del suelo más abierta

Por George Brown, Wilian Demetrio y Alessandro Samuel-Rosa

Imagen: Markus Spiske.

Quienes trabajan con ciencias ambientales como la ciencia del suelo saben que este método implica la evaluación de múltiples variables ambientales descriptivas y explicativas. El objetivo es comprender los complejos fenómenos que ocurren en la naturaleza, ya sea trabajando en el campo o en el laboratorio, o incluso con sus derivados, como la micro, meso o macrobiota. Por lo tanto, nuestra investigación generalmente genera enormes hojas de datos, con resultados de varias variables, muchas de ellas medidas a lo largo del tiempo. A menudo, estos datos se analizan utilizando métodos estadísticos complejos para encontrar y explorar las relaciones entre las variables y su importancia. Entre estos métodos, los multivariados se han vuelto indispensables porque son muy útiles para revelar estas relaciones de una manera visualmente comprensible.

Sin embargo, una limitación de casi todo el trabajo de investigación en ciencia del suelo realizado en Brasil es la falta de acceso a los datos primarios utilizados en el análisis estadístico. Esto impide que los datos sean reutilizados, ya sea para reproducir un estudio y verificar sus conclusiones o para realizar más investigaciones para responder preguntas que quedan sin respuesta.

A menudo, los datos se presentan solo de forma agregada en forma de tablas con estadísticas descriptivas de las variables estudiadas. Uno de los usos de los datos agregados es la realización de estudios de síntesis basados en herramientas metaanalíticas, que han ido ganando terreno en la ciencia del suelo. Estos estudios identifican tendencias y patrones de comportamiento de los datos producidos en muchos trabajos sobre un tema determinado, especialmente aquellos que tienen una alta variabilidad en los resultados. Sin embargo, con el uso creciente de métodos estadísticos multivariados, incluso esta versión agregada de los datos se ha omitido en las publicaciones. En estos casos, la preferencia de autores y editores suele ser presentar los datos en forma de figuras y tablas resultantes de análisis multivariados. Este tipo de práctica perjudica incluso a los estudios de metaanálisis, lo que convierte a estos trabajos de investigación en un punto final en la vida útil de los datos.

Como científicos, nos preocupa la sostenibilidad en el avance del conocimiento. Al adoptar una política centrada en hacer que los datos primarios utilizados en nuestros estudios estén disponibles, estaremos aumentando la sostenibilidad y la utilidad futura de nuestra investigación y colaboración entre investigadores.

Muchas revistas científicas en el extranjero han adoptado políticas de datos abiertos, que exigen cada vez más que los datos primarios, como mínimo, estén disponibles como material complementario para las publicaciones o que los autores informan dónde fueron depositados, ya sea en repositorios de datos o de metadatos. Sin embargo, la práctica más eficiente y adecuada es depositar los datos de investigación en repositorios públicos confiables especializados para tal fin que, además de la preservación digital, requieren una adecuada estructuración y decripción de metadatos, asignan DOI (Digital Object Identifier, identificador de objeto digital) y, por lo tanto, dan mayor sustentabilidad y visibilidad a los datos, ya que están indexados en bases de búsqueda en línea. Lo ideal es la organización y disponibilidad de los datos según el principios FAIR, Findable, Accessible, Interoperable and Resusable (localizable, accesible, interoperable y reutilizable), que se aplican especialmente al acceso computarizado.

La mayor parte del trabajo de investigación en Ciencias del Suelo que desarrollamos en Brasil es financiado por agencias públicas o con recursos públicos, otorgados por agencias que promueven la investigación o cursos de posgrado como CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico, Consejo Nacional de Desarrollo Científico y Tecnológico) y CAPES (Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, Coordinación para la Perfeccionamiento del Personal de Educación Superior), y las fundaciones estatales de apoyo a la investigación. Además, los sueldos de los servidores públicos y empleados, que generan la mayor parte de los resultados de la ciencia en nuestro país, también se financian con recursos públicos. Por tanto, debemos entender que la disponibilidad abierta de los datos producidos en nuestra investigación, junto con las publicaciones que han generado, es una cuestión de sostenibilidad científica y de responsabilidad con la sociedad en general. Por supuesto, con la debida atención a las políticas institucionales para proteger la información sensible y hacer que los datos estén disponibles. Siempre recordando la regla de “lo más abierto posible y lo más cerrado cuando sea necesario”.

La disponibilidad abierta de datos ya es requerida por agencias de desarrollo internacionales como la Unión Europea y los Research Councils del Reino Unido, que refuerzan el requisito de presentación de datos como material complementario por parte de las revistas científicas, como se mencionó anteriormente.

En un futuro próximo, nuestros organismos de investigación también lo exigirán. El CNPq, en alianza con el Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict, Instituto Brasileño de Información en Ciencia y Tecnología), ya está desarrollando el repositorio Lattes Data para almacenar datos sobre proyectos promovidos por la agencia. En el caso de la FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo, Fundación de Apoyo a la Investigación del Estado de São Paulo), algunas convocatorias ya requieren la presentación de un plan de gestión de datos que acompañe a la propuesta de investigación. El programa SciELO también está desarrollando un repositorio, SciELO Data, para almacenar los datos vinculados a los manuscritos enviados a las revistas de la red SciELO.

Sin embargo, sería más recomendable si, como sociedad científica y como científicos, adoptamos una política de datos abiertos orientada a las especificidades y prioridades de cada área, en lugar de esperar un requerimiento de las agencias de financiación o de las revistas científicas. Así, nos adelantamos al proceso y mostramos nuestra buena voluntad hacia la sociedad brasileña, que con sus impuestos ha estado financiando nuestros trabajos, estudiantes e investigación durante décadas.

En un mundo cada vez más globalizado, en el que las grandes síntesis de datos a menudo causan una gran fanfarria, la adopción de una ciencia más abierta también aumentará la posibilidad de reutilización, uso y reanálisis de nuestros datos de investigación y, por lo tanto, su sostenibilidad, visibilidad e impacto.

El Boletín 45 (1) de la Sociedad Brasileña de Ciencias del Suelo (Sociedade Brasileira de Ciências do Solo)1 presentó una amplia discusión sobre ciencia abierta y los principales repositorios públicos nacionales e internacionales de datos abiertos de suelos. Sin embargo, desde entonces, parece que no ha habido avances en la apertura de datos sobre la investigación en ciencias del suelo en Brasil. Las principales revistas en el campo todavía no requieren que los datos se presenten como material complementario o que estén disponibles en repositorios públicos. Además, los estudiantes de maestría, doctorado y posdoctorado de los principales programas de posgrado e instituciones de investigación del área aún no necesitan desarrollar planes de gestión abierta de los datos producidos.

El desarrollo de modelos de organización y almacenamiento de datos que faciliten la disponibilidad, transferencia y reutilización, con un mínimo esfuerzo humano, se ha venido dando sólo de manera puntual y mal articulada. Es fundamental retomar esta discusión, con el objetivo de incrementar la apertura de la ciencia del suelo brasileña. Creemos que la forma más eficiente de fomentar esta discusión, de manera estructurada y coordinada, es formar un grupo de trabajo con la Sociedad Brasileña de Ciencias del Suelo. Un grupo de trabajo que reúne a investigadores de diferentes áreas de la ciencia del suelo con el fin de posibilitar soluciones sostenibles a la cuestión de los datos producidos en nuestra investigación.

La ciencia ha sido cada vez más demandada y, al mismo tiempo, criticada y escudriñada por la sociedad y los gobiernos, que buscan soluciones a los problemas actuales o, a veces, justificaciones para sus acciones. Al adoptar una política de ciencia abierta, con disponibilidad abierta de datos primarios y los resultados de nuestra investigación, demostramos que no tenemos nada que ocultar y que los datos son gratuitos para que cualquiera los use. Obviamente, esto conlleva ciertos riesgos, ya que los datos también pueden ser utilizados libremente por grupos de interés con sus propias agendas.

Como científicos, cuidamos los datos y los utilizamos con cuidado en nuestras publicaciones. Por tanto, es necesario construir, como sociedad científica, de manera concomitante con los posibles usuarios de nuestros datos, pautas de uso responsable que impliquen, por ejemplo, citar las fuentes y adoptar criterios de contexto, interpretación y uso de los datos abiertos. Estas pautas podrían estar disponibles junto con los archivos de datos, en repositorios de datos confiables. Claramente, existen muchos beneficios, pero también posibles escollos que deben evitarse en el proceso de apertura de datos de nuestra investigación, y estos temas merecen un mayor debate, con el objetivo de comprender mejor el proceso de apertura científica al que estamos expuestos y al que debemos prepararnos.

Nota

1. Os Desafios da Open Science para a Ciência do Solo. Boletim Informativo da Sociedade Brasileira de Ciência do Solo [online]. 2019, vol. 45, no.1, ISSN: 1981-979X [viewed 8 January 2020]. Available from: https://www.sbcs.org.br/wp-content/uploads/2019/06/Boletim-SBCS-Volume-45-N%C3%BAmero-1.pdf

Referencias

CNPq e IBICT lançam Lattes Data [online]. Governo Federal – Governo do Brasil. 2020 [viewed 8 January 2020]. Available from: https://www.gov.br/cgu/pt-br/governo-aberto/noticias/2020/2/cnpq-e-ibict-lancam-lattes-data

Lanzamiento del repositorio SciELO Data [online]. SciELO.org. 2020 [viewed 8 January 2020]. Available from: https://mailchi.mp/scielo/scielo-data-es

Os Desafios da Open Science para a Ciência do Solo. Boletim Informativo da Sociedade Brasileira de Ciência do Solo [online]. 2019, vol. 45, no.1, ISSN: 1981-979X [viewed 8 January 2020]. Available from: https://www.sbcs.org.br/wp-content/uploads/2019/06/Boletim-SBCS-Volume-45-N%C3%BAmero-1.pdf

WILKINSON, M.D., et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data [online]. 2016, vol. 3, no 1, 160018 [viewed 8 January 2020]. http://doi.org/10.1038/sdata.2016.18. Available from: https://www.nature.com/articles/sdata201618

Links externos

Gestão de dados – FAPESP: https://fapesp.br/gestaodedados

Repositório Brasileiro Livre para Dados Abertos do Solo: https://www.pedometria.org/febr/

SciELO Data: https://data.scielo.org/

Sociedade Brasileira de Ciência do Solo (SBCS): https://www.sbcs.org.br/

 

Sobre George Brown

George Brown es investigador de Embrapa Florestas y profesor de posgrados en Ciencias del Suelo en la Universidad Federal de Paraná. Es licenciado en Ciencias Naturales por la Universidad de Wisconsin y doctor en Ecología por la Universidad de París. Trabaja en ecología de suelos, utilizando animales como bioindicadores de calidad ambiental, y es uno de los pocos especialistas en lombrices de tierra en Brasil. Editó varios libros y publicó> 100 trabajos en revistas científicas, interactuando con cientos de profesionales en Brasil y en el exterior.

Sobre Wilian Demetrio

Wilian Demetrio es becario postdoctoral en el Instituto Nacional de Investigaciones Especiales (Inpe). Es licenciado en Agronomía de Uniguaçu, con maestría y doctorado en Ciencias del Suelo de la Universidad Federal de Paraná. Su área de estudio e interés es la ecología de suelos, con el uso de invertebrados, con énfasis en lombrices de tierra, como indicadores de la calidad del suelo.

 

Sobre Alessandro Samuel-Rosa

Alessandro Samuel-Rosa es profesor de clasificación y mapeo de suelos, estadística aplicada y probabilidad, y geoprocesamiento y teledetección en la Universidad Tecnológica Federal de Paraná. Sus intereses de investigación incluyen la optimización de configuraciones de muestra, modelos (geo)estadísticos y aprendizaje automático, y estandarización y armonización de datos. Es el líder del Laboratorio de Pedometría, que desarrolla los paquetes de pedometrics, spsann y febr para R, y mantiene el Repositório Brasileiro Livre para Dados Abertos do Solo.

 

Traducido del original en portugués por Ernesto Spinak

 

Como citar este post [ISO 690/2010]:

BROWN, G., DEMETRIO, W. and SAMUEL-ROSA, A. Hacia una ciencia del suelo más abierta [online]. SciELO en Perspectiva, 2021 [viewed ]. Available from: https://blog.scielo.org/es/2021/01/08/hacia-una-ciencia-del-suelo-mas-abierta/

 

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Post Navigation