Dane badawcze (ang. Research Data) to dane zebrane lub wytworzone jako materiał do analizy w badaniach naukowych oraz pracach rozwojowych, gromadzone w celu uzyskania oryginalnych wyników, konieczne do weryfikacji wyników tych badań. Dane badawcze stanowią zarówno surowe dane (uzyskane bezpośrednio w wyniku zastosowania narzędzia badawczego) oraz dane poddane obróbce. Każda dyscyplina nauki tworzy własne, specyficzne dla niej dane badawcze, to np. dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, nagrania audio i wideo, fotografie, oprogramowanie, wyniki symulacji komputerowych, protokoły laboratoryjne, opisy metodologiczne itd.
Otwarte Dane Badawcze (ang. Open Research Data) to zebrane lub wytworzone zbiory danych, które powstały jako rezultat pracy naukowej i zostały udostępnione do bezpłatnego, powtórnego użycia bez barier prawnych i technicznych co najmniej w zakresie wymaganym do weryfikacji wyników badań zaprezentowanych w publikacjach naukowych. Otwarte Dane Badawcze powinny być udostępniane w taki sposób, aby mogły być powtórnie wykorzystane, modyfikowane lub rozpowszechniane z poszanowaniem prawa.
Zgodnie z Dyrektywą Parlamentu Europejskiego i Rady (UE) 2019/1024 z dn. 20 VI 2019 r. w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego, wyniki badań naukowych finansowanych ze środków publicznych powinny zostać opublikowane w otwartym dostępie. W unijnych programach Horyzont 2020, Horyzont Europa oraz w konkursach Narodowego Centrum Nauki ustalono zasady zarządzania danymi badawczymi oraz sposoby ich udostępniania. Coraz częściej również redakcje czasopism wymagają od autorów udostępniania danych, na podstawie których powstała konkretna publikacja naukowa.
W Polsce powyższą dyrektywę Parlamentu Europejskiego wdraża Ustawa z dnia 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego.
Otwarte Dane Badawcze powinny być udostępniane i przechowywane w repozytoriach danych badawczych, które gwarantują bezpieczne i długoterminowe przechowywanie, stały adres internetowy, możliwość uzyskania trwałego identyfikatora, łatwość wyszukiwania oraz cytowania.
Zasady udostępniania danych w Uniwersytecie im. Adama Mickiewicza w Poznaniu
Artykuł naukowy jest zwieńczeniem pracy badawczej oraz ważnym ogniwem komunikacji naukowej. Częstotliwość ukazywania się artykułów naukowych zależy nie tylko od polityki wydawniczej danego czasopisma, ale także od dyscypliny naukowej. Zdarza się, iż czas oczekiwania na publikację artykułu naukowego jest dość długi, nie wszyscy wydawcy udostępniają artykuły w postaci „przed drukiem” (ahead of print). W celu umożliwienia szybszego zaprezentowanie danych i sposobów ich pozyskiwania (jeszcze przed publikacją pełnych artykułów naukowych opatrzonych wnioskami i analizą danych), zaczęły powstawać tzw. data journals, czyli recenzowane czasopisma publikujące artykuły na temat zbiorów danych badawczych.
Artykuły opisujące zbiory danych określane są jako data descriptors, mogą zawierać załączniki z omawianymi danymi lub też wskazywać na miejsce przechowywania danych (zazwyczaj są to repozytoria). W procesie recenzji data descriptors oceniana jest jakość danych (procedury, przyjęte metody) oraz unikatowość i potencjalna przydatność danych w badaniach innych naukowców. Niektóre data journals posiadają punktację ministerialną czy też wskaźnik Impact Factor.
Struktura data descriptors jest inna niż np. artykułu naukowego napisanego zgodnie z klasyczną strukturą IMRAD (Introduction, Materials & Methods, Results, Discussion) i standardowo powinna składać się z następujących elementów:
- zbiór danych (dataset) – powinien zostać uprzednio umieszczony w repozytorium danych badawczych zgodnie z zasadami FAIR oraz opatrzony identyfikatorem DOI,
- opis badań – cele projektu badawczego (w jakim celu zgromadzono opisywane dane),
- opis zawartości datasetu – typy danych, zastosowane formaty, informacja o wersjonowaniu datasetu,
- metody – sposób pozyskania danych, informacja o aparaturze, warunki pomiarów itp.,
- możliwość ponownego wykorzystania – określenie licencji, na jakiej dane zostały udostępnione,
- wartość danych – informacja o unikalności danych, ich przydatności dla innych naukowców oraz o wartości ich wkładu w aktualny stanu wiedzy.
Tytuł czasopisma | Punktacja ministerialna | Impact Factor | CiteScore | SJR |
GigaScience (Oxford University Press) https://academic.oup.com/gigascience ISSN 2047-217X | 200 | 11.8 | 15.5 | 4.621 |
Earth System Science Data – ESSD (Copernicus Publications) https://www.earth-system-science-data.net/ ISSN 1866-3508; e-ISSN 1866-3516 | 200 | 11.2 | 18.0 | 4.231 |
Astrophysical Journal Supplement Series https://iopscience.iop.org/journal/0067-0049 (American Astronomial Society) ISSN 0067-0049; e-ISSN 1538-4365 | 200 | 8.6 | 14.5 | 3.329 |
International Journal of Robotics Research https://journals.sagepub.com/home/ijr (Sage Publications) ISSN 0278-3649; e-ISSN 1741-3176 | 200 | 7.5 | 22.2 | 4.346 |
International Journal of Epidemiology https://academic.oup.com/ije (Oxford University Press) ISSN 0300-5771; e-ISSN 1464-3685 | 200 | 6.4 | 13.6 | 2.663 |
Scientific Data (Springer Nature) https://www.nature.com/sdata/ e-ISSN 2052-4463 | 140 | 5.8 | 11.2 | 1.937 |
Journal of Physical and Chemical Reference Data https://aip.scitation.org/toc/jpr/current (AIP Publishing) ISSN 0047-2689; e-ISSN 1529-7845 | 100 | 4.4 | 6.9 | 0.746 |
Geoscientific Model Development (Copernicus) https://www.geoscientific-model-development.net/ ISSN 1991-959X; e-ISSN 1991-9603 | 140 | 4.0 | 8.6 | 2.055 |
Geoscience Data Journal (Wiley) https://rmets.onlinelibrary.wiley.com/journal/20496060 ISSN 2049-6060 | 70 | 3.3 | 5.9 | 0.440 |
Nuclear Data Sheets (Elsevier) https://www.journals.elsevier.com/nuclear-data-sheets/ ISSN 0090-3752 | 100 | 2.8 | 7.8 | 0.781 |
Atomic Data and Nuclear Data Tables (Elsevier) https://www.journals.elsevier.com/atomic-data-and-nuclear-data-tables/ ISSN 0092-640X; e-ISSN 1090-2090 | 200 | 2.7 | 4.5 | 0.488 |
Data (MDPI) https://www.mdpi.com/journal/data e-ISSN 2306-5729 | 20 | 2.2 | 4.3 | 0.503 |
Journal of Chemical & Engineering Data (ACS Publications) https://pubs.acs.org/journal/jceaax ISSN 0021-9568; e-ISSN 1520-5134 | 70 | 2.0 | 5.2 | 0.567 |
BMC Research Notes (Biomed Central) https://bmcresnotes.biomedcentral.com/ ISSN 1756-0500 | 70 | 1.6 | 3.6 | 0.486 |
Journal of Open Archeology Data (Ubiquity Press) https://openarchaeologydata.metajnl.com/ e-ISSN 2049-1565 | 70 | 1.1 | 2.2 | 0.235 |
Data in Brief (Elsevier) https://www.sciencedirect.com/journal/data-in-brief ISSN 2352-3409 | 40 | 1.0 | 3.1 | 0.208 |
F1000Research (F1000 Research)https://f1000research.com/ e-ISSN 2046-1402 | 70 | – | 5.0 | 0.821 |
Internet Archaeology (University of York) https://intarch.ac.uk/authors/data-papers.html ISSN 1363-5387 | 70 | – | 1.1 | 0.392 |
Genomics Data (Elsevier) https://www.journals.elsevier.com/genomics-data ISSN 2213-5960 | 70 | – | – | – |
Cytowanie publikacji naukowych – wraz z uznaniem autorstwa także w otwartych modelach publikowania – stanowi stały i dobrze ugruntowany element pisarstwa naukowego.
W przypadku cytowania danych badawczych także obowiązuje uznanie autorstwa – podobnie jak przy cytowaniu publikacji naukowych – a forma opisu bibliograficznego zależy oczywiście od stylu cytowania przyjętego przez dane czasopismo (np. Chicago, Harward, MLA, APA, IEEE), jednak standardowo powinna składać się z następujących elementów:
- autor/autorzy,
- rok,
- tytuł,
- miejsce udostępniania (np. nazwa repozytorium),
- wersja (np. Version v1.1),
- trwały identyfikator (np. DOI).
Minister Edukacji i Nauki zarządzeniem z dnia 20 kwietnia 2021 r. powołał Zespół doradczy do spraw otwartych danych naukowych, do którego zadań należy:
- Wsparcie ministra właściwego do spraw szkolnictwa wyższego i nauki w procesie opracowania Polityki otwartego dostępu do danych badawczych finansowanych ze środków publicznych.
- Wsparcie działań ministra właściwego do spraw szkolnictwa wyższego i nauki podejmowanych w ramach inicjatywy Komisji Europejskiej European Open Science Cloud(EOSC), w tym działań zmierzających do wdrożenia w Polsce środowiska wirtualnego EOSC, z uwzględnieniem stanu i możliwości infrastruktury informatycznej nauki.
- Opracowanie rekomendacji w zakresie aktualizacji krajowych zaleceń dla podmiotów systemu szkolnictwa wyższego i nauki, podmiotów finansujących badania naukowe lub prace rozwojowe ze środków publicznych oraz wydawców, dotyczących otwartego dostępu do publikacji i wyników badań naukowych.
- Przygotowanie propozycji standardów interoperacyjności dla baz danych badawczych na poziomie instytucjonalnym i krajowym.
Korzyści płynące z udostępniania danych:
- transparentność danych badawczych, stanowiących podstawę publikacji naukowej,
- możliwość wykrycia badań nierzetelnych,
- zwiększenie wiarygodności naukowej badacza,
- możliwość łatwiejszego wykrywania plagiatów,
- zwiększenie widoczności badacza w międzynarodowej społeczności naukowej,
- cytowanie danych może pozytywnie wpłynąć na liczbę cytowań danej publikacji.
Warto przeczytać! Jak korzystać z zasobów w repozytoriach danych. Oprac. Natalia Gruenpeter.