Uniwersytet Zielonogórski 

       Otwarte dane badawcze

 

Dane badawcze (ang. open research data) oznaczają dokumenty w formie cyfrowej (inne niż publikacje naukowe), które są gromadzone lub produkowane w ramach działalności badawczo-naukowej i są wykorzystywane jako dowody w procesie badawczym, bądź też powszechnie akceptowane w środowisku naukowym jako konieczne do weryfikacji poprawności ustaleń i wyników badań.

(Dyrektywa Parlamentu Europejskiego i Rady (UE) z 2019 r. w sprawie otwartych danych i ponownego wykorzystywania informacji sektora publicznego art., 2, p. 9.)

Dane badawcze to różnorodne materiały gromadzone w ramach prowadzonych badań naukowych, definiowane jako:

    • zarejestrowane materiały o charakterze faktograficznym, powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych;
    • dane zebrane, zaobserwowane lub wytworzone jako materiał do analizy w celu uzyskania oryginalnych wyników naukowych;
    • wszystko, co zostało wyprodukowane lub wytworzone w ramach prowadzonych badań.

Są to więc m.in. dane liczbowe, dokumenty tekstowe, kwestionariusze, wyniki ankiet, fotografie, nagrania audio i wideo, zawartość baz danych, oprogramowanie (skrypty, pliki), obserwacje laboratoryjne, modele matematyczne, algorytmy itp.

(„Prawne aspekty otwierania danych badawczych – poradnik”, s. 5)

Do danych badawczych powinno się zaliczać także dokumentację badań (informacje na temat pochodzenia danych, jak, gdzie, kiedy zostały zebrane i za pomocą jakich narzędzi?) oraz metadane (opis danych umożliwiający ich identyfikację i zrozumienie).

Dane badawcze dzielić można na:

    • dane surowe, czyli takie, które uzyskano bezpośrednio w wyniku zastosowania narzędzia badawczego, w różnych przedsięwzięciach naukowych lub też zgromadzone na potrzeby konkretnych projektów, nieprzeanalizowane;
    • dane, które poddane zostały obróbce.

Otwarte dane badawcze to dane cyfrowe w otwartym formacie, udostępniane w Internecie bezpłatnie do swobodnego korzystania wraz z prawem do ponownego wykorzystania i udostępniania przez wszystkich do dowolnego celu. Dane mogą być dowolnie używane, rozpowszechniane i przetwarzane przez kogokolwiek i gdziekolwiek w dowolnym celu, jeżeli nie spowodują naruszenia tajemnic ani interesów związanych z komercjalizacją. Należy wziąć pod uwagę kwestie związane z prawami własności intelektualnej, ochroną danych osobowych i poufnością, komercjalizacją badań, bezpieczeństwem i uzasadnionymi interesami handlowymi zgodnie z zasadą „otwarty jak to najbardziej możliwe, zamknięty jak to konieczne (Dyrektywa PE, 16, art. 10.1).

Dane badawcze udostępniane są najczęściej w postaci tzw. datasetów, czyli zbiorów danych stanowiących pewną całość powiązaną z eksperymentem, publikacją lub projektem naukowym. Muszą być one zgodne z zasadami, które ułatwią dostęp do danych i ich ponowne wykorzystanie, zarówno przez użytkowników, jak i oprogramowanie komputerowe przeszukujące bazy danych bez udziału człowieka. Są to tzw. zasady FAIR zalecane przez Komisję Europejską.

 

       Cechy danych badawczych według zasad FAIR

Nazwa FAIR pochodzi od akronimu słów Findable, Accessible, Interoperable, Reusable, określa wymogi jakie powinny spełniać udostępnione dane badawcze. FAIR oznacza dane:

    • możliwe do znalezienia (opatrzone metadanymi, które są zgodne z przyjętymi standardami dla danej dyscypliny lub rodzaju danych, zaopatrzone w trwały identyfikator DOI, indeksowane w ogólnodostępnych serwisach, które można przeszukiwać);
    • dostępne ( bezpośredni dostęp do zbioru danych i metadanych powinien być możliwy poprzez unikalny identyfikator i otwarty protokół komunikacyjny bez dodatkowych narzędzi i oprogramowania);
    • interoperacyjne (udostępnione w otwartym oprogramowaniu, które umożliwi przetwarzanie, wymianę, łączenie i powiązanie danych z innych badań, systemów komputerowych lub oprogramowania; dane i metadane muszą być dostarczone w formacie zapewniającym łatwy odczyt i przetwarzanie, zawierać odnośniki do powiązanych zbiorów);
    • możliwe do ponownego wykorzystania (opatrzone licencją określającą warunki ponownego wykorzystania i przetwarzania danych, a także informacją o kolejnych etapach przetwarzania; metadane muszą opisywać zbiór danych według standardów przyjętych dla dyscypliny lub rodzaju danych, określać autora i miejsce powstania, ma to ułatwić użytkownikom określenie ich przydatności do własnych badań).

Dane muszą być wytworzone i zapisane, przechowywane, dostępne, łatwe do znalezienia, zrozumiałe, poufne, interoperacyjne, odtwarzalne. Wytyczne w sprawie zarządzania danymi FAIR określa program Horyzont 2020.

Dostęp do danych i ich udostępnianie musi się opierać na spójnych zasadach i praktykach, opisanych jako zarządzanie danymi badawczymi (ang. Research Data Management, RDM) oraz na planie zarządzania danymi (ang. Data Management Plan, DMP).

Ujednolicenie europejskich praktyk związanych z zarządzaniem i udostępnianiem danych badawczych dla beneficjentów europejskich agencji finansujących badania naukowe proponuje Science Europe w publikacjach:

Opracowania w ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych:

Biblioteka Uniwersytetu Zielonogórskiego, al. Wojska Polskiego 71, 65-762 Zielona Góra, www.bu.uz.zgora.pl, e-mail: BU@uz.zgora.pl