Uniwersytet Zielonogórski 

       Plan zarządzania danymi


Plan zarządzania danymi (ang. Data Management Plan, DMP) to „dokument opisujący, co będzie się działo z danymi w trakcie projektu i po jego zakończeniu. Ma charakter żywego dokumentu, który może i powinien się zmieniać wraz ze zmianami pojawiającymi się w innych obszarach projektu badawczego”. Zgodnie z zasadami FAIR powinien opisywać, jakie działania zostaną podjęte, aby wytworzone w ramach projektu dane były łatwe do odnalezienia, dostępne i możliwe do ponownego wykorzystania oraz powiązania z innymi danymi. („Selekcja i przygotowanie danych badawczych do udostępniania”, s. 6)

Plan powinien powstać na etapie przygotowania projektu badawczego, musi być:

    • opisany skrótowo (do 800 znaków);
    • dołączony do formularza wniosku o finansowanie projektu;
    • może się zmieniać, podobnie jak plan badawczy z którym jest związany;
    • nie wymaga konsultacji w trakcie zmian;
    • skorygowany na etapie składania raportu końcowego;
    • oceniany podwójnie; na etapie oceny wniosku i po zakończeniu projektu badawczego;
    • oceniany według tego samego wzoru dla wszystkich konkursów.

Plany różnią się od siebie w zależności od rodzaju danych i dyscypliny naukowej, której dotyczą; niezależnie od tego powinny zawierać informacje wspólne dla wszystkich projektów konkursowych, w zakresie:

danych, ustaleń typu:

    • jakie dane zostaną wytworzone lub zebrane podczas projektu? (typy i liczba danych, format plików);
    • jak zostaną opisane i uporządkowane? (rodzaj metadanych, standardy, metodologia);
    • jakie będą podstawy prawne oraz aspekty etyczne (kodeks NCN, prawa autorskie, własność intelektualna, dane niejawne);
    • w jaki sposób dane będą udostępnione? (gdzie, jak, kiedy, komu?);
    • jakie dane będą przechowywane długoterminowo (sposoby przechowywania danych oraz ich ochrona).

stosowanej licencji:

    • Creative Commons (zalecane CC0, CC-BY, CC-BY-SA);
    • Open Data Commons (licencja stosowana wyłącznie do baz danych ujętych jako całości; nie obejmują części składowych bazy).


Każdy z etapów planu niesie za sobą specyficzne wyzwania prawne, które należy dokładnie rozważyć (zob. „Prawne aspekty otwierania danych badawczych – poradnik”).

Do organizacji, które wymagają prowadzenia DMP należą:

    • Komisja Europejska (Horizon2020);
    • European Research Council;
    • National Science Foundation;
    • Research Councils UK;
    • Biotechnology and Biological Sciences Research Council Wellcome Trust;
    • Narodowe Centrum Nauki.


Zgodnie z wytycznymi planu zarządzania danymi w projektach Narodowego Centrum Nauki, podobnie jak w planach programu „Horyzont 2020”, powinien zawierać:

    • opis danych:
      • sposoby pozyskiwania i wytwarzania nowych danych oraz ponownego wykorzystania już istniejących; określenie rodzaju formatu i objętości plików danych;
    • dokumentację i jakość danych:
      • określenie standardu metadanych, sposobu organizacji danych, wyboru metodologii, środków kontroli jakości;
    • przechowywanie i tworzenie kopii zapasowych podczas badań:
      • bezpieczeństwo danych i metadanych; tworzenie kopii zapasowych, zabezpieczenie danych i ochrona danych wrażliwych podczas badań;
    • wymogi prawne, kodeks postępowania:
      • sposób zapewnienia zgodności z przepisami dotyczącymi danych osobowych oraz bezpieczeństwa przy ich przetwarzaniu; sposób zarządzania innymi kwestiami prawnymi, np. prawami własności intelektualnej lub własności; aktualne przepisy;
    • udostępnianie i długotrwałe przechowywanie danych:
      • sposób i termin udostępniania danych; ograniczenia w ich udostępnianiu; przyczyny embarga; sposoby selekcji danych, miejsce długoterminowego przechowywania, metody lub narzędzia programowe umożliwiające dostęp i korzystanie z danych, przypisanie identyfikatora DOI do każdego rodzaju zbiorów;
    • zadania związane z zarządzaniem danymi:
      • wybór osoby zarządzającej; określenie środków przeznaczonych na zarządzanie zgodnie z zasadami FAIR.

Od 2019 r. Narodowe Centrum Nauki wprowadziło obowiązek dołączania planu zarządzania danymi badawczymi do formularza wniosku o finansowanie projektu (komunikat: „Plany NCN w zakresie zarządzania danymi naukowymi” z dnia 3.04.2019 r.)

Formularz przygotowany jest do skrótowej wersji opisu (zwiększonej teraz z 400 do 800 znaków). Plan może podlegać zmianom w trakcie realizacji projektu podobnie jak plan badawczy z którym jest związany, bez konieczności konsultowania z Centrum. Musi on być uzupełniany na etapie składania raportu końcowego. Zgodnie z Regulaminem dotyczącym oceny wniosków podlega on ocenie po zakończeniu realizacji projektu (według tego samego wzoru dla wszystkich konkursów).


       Przykładowe plany zarządzania danymi

    • DMPTool - narzędzie do tworzenia planów zarządzania danymi odpowiadające wymaganiom amerykańskich instytucji finansujących projekty, udostępnia ok. 43.5 tys. planów z różnych dyscyplin naukowych z 268 instytucji).

    • DMPonline elastyczne narzędzie do tworzenia spersonalizowanych planów zarządzania danymi badawczymi według wymagań instytucji finansujących projekty, dostarczane przez Digital Curation Center (DCC). Zawiera wskazówki, szablony i przykłady pomocne w pisaniu DMP, udostępnia 21 tys. planów z 203 instytucji z 89 krajów.

    • The Data Curation Center – brytyjski serwis specjalizujący się w zarządzaniu danymi badawczymi; Zawiera gotowe plany zarządzania danymi, szablony, przewodniki, wytyczne, informacje o formatach i metadanych dla poszczególnych dyscyplin naukowych, a także listę kontrolną DMP (Checklist for a Data Management Plan), która pozwala określić, jakich informacji może brakować w przygotowywanym planie.

    • Przykładowy plan zarządzania danymi dla nauk społecznych

      Doctoral Dissertation Research: An Agent-Based Model of Population Changes in a Vulnerable Coastal Environment
    • Przykładowy plan zarządzania danymi dla projektu NCN

      Plan zarządzania danymi
      opracowany przez dr hab. Małgorzatę Jefimow z UMK w Toruniu - biologia (wersja skrócona z OSF)


       Standardy metadanych dla różnych dziedzin wiedzy

Dane badawcze powinny być odpowiednio opisane dla łatwego zidentyfikowania. Można to zrobić za pomocą metadanych, które służą do szczegółowego opisu danych zgodnie z przyjętymi standardami dla poszczególnych dziedzin lub dyscyplin naukowych. W wyborze standardów pomogą wybrane instytucje, które informują, jakie standardy stosują poszczególne repozytoria:

    • Digital Curation Centre Standards - strona z dyscyplinarnymi metadanymi pomocna przy poszukiwaniu standardów dla własnych danych badawczych; zwiera zestaw międzynarodowych standardów pomocnych przy planowaniu oraz zarządzaniu zasobem danych.
    • FAIRsharing - wyszukiwarka standardów metadanych powiązana z repozytoriami dziedzinowymi.
    • The Research Data Alliance (RDA) Metadata Standards - katalog standardów metadanych RDA


Dane powinny być:

    • udostępniane w formacie zapewniającym powszechny dostęp i otwartość wyszukiwania;
    • udostępniane razem z metadanymi (opisem) ułatwiającymi identyfikację danych oraz całej bazy;
    • opracowane według określonej metodologii i standardów dla danej dyscypliny;
    • efektywnie zarządzane przez opiekuna lub zarządzającego, co zapewni ich trwałość i integralność;
    • bezpieczne podczas gromadzenia, przetwarzania i udostępniania danych z kopiami zapasowymi;
    • bezpiecznie przechowywane również podczas długotrwałego archiwizowania w gwarantowanych serwisach;
    • zgodne z przepisami prawa; chroniące właściciela praw autorskich;
    • ochronione w przypadku zbioru danych wrażliwych, poufnych, osobowych, chronionych prawem autorskim;
    • zdeponowane w wybranym repozytorium lub czasopiśmie zgodnie z przyjętymi w danej dyscyplinie standardami;
    • długotrwale archiwizowane i dostępne.


Po zakończeniu projektu dane badawcze powinny być udostępniane w prestiżowych i zaufanych miejscach, tam gdzie grupa docelowa będzie nimi zainteresowana:

    • w czasopismach gromadzących dane;
    • w specjalistycznych repozytoriach.

(„Jak korzystać z zasobów w repozytoriach danych”)

Rekomendowany czas przechowywania danych wynosi 10 lat i wynika bezpośrednio z zasad kodeksu rzetelności naukowej oraz zapisów umowy grantowej, a także zastosowanej metodologii typowej dla określonej dziedziny wiedzy.

Aby dane cyfrowe były dostępne przez ten czas muszą być aktywnie zarządzane.Taką gwarancję daje deponowanie zbiorów
w bezpiecznych repozytoriach cyfrowych zarządzanych zgodnie z dobrymi praktykami archiwizacji cyfrowej i zasadami FAIR.


FAIR to wytyczne, które umożliwiają ponowne wykorzystanie danych, przeznaczone dla ludzi i maszyn przetwarzających dane według zasady:

    • Findable – łatwe do odnalezienia;
    • Accessible – dostępne dla wszystkich;
    • Interoperable – interoperacyjne, umożliwiające połączenie z innymi danymi;
    • Reusable – do ponownego (wielokrotnego) wykorzystania.

Wytyczne w sprawie zarządzania danymi FAIR określa program Horyzont 2020

Przed udostępnieniem należy sprawdzić, czy istnieją prawne ograniczenia dotyczące ponownego wykorzystania danych pochodzących od osób trzecich oraz wskazać licencję, na której będą udostępniane (zalecane są licencje otwarte). Wszystkie pozyskiwane i wytwarzane dane muszą mieć określonego właścicieli praw autorskich i praw własności intelektualnej.

Wyniki badań mogą być składowane w repozytoriach instytucjonalnych liderów projektu lub w europejskim repozytorium ogólnego przeznaczenia Zenodo , a także w repozytoriach dziedzinowych, które można wyszukiwać w katalogu repozytoriów Open DOAR albo katalogu danych badawczych re3data.org. Naukowcy pracujący w Polsce mają możliwość przechowywania i udostępniania danych badawczych w polskim repozytorium RepOD. Należy dokładnie zapoznać się z warunkami korzystania
z serwisu i sprawdzić czy spełnia on nasze wymagania. (zob. „Jak korzystać z zasobów w repozytoriach danych”)


       Wyszukiwarki 

    • re3data.org (Registry of Research Data Repositories) to globalny rejestr repozytoriów danych badawczych ze wszystkich dyscyplin akademickich. Dostarcza informacji o repozytoriach do trwałego przechowywania i dostępu. Podaje tytuły serwisów, ich zakres tematyczny, podział według dziedzin i dyscyplin oraz informacje o ograniczeniach, dzięki czemu łatwiej znaleźć serwis do zarchiwizowania i udostępniania wyników badań. Rejestruje ponad 3.300 repozytoriów z całego świata, w tym ponad 1.200 z Europy, 5 z Polski (m.in. RepOD; dane z kwietnia 2020). Rejestr uruchomiony w 2012 r. i finansowany przez German Research Foundation (DFG) jest usługą DataCite wymienianą przez wielu wydawców w ich politykach redakcyjnych jako najlepsze narzędzie do identyfikacji odpowiedniego repozytorium. Zalecane jest też w wytycznych Komisji Europejskiej w sprawie otwartego dostępu do publikacji i danych badawczych w programie „Horyzont 2020”.

    • OpenDOAR to światowy katalog repozytoriów otwartego dostępu i ich polityk, prowadzony przez University of Nottingham według usług SHERPA/RoMEO we współpracy z Lund University. Umożliwia identyfikację, przeglądanie i wyszukiwanie repozytoriów na podstawie szeregu funkcji, takich jak lokalizacja, oprogramowanie lub rodzaj przechowywanych materiałów. Wymaga otwartego dostępu do publikacji naukowych oraz kontroluje przesyłane materiały według własnego uznania. Rejestruje i umożliwia przeszukiwanie zasobów 5.313 repozytoriów z całego świata, w tym 2.113 z Europy i 113 z Polski.



       Repozytoria danych badawczych

    • Zenodo ogólnodostępne repozytorium opracowane w ramach europejskiego programu OpenAIRE na zlecenie Komisji Europejskiej, prowadzone i finansowane przez CERN. Umożliwia naukowcom z każdego obszaru tematycznego deponowanie zbiorów danych, oprogramowania badawczego, raportów i innych cyfrowych materiałów związanych z badaniami. Publikacje oznaczane są identyfikatorem DOI. Wskazane jako miejsce do przechowywania danych.

    • RepOD Repozytorium Otwartych Danych opracowane przez ICM UW w ramach działań Platformy Otwartej Nauki archiwizujące i udostępniające wszystkie dane wytworzone, zebrane i opracowane na potrzeby badań naukowych. Przeznaczone dla tzw. małych danych.


Źródła:


Opracowania w ramach projektu Dziedzinowe Repozytoria Otwartych Danych Badawczych:


Opracowania Science Europe:

Biblioteka Uniwersytetu Zielonogórskiego, al. Wojska Polskiego 71, 65-762 Zielona Góra, www.bu.uz.zgora.pl, e-mail: BU@uz.zgora.pl