Plany zarządzania danymi badawczymi
Wprowadzenie
Dane badawcze są to wszystkie dane, które zostały zebrane, wytworzone, zaobserwowane w trakcie procesu badawczego, mającego na celu otrzymanie wyników naukowych.
Dane badawcze to:
- surowe dane (które uzyskano bezpośrednio w wyniku zastosowania narzędzia badawczego),
- przetworzone dane (opracowane).
Przykłady danych badawczych:
- notatki z eksperymentów, dzienniki
- protokoły laboratoryjne, opisy procedur
- opisy metodologiczne
- próbki
- artefakty, obiekty
- dokumenty tekstowe
- kwestionariusze, ankiety
- nagrania audio lub wideo
- fotografie, obrazy
- zawartość baz danych (obrazy, teksty, nagrania audio i wideo)
- oprogramowanie (skrypty, pliki wejściowe)
- wyniki symulacji komputerowych
- modele matematyczne i algorytmy
Otwarte dane badawcze – to dane wytworzone w trakcie badań i użyte w pracy naukowej, do których każdy użytkownik ma swobodny i bezpłatny dostęp. Dane te można wykorzystywać, modyfikować i udostępniać zgodnie z prawem.
Niektóre dane mogą być archiwizowane w modelu zamkniętym, z uwagi na:
- komercjalizację wyników badań, np. zgłoszenie wynalazku do ochrony patentowej
- bezpieczeństwo narodowe
- ochronę danych osobowych
- ograniczenia z tytułu praw autorskich
Data set – uporządkowany zbiór danych, udostępniony w danym repozytorium, odnoszący się do danego tematu, opatrzony metadanymi opisującymi jego zawartość.
Metadane danych badawczych:
Odpowiednie przygotowanie, uporządkowanie i opisanie danych pozwoli na ich sprawne wyszukanie.
Dane powinny zostać opatrzone metadanymi w taki sposób, aby odbiorca wiedział jakiego rodzaju są to dane, w jaki sposób zostały wytworzone oraz na jakich zasadach może z nich korzystać.
Nie ma jednego powszechnie obowiązującego standardu opisu metadanych dla danych badawczych, dlatego warto zapoznać się ze standardami opisu metadanych stosowanymi w repozytorium, w którym zamierzamy zdeponować dane.
W standardach opisu metadanych mogą pojawić się następujące pola, które trzeba będzie uzupełnić:
- tytuł
- źródło
- twórcy (osoby lub podmioty posiadające prawa autorskie do danych badawczych)
- data wytworzenia
- format
- język
- informacje dotyczące otwartości (w tym licencja i ewentualne embargo)
- powiązany projekt
- powiązana publikacja, itp.
W wyborze odpowiedniego standardu mogą pomóc narzędzia:
Formaty plików
Dane powinny zostać zdeponowane w taki sposób, aby zapewnić ich długoterminową czytelność i dostępność. Przy udostępnianiu danych badawczych należy wziąć pod uwagę:
- oprogramowanie, za pomocą którego będzie można je odczytać
- trwałość wybranych formatów plików.
Należy używać ogólnodostępnych formatów plików. W tym celu warto stosować formaty plików bez kompresji, które nie wymagają komercyjnego oprogramowania oraz wykorzystują standardowe kodowanie (ASCII, Unicode).
W niektórych przypadkach migracja danych do otwartego formatu może spowodować utratę części danych / metadanych lub ich zniekształcenie. Dopuszcza się wtedy możliwość deponowania danych w formatach zamkniętych.
Jeżeli dane są możliwe do odczytania za pomocą narzędzi komercyjnych, ale powszechnie stosowanych w danej dyscyplinie, wtedy również dopuszcza się zdeponowanie takich danych.
Przed przygotowaniem data setów, należy sprawdzić, czy repozytorium umożliwia zdeponowanie danych w wybranym przez nas formacie.
Udostępnianie danych badawczych
Dane powinny być otwarte na tyle, na ile jest to możliwe oraz na tyle zamknięte, na ile to jest konieczne. Aby pomóc naukowcom odpowiednio przygotować i udostępniać dane, zostały opracowane zasady FAIR, według których dane powinny być:
Findable – łatwe do odnalezienia; zestaw danych musi być opatrzony takimi metadanymi, aby były one wyszukiwalne za pomocą odpowiednich narzędzi dostępnych w danym repozytorium
Accessible – dostępne (co najmniej do poziomu metadanych) dla wszystkich zainteresowanych mających dostęp do Internetu;
- dostępność w FAIR nie oznacza otwartego dostępu bez ograniczeń, oznacza, że poprzez metadane określa się dokładne warunki, na jakich dane są udostępniane i możliwe do ponownego wykorzystania
Warto skorzystać z poniższych otwartych licencji:
- Licencje Creative Commons
- Licencje wolnego oprogramowania GNU
- Licencje baz danych Open Data Commons
Metadane powinny być dostępne nawet wtedy, gdy zbiór danych został przeniesiony lub usunięty.
Interoperable – interoperacyjne; dane muszą być opisane w odpowiednim standardzie oraz z zastosowaniem prawidłowej metodologii; powinny być także zdeponowane w formatach umożliwiających ich odczyt oraz przetwarzanie
Reusable – możliwe do ponownego wykorzystania; oznacza to, że w opisie lub samych setach powinna być zawarta informacja o pochodzeniu danych wraz z całą metodologią ich pozyskiwania; możliwość ponownego wykorzystania wymaga również, aby była wskazana licencja, na której dane zostały udostępnione i mogą być przetwarzane.
Repozytoria
Dane badawcze powinny być gromadzone i udostępniane w repozytoriach instytucjonalnych, krajowych lub międzynarodowych.
Przy wyborze repozytorium trzeba zwrócić uwagę na następujące kwestie:
- na jakich zasadach dane będą przechowywane
- w jaki sposób dane będą zabezpieczane
- czy repozytorium wspiera używany w danej dyscyplinie standard opisu metadanych
- czy repozytorium zapewnia przypisanie identyfikatora, np. DOI, do zbiorów danych (przekłada się to na lepsze wyszukiwanie danych)
- czy można powiązać zbiór danych z autorami za pomocą identyfikatorów, tj. ORCID
- czy inni naukowcy z danej dyscypliny korzystają z tego samego repozytorium
- koszt zdeponowania danych (należy sprawdzić, czy wybrane przez nas repozytorium stosuje dodatkowe opłaty, tzw. Data Processing Charge, czy zdeponowanie danych jest bezpłatne)
Przy wyborze repozytorium warto skorzystać także z Register of Research Data Repositories. Jest to globalny rejestr repozytoriów danych badawczych ze wszystkich dyscyplin naukowych.
Jedne z najpopularniejszych obecnie repozytoriów danych badawczych to:
- Repozytorium danych badawczych Politechniki Warszawskiej – repozytorium instytucjonalne, działające jako część Bazy Wiedzy Politechniki Warszawskiej. Spełnia zasady FAIR data. Dane badawcze mogą tu deponować wyłącznie pracownicy lub doktoranci Politechniki Warszawskiej, posiadający aktywne konto w serwisie BW PW. Więcej informacji w zakładce Repozytorium danych badawczych PW
- RepOD - Repozytorium Otwartych Danych – to repozytorium krajowe powstałe w ramach Platformy Otwartej Nauki. Umożliwia deponowanie, tzw. małych danych. Korzystanie z serwisu jest bezpłatne.
- Zenodo – Projekt OpenAIRE, wpierający ideę otwartego dostępu i przepływu danych w Europie. Repozytorium zostało przygotowane z funduszy UE. Repozytorium spełnia zasady FAIR. Obowiązuje limit 50GB na jeden set danych.
Plan Zarządzania Danymi (DMP)
DMP (Data Management Plan) jest dokumentem wymaganym przy składaniu wniosków o granty w ramach programów Horyzont 2020 (jego następcy Horyzont Europa) oraz w konkursach Narodowego Centrum Nauki.
W planie należy opisać z jakich danych wnioskodawcy będą korzystali w trakcie swojej pracy:
- w jaki sposób dane zostaną wytworzone (np. czy zostaną samodzielnie wytworzone, czy zakupione, itp.)
- kto będzie miał do nich prawa
- czy będą udostępniane innym użytkownikom i na jakich zasadach
- gdzie będą przechowywane
- w jaki sposób zostaną opisane.
Zachęcamy do zapoznania się z zakładkami:
Oddział Informacji Naukowej i Analiz Bibliometrycznych prowadzi konsultacje dla pracowników PW w zakresie poprawności składanych Planów Zarządzania Danymi badawczymi. Zainteresowane osoby prosimy o kontakt mailowy:
- Magdalena Maciąg: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
- Monika Gajewska: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
Tworzenie DMP jest procesem złożonym, każdy plan jest inny, dlatego przy jego opracowywaniu przydatne mogą być darmowe narzędzia wspomagające tworzenie DMP:
- DMPTool (US) – zawiera przykłady DMP. Dzięki niemu można przygotować szablony DMP dostosowane do wymagań amerykańskich grantodawców
- DMPonline (UK) – narzędzie ułatwiające pracę z DMP, pozwalające na tworzenie szablonów
- DSW - Data Stewardship Wizard – narzędzie ułatwiające pracę z DMP, pozwalające na tworzenie szablonów
- The Data Curation Center – serwis brytyjskiej instytucji specjalizującej się w zarządzaniu danymi badawczymi. Udostępnia między innymi: gotowe plany zarządzania danymi, przewodniki, wytyczne, informacje na temat metadanych
DMP w programach NCN
Plan Zarządzania Danymi badawczymi (DMP) przygotowuje się na etapie składania wniosku o grant:
- dostępny jest wzór planu jaki należy złożyć
- szablon jest podzielony na 6 części - w każdej z nich znajduje się zestaw pytań. W poszczególnych polach można wpisać do 1000 znaków ze spacjami (oprócz punktu 2.1 - gdzie obowiązuje limit 2000 znaków)
- plan podlega eksperckiej ocenie merytorycznej na etapie oceny raportu końcowego. Ocena będzie polegać na porównaniu planu z wniosku z jego wykonaniem
DMP może podlegać zmianom w trakcie realizacji projektu:
- zalecane jest uaktualnianie Planu Zarządzania Danymi w trakcie trwania projektu
- nie ma potrzeby informowania NCN o zmianach w DMP
- w raporcie końcowym należy opisać stan faktyczny dotyczący danych w projekcie - na dzień zakończenia projektu. Może on być inny niż początkowo planowany
- DMP powinien być opracowany w j. angielskim (z wyłączeniem miniatur)
Szablon Narodowego Centrum Nauki składa się z następujących elementów:
1.1 Opis danych oraz pozyskiwanie lub ponowne wykorzystanie dostępnych danych
W tej części należy odpowiedzieć na następujące pytania:
- w jaki sposób będą wytwarzane nowe dane (czy będziemy je: pozyskiwać, wytwarzać, czy może wykorzystamy dane już istniejące).
- w jaki sposób dane będą kontrolowane i dokumentowane
- jak będzie wyglądać organizacja plików i zarządzanie ich różnymi wersjami
sliders_set_2slider_zobacz-przykladZobacz przykład
The reaction of hydrodechlorination of 1,2-dichloroethane (1,2-DCE) will be carried out at atmospheric pressure, in a glass flow reactor equipped with a fritted disk to place a catalyst charge. Prior to reaction, the catalyst will be reduced in flowing hydrogen (30 cm3/min), ramping the temperature from 20 to 600 °C (at ∼15 °C/min) and kept at 600 °C for 1 h. All reactions will be followed by gas chromatography (HP 5890 series II with FID 5% Fluorcol/Carbopack B column (10 ft) from Supelco). The results of GC analysis will be elaborated using HP ChemStation (software).
XRD studies of Ni–Ru/SiO2 catalysts at various stages of their biography (after calcination, after reduction, and after hydrodechlorination) are also planned to furnished useful information. XRD experiments will be performed on a standard Siemens D5000 diffractometer using Ni-filtered CuKα radiation. Those experiments are planned to do in an external laboratory. The data set will consist of xml files and description of the methodology (if the versioning happens during the research, all versions will be available in the set).
1.2 Jakie dane (tj. rodzaje, formaty, objętości) będą pozyskiwane lub wytwarzane w projekcie
W tej części należy odpowiedzieć na następujące pytania dotyczące planowanego formatu i objętości danych:
- jaki to będzie rodzaj danych (np. dokumenty, arkusze kalkulacyjne, pliki audio, filmy, bazy danych, kod źródłowy)
- jaki format i objętość będą miały dane (format plików może być dowolny, najważniejsze, by wybierać taki format, który zapewnia powszechny dostęp i otwartość. Należy w pierwszej kolejności rozważyć formaty otwarte i standardowe)
- czy i w jaki sposób dane będą kodowane na potrzeby przechowywania.
sliders_set_3slider_zobacz-przyklad-2Zobacz przykład
Results from ChemStation will be exported into XML files. The data set will have up to 10 GB size. The data does not require additional encoding. XRD analysis will be shown on pictures and graphs in jpg format.
2. Dokumentacja i jakość danych
Należy określić:
- rodzaj metadanych mających ułatwić użytkownikom ich odnalezienie
- Czy możliwe jest ich komputerowe odczytanie?
- Jakie międzynarodowe standardy lub schematy (tj. Dublin Core, DDI) posłużą do organizacji metadanych?
sliders_set_4slider_zobacz-przyklad-1Zobacz przykład 1
Data and their associated metadata will be deposed in a public repository, Zenodo. The data will be stored with a "readme" file and clear folder structure and filename descriptions. Metadata are retrievable by their identifier using a standardized communication protocol. The repository is registered in the Directory of Open Access Repositories (OpenDOAR). Zenodo registers DOIs (via DataCite) for all deposited records. In Zenodo, metadata meets one of the broadest cross-domain standards available - DataCite's Metadata Schema. The following additional article level fields are supported: journal title/volume/issue/pages, conference title/acronym/dates/place/website, book publisher/place/ISBN/title/pages, alternate persistent identifiers. Results from ChemStation will be exported into XML files - which is a machine readable format. Results of XRD analysis will not have a machine readable format because of its specificity (jpg format).slider_zobacz-przyklad-2-2Zobacz przykład 2
The data will be stored in Dryad repository. The data will be stored with "readme" file and clear folder structure and filename descriptions. The description of the "read me" files will be prepared in a consistent and descriptive manner following the repository rules. Dryad welcomes the submission of data in multiple formats to enable various reuse scenarios. Default metadata entry form is based on fields from the metadata schema of the DOI issuing agency, DataCite. Recommended minimum content for metadata in this repository is: title of the dataset, institution name, address, email information for the principal investigator (or the person responsible for collecting the data), associate or co-investigators, contact person for questions, date of data collection (can be a single date, or a range), information about geographic location of data collection, keywords used to describe the data topic, language information, information about funding sources that supported the collection of the data. Results will be exported into XML file - which is a machine readable format. Results of XRD analysis will be uploaded in (jpg format).
3. Przechowywanie i tworzenie kopii zapasowych podczas badań
Należy określić:
- w jaki sposób będą tworzone kopie zapasowe danych
- gdzie i jak dane będą przechowywane i kto będzie miał do nich dostęp
- w jaki sposób będzie zapewniona ochrona i bezpieczeństwo danych wrażliwych w czasie trwania projektu
- czy do ponownego użycia danych jest konieczna inna, dodatkowa dokumentacja (np. wszelkie informacje o procedurach itp.)
- czy i w jaki sposób będą tworzone kopie zapasowe? Należy wskazać jak często będą robione, przez kogo, na jakich nośnikach i gdzie będą przechowywane
sliders_set_5slider_zobacz-przyklad-3Zobacz przykład
Only researchers involved in survey will have access to the collected data. Access to the software will be protected with login data. File access privileges are defined on a per user basis for data files, methods, sequences, and results. The data will be stored on well-protected laptops (with up-to-date firewalls and virus/trojan protection) and servers (university servers). Loss of data will be prevented by making regular backups (each month). The backups will be stored in the secure faculty and/or institute storage that is in place for this specific purpose, to minimize the risk of unauthorized access.
4.1 Zagadnienia związane z przetwarzaniem danych osobowych
Należy określić:
- czy miało miejsce przetwarzanie danych osobowych
- w jaki sposób zostanie zapewniona zgodność z przepisami dotyczącymi danych osobowych oraz ich ochrony
sliders_set_6slider_zobacz-przyklad-4Zobacz przykład
The survey does not assume using any of the personal data.
4.2 Wymogi prawne, kodeksy postępowania
Należy określić:
- kto będzie właścicielem danych
- jakie zostaną zastosowane licencje
- czy będą ograniczenia ponownego wykorzystania danych
- czy przed udostępnieniem danych konieczne będzie uzyskanie odpowiedniego zezwolenia w zakresie praw autorskich
sliders_set_7slider_zobacz-przyklad-1-2Zobacz przykład 1
XRD studies of Ni–Ru/SiO2 catalysts are planned to do in the external laboratory. All necessary agreements (including copyright transfer) will be signed to ensure legal rights to use the data in this project. The data set will be opened to all users under the Creative Commons Attribution 4.0 International (CC-BY-4.0) license. More information about the licensee can be found on the European Commission webpage. Specifically, the research data will validate the results presented in the published scientific paper.slider_zobacz-przyklad-2-3Zobacz przykład 2
The survey team will have all rights to the data. All necessary agreements will be signed before depositing the data in repository. The data will be released to the public domain. All files submitted to Dryad must abide by the terms of the Creative Commons Zero (CC0 1.0).
5.1 Udostępnianie i długotrwałe przechowywanie danych
Kiedy i w jaki sposób będą udostępniane dane z projektu:
- czy istnieją ewentualne ograniczenia i zakazy dotyczące udostępniania danych
- czy istnieją jakieś ograniczenia i przeszkody uniemożliwiające ich pełne lub częściowe udostępnienie (np. od strony wydawcy artykułu)
- czy udostępnianie danych wymaga zgody uczestników badania?
sliders_set_8slider_zobacz-przyklad-5Zobacz przykład
The data will be available at the same time as the paper will be published. We do not assume any limitations and obstacles preventing full or partial data disclosure. Sharing the data will not inquire any additional consent of the project participants.
5.2 Selekcja danych:
Należy określić:
- jaka będzie procedura selekcji przeznaczonych do utrwalenia danych
- z jakiego repozytorium zamierzamy skorzystać oraz czy przestrzega ono zasad FAIR Dataa
sliders_set_9slider_zobacz-przyklad-1-3Zobacz przykład 1
The data that will be deposited will be selected in such a way that other scientists can repeat the survey. They will support and illustrate all information from the journal article that will be published. Data and their associated metadata will be deposited in a public repository, Zenodo Repository. This repository meets all FAIR requirements.slider_zobacz-przyklad-2-4Zobacz przykład 2
The data and their associated metadata will be deposited in Dryad repository. All datasets in Dryad are indexed by the Clarivate Data Citation Index, Scopus, and Google Dataset Search. Each dataset is given a unique Digital Object Identifier or DOI. This repository meets all FAIR requirements. Dryad has a team of curators who check every submission to ensure the validity of files and metadata. After deposing the data in Dryad, the bibliographic description of the data will also be deposited in Institutional Repository (with a link to the Dryad repository and the data's DOI number). The deposited data will be selected in such a way that other scientists can repeat or fully understand the survey.
5.3 Oprogramowanie potrzebne do odczytania danych
Należy określić:
- czy potencjalni użytkownicy będą potrzebować określonych narzędzi, aby uzyskać do nich dostęp i (ponownie) je wykorzystać
sliders_set_10slider_zobacz-przyklad-6Zobacz przykład
During the survey, open data formats are planned to be used (xml or jpg). Users will do not need any specific software to read the data.
5.4 Unikalne identyfikatory (np. DOI)
Należy określić:
- w jaki sposób zagwarantują Państwo stosowanie unikalnego i trwale przypisanego identyfikatora (takiego jak cyfrowy identyfikator dokumentu elektronicznego (DOI)) dla każdego zbioru danych?
sliders_set_11slider_zobacz-przyklad-1-4Zobacz przykład 1
The data will be deposited in Zendodo Repository. To every upload in Zenodo is assigned a Digital Object Identifier (DOI).slider_zobacz-przyklad-2-5Zobacz przykład 2
The data will be deposited in Institutional Repository. This repository does not assign DOI to data sets. However, in the metadata scheme used there, there is a field for it. To meet all FAIR requirements, the DOI costs will be covered from the project budget. The DOI will be filled in in the repository during uploading the datasets and metadata.
6.1 Zadania związane z zarządzaniem danymi
Należy określić:
- kto będzie odpowiadał za zarządzanie danymi (tj. kto będzie ich opiekunem)
sliders_set_12slider_zobacz-przyklad-1-5Zobacz przykład 1
The Project Manager will take over the main responsibilities related to the data management process. The Institute does not provide additional staff to support research data management throughout the duration of the project. The main tasks of the project manager in this area will include: taking care of data quality, creating data processing procedures in the laboratory, naming files, creating backups and their appropriate storage, long-term data archiving in the repository and taking care of this data after the end of the project (adding new versions). The Project Manager will have an additional person to help: Assistant Project Manager. He will also be involved in deposing data and sharing of the project results. He will be responsible for periodically checking if the backups are made on an ongoing basis and properly stored. In addition, the Project Manager is obliged to transfer the data to the other members of the project when any of the team members leaves the team. Both the Project Manager and the Assistant will be responsible for checking that the DMP is being followed.slider_zobacz-przyklad-2-6Zobacz przykład 2
The person responsible for the data management process is the supervisor of the whole project, the same person will be responsible for DPM implementation, updating, and verification. An additional member of the staff will also be assigned to make backups and data corrections during the project. The main tasks will include: taking care of data quality, creating data processing procedures in the laboratory, creating backups and their appropriate storage, long-term data archiving in the repository, and taking care of this data after the end of the project (adding new versions).
6.2 Jakie zasoby zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR
Należy określić:
- jakie koszty będą związane z zapewnieniem standardów FAIR w projekcie oraz w jaki sposób zostaną opłacone
sliders_set_13slider_zobacz-przyklad-1-6Zobacz przykład 1
The data will be deposited in a free repository. If necessary, devices for data backup will be purchased (2 external 4TB drives. The cost of one drive is PLN 420).slider_zobacz-przyklad-2-7Zobacz przykład 2
The main costs for ensuring FAIR principles in the project are for the deposited data in Dryad Repository. Dryad charges excess storage fees for data totaling over 50GB. For data packages in excess of 50GB, submitters will be charged $50 for each additional 10GB, or part thereof. (Submissions between 50 and 60GB = $50, between 60 and 70GB = $100, and so on).
Oddział Informacji Naukowej i Analiz Bibliometrycznych prowadzi konsultacje dla pracowników PW w zakresie poprawności składanych Planów Zarządzania Danymi badawczymi. Zainteresowane osoby prosimy o kontakt mailowy:
- Magdalena Maciąg: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
- Monika Gajewska: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
Zobacz także:
DMP w programie HORYZONT
Pierwszą wersję DMP należy złożyć po zatwierdzeniu projektu i rozpoczęciu finansowania (w ciągu pierwszych 6 miesięcy od rozpoczęcia projektu):
- dostępny jest wzór planu jaki należy złożyć - szablon jest zestawem pytań, na które trzeba odpowiedzieć
- DMP należy aktualizować na bieżąco - w przypadku pojawienia się istotnych zmian (np. decyzji o złożeniu patentu, potrzeby utajnienia badań itp.)
- koszty związane z otwartym dostępem do danych badawczych w ramach programu „Horyzont 2020” kwalifikują się do zwrotu w trakcie trwania projektu na warunkach określonych w umowie o grant H2020, w szczególności w art. 6 i art. 6.2.D.3
- plan powinien być napisany w j. angielskim
DMP powinien obejmować następujące elementy, w których należy uwzględnić odpowiedzi na konkretne pytania:
Data Summary
- jaki jest cel gromadzenia / generowania danych
- jakie typy i formaty danych będziemy generować / gromadzić
- jakie jest pochodzenie danych (czy sami je wytworzymy, czy też posłużymy się już istniejącymi)
- kto będzie miał prawa do danych – czy konieczne jest zawarcie umów regulujących zakres wykorzystania i rozpowszechniania danych
- jaki jest oczekiwany rozmiar danych
- jaka będzie metodologia pozyskiwania danych
- czy dane będą wytworzone raz, czy będą wytwarzane w sposób ciągły
- czy będzie konieczność wersjonowania danych
sliders_set_14slider_zobacz-przyklad-7Zobacz przykład
An online survey system will be used to collect data from the respondents. The data will be interpreted and used for writing a scientific paper. The survey will be conducted by using the LimeSurvey tool. LimeSurvey is a free software. It will be downloaded and installed on the University server to ensure the data safety. Access to the software will be protected with login data. Only researchers involved in the survey will have access to the collected data. The survey will be conducted anonymously. We do not assume collecting any personal data which need to be protected. The researchers will have all legal rights to the survey output. The data will be stored on the University server in the Lime Survey software until the end of the survey. When the survey has been completed, all data will be transformed into the csv. (comma-delimited file). All questions from the questionnaire will be transferred into the text file (.odt). The survey methodology will be written and saved in text format. The data set will consist of those three files. The data set will have up to 50 GB. As the data dimensions are relatively low, no new specialist processing or storage will be required.
FAIR data (findable, accessible, interoperable and re-usable)
- w jakim zakresie dane będą spełniać zasady FAIR (będą łatwe do odnalezienia, dostępne dla innych, interoperacyjne, możliwe do ponownego wykorzystania)
- za pomocą jakiego formatu opisu metadanych data sety zostaną opisane
- czy zostanie im przypisany unikalny identyfikator, np. DOI
- czy dane będą umieszczone w ogólnodostępnym repozytorium / serwisie oraz zostaną udostępnione innym użytkownikom i na jakiej licencji
- czy odczytanie danych będzie wymagało dodatkowego oprogramowania (w jaki sposób i z wykorzystaniem których narzędzi będzie można je odczytać)
- jak długo dane będą dostępne w wybranym repozytorium
- czy wydawcy czasopisma, w którym zostaną opisane wyniki badań wymagają umieszczenia danych badawczych przy artykule
- więcej na temat zasad FAIR znajdziesz w zakładce Udostępnianie danych badawczych
sliders_set_15slider_zobacz-przyklad-8
Zobacz przykład
The data and their associated metadata will be deposed in a public repository Zenodo. This repository meets all FAIR requirements. (Meta)data are assigned a globally unique and persistent identifier. A DOI is issued to every published record on Zenodo. Zenodo's metadata is compliant with DataCite's Metadata Schema minimum and recommended terms, with a few additional enrichments. Metadata of each record is indexed and searchable directly in Zenodo's search engine immediately after publishing. Metadata of each record is sent to DataCite servers during DOI registration and indexed there. Metadata for individual records as well as record collections are harvestable using the OAI-PMH protocol by the record identifier and the collection name. Metadata is also retrievable through the public REST API. Data and metadata will be retained for the lifetime of the repository. This is currently the lifetime of the host laboratory CERN, which currently has an experimental program defined for the next 20 years at least. Metadata are stored in high-availability database servers at CERN, which are separate from the data itself. Metadata use a formal, accessible, shared, and broadly applicable language for knowledge representation. The data set will open to all users under the Creative Commons Attribution 4.0 International (CC-BY-4.0) license. More information about the licence can be found on the the European Commission webpage.
Sharing of the data will follow the principle "as open as possible, as closed as necessary". Specifically, the research data will validate the results presented in a published scientific paper. The data will be available at the same time as the paper is published.
Allocation of resources
- jakie są koszty związane ze spełnieniem standardu FAIR
- jakie będą koszty związane z przechowywaniem i udostępnieniem danych (czy dane będą udostępniane w płatnym serwisie i jaki będzie koszt)
- kto będzie odpowiedzialny za zarządzanie danymi w projekcie
sliders_set_16slider_zobacz-przyklad-9Zobacz przykład
In Zenodo, the content may be uploaded free of charge. The person responsible for managing the data and creating metadata compatible with the standard used in Zenodo Repository is the supervisor of the whole project, namely, Prof. Marcin Sosnowski.
Data security
- jakie zasady będą obowiązywały w zakresie zapewnienia bezpieczeństwa danych, w tym odzyskiwania danych (w przypadku ich utracenia)
- jeżeli w trakcie projektu będą gromadzone dane wrażliwe, w jaki sposób zostaną one zabezpieczone
- czy dane będą wymagały dodatkowego przetworzenia, aby zapewnić ich anonimowość
- czy repozytorium / miejsce przechowywania danych spełnia podstawowe zasady bezpieczeństwa
sliders_set_17slider_zobacz-przyklad-10Zobacz przykład
Regarding the secure storage of the data, the project will use an architecture based on cloud services to store the data. The used services provide the functionalities needed to address secure storage and data security. The questionnaire will be available to respondents for 3 months. Each week, it will be sent to another respondents group. Each week, a copy of the data will be created, transformed into csv. and then put into the cloud. In case of unusual situation or losing data, the .csv file can be uploaded to the LimeSurvey. Access to the LimeSurvey tool will also be protected with login data (username and password). Only researchers will have access to this tool.
Ethical aspects
- czy istnieją kwestie etyczne lub prawne, które mogą mieć wpływ na udostępnianie danych
- jeżeli wykorzystywano kwestionariusze osobowe, czy uwzględniono zgodę respondentów na udostępnianie i długoterminowe przechowywanie danych
sliders_set_18slider_zobacz-przyklad-11Zobacz przykład
The questionnaire used in this survey will contain an obligatory clause with the information about the purpose of the survey. All respondents will be informed that their answers will be interpreted and used for gathering more knowledge about social behavior. Respondents will also be ensured that their personal data will not be collected or shared.
Other issues
- czy korzystasz z konkretnych procedur zarządzania danymi (np. wytycznych krajowych, projektowych, uczelnianych); jeżeli tak, należy podać z jakich
Oddział Informacji Naukowej i Analiz Bibliometrycznych prowadzi konsultacje dla pracowników PW w zakresie poprawności składanych Planów Zarządzania Danymi badawczymi. Zainteresowane osoby prosimy o kontakt mailowy:
- Magdalena Maciąg: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
- Monika Gajewska: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
Zobacz także: