Slovník
Dáta – zaznamenané výstupy merania alebo zisťovania, zhromaždené v rámci vedeckého výskumu (často vo forme čísel, znakov, symbolov). Odrážajú stav reality v konkrétnom čase.
Surové dáta (raw data) – nespracované dáta (tak, ako vyšli z meracieho prístroja/experimentu).
Spracovanie dát – zhromažďovanie, triedenie, čistenie, štatistické vyhodnocovanie a ďalšie činnosti, ktorými sa zvyšuje kvalita dát, alebo vďaka ktorým možno z dát získať zmysluplné informácie.
Databáza – množina dát organizovaná pomocou logickej schémy, uložená v počítačovom systéme tak, aby z dát bolo možné získavať informácie (napríklad prostredníctvom dopytovacieho jazyka).
Otvorené dáta – dáta voľne, bezplatne, online dostupné na použitie pre ľubovoľných záujemcov, spravidla pod verejnou licenciou (napríklad Creative Commons). Viac o otvorených dátach napr. Open Data handbook (http://opendatahandbook.org/guide/en/what-is-open-data/).
Citlivé dáta – dáta, ktorých strata, zneužitie, pozmenenie alebo neautorizovaný prístup k nim môže viesť k narušeniu súkromia osôb, bezpečnosti, obchodného tajomstva alebo ku škodám na životnom prostredí a biodiverzite.
Veľké dáta (big data) – dáta veľkého objemu, rôznorodé a rýchlo pribúdajúce (viac o nich napr. na stránke: https://www.ecommercebridge.sk/big-data-umela-inteligencia/). Často sa využívajú pri strojovom učení, napr. aplikácia Pl@ntNet má dataset pre strojové učenie určovania rastlinných druhov (viac tu: https://plantnet.org/en/2021/03/30/a-plntnet-dataset-for-machine-learning-researchers/), alebo projekt Monitoring sucha porovnáva reálne dáta od reportérov sucha s vlastným počítačovým modelom.
Metadáta – dáta, ktoré vypovedajú o dátach, okolnostiach ich vzniku a využívania (napr. kto ich vytvoril, v akej inštitúcii, kde a kedy boli zozbierané, akou metódou, aký materiál použil, kto má povolenie s dátami pracovať a pod.).
Integrácia dát – kombinovanie údajov z rôznych zdrojov do jedného celku, aby bolo možné získať zmysluplné informácie, alebo jednotný pohľad.
Interoperabilita – schopnosť systémov (napr. dátových repozitárov) vzájomne si rozumieť a spolupracovať.
Informácie – dáta vložené do kontextu (súvislostí), nadobúdajúce zmysel, takže je možné ich využiť, napríklad pomocou nich odpovedať na výskumné otázky.