T13 – Effi­ci­ent meta­da­ta setup for auto­ma­ted data quali­ty assessments

Tag, Uhrzeit, Dauer

Donners­tag­vor­mit­tag, 9–13 Uhr, 4h

Ange­bo­te­ne Sprache

Englisch /Deutsch (kann mit Teil­neh­me­rIn­nen fest­ge­legt werden)

Kurzbeschreibung

Aussa­ge­kräf­te Meta­da­ten sind eine hand­lungs­lei­ten­de Grund­la­ge für die Bewer­tung der Daten­qua­li­tät. Dennoch liegen solche Meta­da­ten oft nur rudi­men­tär vor, etwa in Data Dictio­n­a­ries. Für Daten­ma­na­ge­rIn­nen, Infor­ma­ti­ke­rIn­nen und Wissen­schaft­le­rIn­nen bestehen oft Unklar­hei­ten, worauf geach­tet werden soll­te und welche Optio­nen auto­ma­ti­sier­ter Assess­ments sich in Abhän­gig­keit sich von den vorlie­gen­den Meta­da­ten eröff­nen. Komple­xi­tät ergibt sich dadurch, dass Meta­da­ten viel­fäl­ti­ge Aufga­ben in Assess­ments über­neh­men können. Zum einen betrifft dies Regeln, welche die Erwar­tun­gen an Studi­en­da­ten umfas­sen (z.B. Daten­for­ma­te, Plau­si­bi­li­täts­gren­zen, Vertei­lun­gen, Asso­zia­tio­nen), weiter­hin beschrei­ben­de Elemen­te, um die Lesbar­keit von Berich­ten zu erhö­hen und zum Drit­ten Attri­bu­te für die Berichts­ge­stal­tung. Weiter­hin können sich die Meta­da­ten auf unter­schied­li­che Objek­te bezie­hen, eine Studie insge­samt, Studi­en­seg­men­te (z. B. Unter­su­chun­gen), sowie Daten­ele­men­ten (z.B. einzel­ne Unter­su­chungs­va­ria­blen und Kombi­na­tio­nen aus diesen). 

Inhal­te

1. Meta­da­ten­at­tri­bu­te und deren Bedeutung

2. Hinwei­se zur sinn­vol­len Fest­le­gung und Forma­tie­rung von den Metadaten

3. Bezug der Meta­da­ten­at­tri­bu­te zu Datenqualitätsindikatoren

4. Möglich­kei­ten (auto­ma­ti­sier­ter) Daten­qua­li­täts­as­sess­ments bei Vorlie­gen geeig­ne­ter Metadaten

Fach­li­che Voraussetzungen 

Einfa­che Grund­kennt­nis­se mit R und RStu­dio. Die Anfor­de­run­gen an Program­mier­kennt­nis­se sind nied­rig. Meta­da­ten werden in Excel bearbeitet.

Tech­ni­sche Voraus­set­zun­gen

Laptop mit MS-Excel, vorzugs­wei­se mit R und R‑Studio sowie instal­lier­tem data­quieR Paket (>v2.0).

R und R‑Studio soll­ten auf einem neuen Stand sein.

Organisator*in

Cars­ten Oliver Schmidt

Insti­tu­ti­on

Univer­si­täts­me­di­zin Greifswald

Kontakt

carsten.schmidt [at] uni-greifswald.de

Zusätzliche*r Referent*in

Stephan Struck­mann (Univer­si­täts­me­di­zin Greifs­wald, stephan.struckmann [at] uni-greifswald.de)

Joany Mari­no (Univer­si­täts­me­di­zin Greifs­wald, joany.marino [at] uni-greifswald.de)

Elisa Kasbohm (Univer­si­täts­me­di­zin Greifs­wald, elisa.kasbohm [at] uni-greifswald.de)

Univer­si­täts­me­di­zin Greifs­wald, Greifswald