Hintergrund
das RKI schlägt vor, die epidemiologischen Daten in das xml Schema zu integrieren https://plattform65c.atlassian.net/wiki/spaces/P6/pages/7143545/Allgemeine+Vereinbarungen#Integration-der-epi-Daten
im Folgenden ist das dazu notwendige Mapping der epidemiologischen auf die klinischen Variablen dargelegt
Mapping
die für die Lieferung der epi Daten getroffene Vereinbarung sieht vor, dass 55 Variablen an das RKI übermittelt werden
ein Teil dieses Variablensets wird nicht verarbeitet, und ist im vorliegenden Mapping nicht weiter berücksichtigt
ebenfalls angenommen wird, dass die Therapieangaben der epi Daten nicht überführt werden
die Übersicht mit Bewertung zum Mapping ist in folgender Liste dargelegt:
Simulation anhand eines vereinfachten samples
gegeben ist eine fiktive Lieferung von epi Daten an das RKI, mit 2 Patienten
Patient 1: möglichst viele Angaben sind bekannt, alle verwendeten Informationen sollen im xml Schema eindeutig kodiert werden können
Patient 2: möglichst wenige Angaben sind bekannt, xml Schema soll dennoch valide sein (Pflichtfelder müssen angegeben sein)
xls Liste der Lieferung hier:
im nächsten Schritt werden diese Angaben in das xml Schema (Version 6) überführt
hier die entstehende xml dieser Lieferung:
Schlussfolgerungen
die entstehende xml Datei ist valide gegen das xml Schema (die übermittelten Werte müssen natürlich erlaubt sein)
alle laut Mapping Liste aktiv verwendeten Variablen lassen sich also grundsätzlich im Schema transportieren
derzeit verlangt das Schema folgende Pflichtangaben
Datum / Ursprungsregister der Lieferdatei
Patient_ID, Tumor_ID
Patienten-Stammdaten
Geschlecht
GebDatum
Vitalstatus (kann aus den epi Angaben hinreichend konstruiert werden, sofern Follow-up-Datum verfügbar)
Tumor
Primärdiagnose
Datum
Inzidenzort (fehlende Werte wurden in den epi Daten auf das liefernde Bundesland imputiert. Ein “00000“ wäre im Schema als fehlender Wert zu interpretieren)
ICD Code Primärtumor (Version optional)
Seitenlokalisation (U = Unbekannt)
DCN (hier wäre eine Vereinbarung zu treffen)
Vorschlag: da die Variable im alten Gesetz noch nicht erwähnt, können alle Fälle bis Diagnosejahr 2019 auf ‘kein DCN’ gesetzt werden
Anzahl_Tage_Diagnose_Tod (kann mit N kodiert werden als “unzutreffend”)
eine Unterscheidung von epi. und klin. Datenbestandteilen im Schema ist nicht notwendig