Welche Daten werden geliefert
Der erweiterte Lieferdatensatz nach Gesetz zur Zusammenführung von Krebsregisterdaten gilt ab dem Diagnosejahr 2020, die erste Datenlieferung zum 31.12.2022 betrifft somit aufgrund der Verkürzung der Lieferfrist die Diagnosejahre 2020 und 2021. In den kommenden Jahren werden Ergänzungen zu den bereits übermittelten Fällen bis einschl. Diagnosejahr 2019 (z.B. Sterbefälle, Nachmeldungen, Änderungen der Diagnose, Diagnosesicherung) übermittelt, in welcher Form dies geschieht, wird noch geklärt.
Diagnosen: Übermittelt werden alle Diagnosen aus dem ICD-10-Kapitel: Neubildungen (C00-D48), soweit sie im jeweiligen Register systematisch erfasst werden. Übermittelt wird ein “best-of” Datensatz. Ein Fall, der im Register separat angelegt wurde, wird als solcher an das ZfKD übermittelt werden, unabhängig von der epidemiologischen Zählweise. Es werden Daten für Fälle übermittelt bei denen der Wohnort des Patienten zum Zeitpunkt der Inzidenz in Deutschland lag. Übermittelt werden Fälle von Patienten mit Wohnsitz in Deutschland.
Integration der epi Daten
Inhalt der epi Daten
· Alle Fälle mit Diagnosejahr <= 2019
· Angaben zu Diagnose, Therapie nach Therapieart (J/N) und ggf. Tod
· Merkmalsliste:
Mögliche Varianten der Übermittlung
siehe auch Übermittlung der epi Daten zum RKI
Variante 1: Lieferung nach altem Epi-Format
Vorteile
Für bisherige Epi-Register ohne Zusatzaufwand machbar
Nachteile
Für GKR-Länder neu zu implementierendes Exportformat
Zwei separate Datenbestände beim ZfKD (Verknüpfung am ZfKD müsste über Personen-ID ermöglicht werden, da sonst Fehler bei der Inzidenzberechnung entstehen)
Variante 2: Lieferung nach neuem ZfKD-XML-Schema
Alle Daten (auch Diagnosen bis 2019) werden nach neuem Schema übermittelt (vor Diagnosejahr 2020 nur Angaben zur Person und Primärdiagnose und nur soweit nach altem Gesetz zulässig. Auf Therapieangaben nach früherem Format wird verzichtet (z.B. OP ja/nein).
Vorteile
Nur ein Exportformat
Ein Gesamtdatenbestand beim ZfKD, allerdings vor 2020 viele Merkmale fehlend.
Nachteile
Frühere Therapieangaben mit Ausprägungen J/N würden im XML-Schema nicht mehr übermittelt. Aus Sicht des ZfKD verschmerzbar, tendenziell sogar sinnvoll: klinische Auswertungen sollten erst ab Diagnosejahr 2020 erfolgen, da Datenlage bzgl. Therapien für Vorjahre in vielen Bundesländern nicht vergleichbar ist und bundesweite Auswertungen so in die Irre führen können
Einige Ausprägungen bzw. Konfigurationen im neuen Lieferdatensatz entsprechen nicht genau den Epi-Daten (z.B. Diagnosesicherung DCO, Vitalstatus, DCN, evtl. TNM). Hier müssten Vereinbarungen getroffen werden
Variante 3: Lieferung entweder nach altem Epi-Format oder neuem XML-Schema
Vorteile
Kein Zusatzaufwand für alle Register, GKR-Länder dürften über detaillierte Therapieangaben auch für Altfälle verfügen und damit das neue Schema gut füllen können.
Nachteile
Erstellung eines Konverters EPI -> ZfKD-XML notwendig.
Therapieangaben liegen im ZfKD in unterschiedlicher Qualität vor (Reduzierung auf J/N notwendig?).
Datenbestände in unterschiedlichen Varianten beim ZfKD
Personen-ID
jeder Teildatensatz zu einer Person (Element https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2097195/Patient#%C3%9Cberblick ) erhält in jeder Lieferung eine pro Register eindeutige Kennung
die Harmonisierung zu bundesweit eindeutigen Personen-ID im Gesamtdatensatz nimmt das ZfKD vor
die Personen-ID werden in jeder jährlichen Lieferung von den Registern neu generiert und lassen keinen Bezug auf die Person zu über das Lieferjahr hinaus
Wohnort / Behandlungsort
Zuordnung Wohnort
Bisher wird der Wohnort einer Person zugeordnet, nach Umzug und anschließender neuer Tumorerkrankung würden allerdings Fehler entstehen
Festlegung: Wohnort zum Zeitpunkt der Primärdiagnose wird auf Tumorebene erfasst.
Eine wünschenswerte Erfassung und korrekte Zuordnung von mehreren Tumoren zur gleichen Person, wenn diese (nach Umzug der Person) in verschiedenen Bundesländern als inzidente Fälle aufgetreten sind, kann mit der neuen Datenübermittlung (ohne Kontrollnummern) nicht gelingen. Es erscheint noch offen, ob dies langfristig über den RÜD gewährleistet werden kann.
ICD Versionen sind optional
umgesetzt im Schema: https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2228479
entgegen der Festlegung im oBDS 3.0.0 sind durchgängig alle Elemente zur Version von ICD Kodierungen optional
Hintergrund ist, dass die Übermittlung von Kodierungen ohne Versionsangabe ermöglicht werden soll
die Elementtypen zu den jeweiligen Versionsangaben (ICD, Morphologie, Topographie) enthalten die Ausprägung
Unbekannt
nicht
Datumsbasierte Angaben
Angaben mit Datum
die zulässige Genauigkeit der Datumsangaben wird über Attribute gesteuert, welche aus oBDS übernommen sind
alle Angaben mit Datum werden grundsätzlich unterteilt in
unterliegt datenschutzrechtlichen Beschränkungen
Bsp: Datum der Diagnose https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2097263/Diagnose+Typ#%C3%9Cberblick-Felder
Attribut Datumsgenauigkeit = T / M / V geschätzt https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2359331
kann frei übermittelt werden
Angaben mit einer Anzahl Tagen zwischen Ereignissen
auch wenn Datumsangaben überwiegend geschätzt/gerundet übermittelt werden müssen, soll der Abstand zwischen Ereignissen tagesgenau verfügbar sein
Eine Dauer in Tagen soll nur berechnet werden, wenn die beiden relevanten Datumsangaben im Register tagesgenau vorliegen
Wenn das zweite Ereignis (Ende der Therapie, Tod) noch nicht eingetreten ist, wird keine Dauer berechnet (also auch keine Dauer bis Ende des Follow-ups bei dann noch lebenden Personen)
eine genaue Rekonstruktion einzelner geschützter Angaben (z.B. Sterbedatum) ist somit ausgeschlossen, da zu keiner tagesgenauen Datumsdifferenz ein angrenzendes präzises Datum übermittelt wird
zur Realisierung aller möglichen Ausprägungen für Dauer eines Ereignisses und Abstand zwischen Ereignissen ist der
JNU_Typ
aus oBDS übernommen und kann hier wie folgt interpretiert werden https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2818349J:
Ja
, Gültiger Wert ist enthalten: Anzahl Tage > 0N:
Nein
, nicht anwendbar; etwa wenn Ereignis noch nicht beendet (z.B. Therapie dauert an)U:
Unbekannt
Konventionen zu fehlenden Werten
der Umgang mit fehlenden Werten ist offenbar nicht durchgängig gelöst im oBDS, und somit auch nicht im ZfKD-Lieferdatensatz
generell soll erreicht werden, dass fehlende / unbekannte Werte kodiert werde können, allerdings ist der Unterschied zwischen “kein Wert verfügbar” und “Wert verfügbar, aber unbekannt” nicht durchgängig abbildbar
dieser Kontextgewinn könnte theoretisch im ZfKD-Lieferdatensatz durch Schemaänderungen erreicht werden, dann weichen die Schemakonzepte aber immer weiter voneinander ab
höhere Priorität hat aber, dass keine Blockaden entstehen durch einzelne fehlende Werte, bei denen Angaben verpflichtend sind
Pflichtfelder
sind in erster Näherung von der meldebasierten Übermittlung im oBDS 2021 übernommen
inzwischen ist deutlich geworden, dass die fallbasierte Übermittlung mehr Freiheiten für die optionale Angabe von Werten erfordert
viele Pflichtfelder wurden so bereits zu optionalen Feldern
die Vermutung besteht, das Pflichtfelder bis auf die P1-Variablen aufgelöst werden sollten, um die Übermittlung der Elemente nicht zu blockieren
Wertebereiche
Wertebereiche sind auf zwei Arten im Schema kodiert:
erlaubte Ausprägungen sind direkt im Element aufgeführt
via regex-patterns
Verweise auf externe Kataloge (z.B. DIMDI) sind nicht verarbeitet
in einigen Elementen sind “fallback optionen” eingebaut, um alternative, weniger strukturierte Übermittlungen zu ermöglichen (Bsp. Substanz/Protokolle bei https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2654511 )
Priorisierung von Variablen (Vorschlag, gilt zunächst nur für die erste Datenlieferung)
P1 (muss geliefert werden) - bisheriger epidemiologischer Datensatz ohne Therapie (Geschlecht, Diagnosejahr, Diagnose, TNM, Grading, Sterbedatum etc.)
P2 (soll ab Diagnosejahr 2020 soweit möglich geliefert werden)- klinische Angaben zur Therapie (Strahlentherapie, systemische Therapie, OP inkl. OPS-Kode), Beginn der Therapie etc.
P3 (soll ab Diagnosejahr 2020 soweit möglich geliefert werden, etwas geringere Priorität als P2: - klinische Daten zu Folgeereignissen, Todesursachen
Lieferregister
im Schema sind alle Lieferregister gemäß der Systematik bei den epi Lieferungen aufgeführt (01 - 16)
zusätzlich aufgenommen wurde die gemeinsam liefernde Institution Berlin + Brandenburg als item 17
Konflikte oBDS 2014 / 2021
derzeit besteht eine Übergangsphase zwischen oBDS 2014 und oBDS 2021 (Implementierung noch nicht abgeschlossen)
Annahme: zum Zeitpunkt der Inbetriebnahme des ZfKD-Lieferdatensatzes ist gemäß Planung oBDS 2021 verpflichtend für den Austausch der Länder
das Schema berücksichtigt daher ausschließlich den neuen Standard oBDS 2021 (Stand Ende 2022-Q1)
analog dem oBDS sind im Schema für Applikationsarten beim Zielgebiet (https://plattform65c.atlassian.net/wiki/spaces/P6/pages/2621565) sowohl die Version 2014 als auch 2021 definiert
Für die Übermittlung der Art der systemischen Therapie müssen Überleitungen auf das neue Schema vorgenommen werden (Grundsätze siehe: ‘Vereinbarungen’)