SheepShaver schrieb:
Wurde mehrfach angefordert, hier also ein paar Anwendungsgebiete allein in der Medizin, die Big Data erheblich vorangebracht hat:
Onkologie, virtuelles Screening, Predictive Analytics wie so trivial anmutuende Dinge wie Flu Trends etc.
Die Notwendigkeit für die Implementierung von Algorithmen, die den Anforderungen des Privacy-preserving Data-Mining gerecht werden, jagen die Kosten in die Höhe, wenn man überhaupt an die Daten ran kommt.
Danke für die Steilvorlage.
Onkologie ist ein gutes Stichwort. Was meinst Du was so in den Krebsregistern der verschiedenen Bundesländer so im Einsatz ist. Richtig eine multidimensionale Datenauswertung (OLAP Cubes und eine relationale Datenbank). Ich weiss das, weil ich dort gearbeitet habe wo eine der Softwarelösungen her kommt, die in den Epidemioloschen Krebsregistern wie z.B. Niedersachsen und auch beim Robert Koch Institut im Einsatz ist.
Krebserkrankungen sind in den meisten (ggf. schon in allen) Bundesländern meldepflichtig. Dabei werden aber keine direkten Patienteninformationen wie Name, etc. erfasst sondern nur die Krebsart (OPS-301 Code: Cxx wie z.B. "C50" = Brustkrebs), Region (Ortsbezug), Altersbereich (üblicherweise in 5 Jahresgruppen) und so weiter.
BigData ist dafür übrigens nicht nötig...das braucht man nur fürs Bullshit Bingo.
Es gibt verschiedene Varianten die Patientendaten vom interessanten Rest zu trennen, um damit Privacy-preserving Data-Mining zu erlauben. Das ist jetzt kein Hexenwerk.
Das eigentliche Problem im Gesundheitsbereich ist, dass durch die Länderhoheit/Selbstverwaltung ein großes Chaos bei den Daten besteht.
Die Kurzfassung:
Bestimmten Gruppen verwalten pro Bundesland Daten. Es gibt also keine bundesweit zuständige Stelle für alle Teilnehmer des Gesundheitswesens (Beispiele folgen). Es gibt darüber hinaus den Bruch zwischen Teilnehmern im Rahmen der Gesetzlichen Krankenversicherung und privat abrechnenden Teilnehmern. Abgesehen davon, das man keine Gesamtübersicht hat, fehlt also ggf. auch noch die Kontrollfunktion (behandelt mich ein Scharlatan?).
Beispiel Krankenhäuser:
Die Krankenkassen wissen im Zweifel nicht einmal in welchem Krankenhaus der Versicherte behandelt wurde, weil das Institutionskennzeichen (kurz "IK" - eine 9-stellige Ziffernfolge; Aufbau bei Krankenhäusern wie folgt: die Stellen 1-2 kennzeichnen bis auf den Sonderfall "2697..." die Art der Einrichtung; die Stellen 3-4 kennzeichnen das Bundesland oder die Region; 5-8 ohne Bezug; die 9. Stelle ist eine Prüfziffer), dass zur Abrechnung genutzt wird, teilweise standortübergreifend verwendet wird.
Geht man bis zur Ebene der Fachabteilungen wird es noch diffuser. Größere Häuser haben z. B. mehr als eine "Innere Medizin". In den Abrechnungsdaten gibt es die sogenannten Fachabteilungsschlüssel (4-stellige Ziffernfolge: "0100" = Innere Medizin ohne Angabe eines Schwerpunktes; "0103" Innere Medizin/Schwerpunkt Kardiologie; die Stellen 1-2 bilden eine Gruppe während die Stellen 3-4 den Schwerpunkt kennzeichnen; "0300" wäre die Kardiologie ohne Schwerpunkt, etc.).
Dann gibt es da die Qualitätsberichte der Krankenhäuser, die seit dem letzten Jahr endlich jährlich zu erstellen sind. Neben der zusätzlich zu IK eine 2-Stellige Ziffernfolge für den Standort. Das Prinzip dahinter haben die Qualitätsbeauftragen vielfach nach Jahren immer noch nicht kapiert und sorgt bei mir immer wieder für schlechte Laune.
Wie dem auch sei... in den Qualitätsberichten können die Krankenhäuser beliebige Fachabteilungsschlüssel verwenden und auch beliebig viele (1,...,n) für eine physikalische Fachabteilung im Krankenhaus.
Es gibt keine Auflage, dass dieser Fachabteilungsschlüssel dem aus den Abrechnungsdaten entsprechen muss. Daher ist es extrem schwer bzw. häufig unmöglich die Abrechnungsdaten eindeutig den Fachabteilungen eines Krankenhauses (also dem Qualitätsbericht) zuzuordnen.
Es wird derzeit dran gearbeitet hier verbindliche Regelungen zu treffen, aber da im Gesundheitssystem jeder im G-BA mitreden darf und 90% keine Ahnung haben oder eh nur verschleiern wollen was da so passiert, wird es vermutlich in den nächsten 5+ Jahren keine Lösung geben. Im Zweifel füllt man es "versehentlich" falsch aus (siehe externe Qualitätssicherungsaten des C-1 Teil der Strukturierten Qualitätsberichte der Krankenhäuser; Begründung "Der Mitarbeiter hat das erstmals ausgefüllt.").
Beispiel Pflege:
Die XML-Dateien zu den Pflegeheimen und Pflegediensten (die Pflegeberichte mit den umstrittenen Pflegenoten....jeder hat die Note 1,x sowie z.B. auch die Versorgungsinformationen) sind im Gegensatz zu den Krankenhaus Qualitätsberichten nicht zu bekommen. Man muss schon im Auftrag einer Krankenkasse tätig sein oder für die Organisation arbeiten die mit den Berichten direkt betraut ist, sonst bekommt man die nicht zu Gesicht.
Hat eine Einrichtung irgendwo die Note 2 erhalten wird sofort eine Klage angedroht und der Pflegebericht (hier gibt es auch eine jährliche Prüfung) wird aus dem Verkehr gezogen und solange bleibt der alte Bericht gültig.
Da werden dann z. B. bei einer Einrichtung mit 100 Plätzen 5 Pflegeheimbewohner befragt. Wie zufällig werden diese wohl ausgewählt? Ob sich einer der Prüfer wirklich auch mal die Zeit nimmt die Härtefälle zu prüfen wage ich anzuzweifeln.
Außerdem schaut sich der Prüfer an was da so an Angeboten zur Verfügung steht (Beschäftigungsprogramm, Essensplan, etc.).
Beispiel Ärzte:
Wieso gibt es eigentlich kein Bundesverzeichnis mit Ärzten? Na weil natürlich jede Landesärztekammer auf seinen eigenen Daten sitzt und es kein einheitliches Format gibt. Eine Freude für die Adressdatensammler und -verschacherer wie Stiftung Gesundheit, Arztdata, Schlütersche Marketing (Gelbe Seiten,...) und so weiter, die diese Daten verkaufen und mehr oder weniger gut pflegen.
Selbst die Krankenkassen müssen sich diese Daten dort wieder einkaufen. Das muss man sich mal reinziehen!!!
Die Krankenkassen müssen mit den Ärzten die Leistungen abrechnen und kaufen sich bei Adressredaktionen die Arztdaten ein. Ich habe die Daten verschiedener Anbieter gesehen und wie auch die Daten der Ärztekammer sind diese häufig veraltet (ein 80 Jähriger Arzt aus dem Verzeichnis einer Landesärztekammer dürfte genauso wenig aktiv sein, wie eine Zahnärztin (meine ehemalige) die vor 2,5 Jahren Ihre Praxis abgegeben hat sich aber noch in den Daten der Adressredaktionen findet die von sich behaupten innerhalb eines Jahres einmal alle Daten zu prüfen)
Allen gemein ist, das die Datenqualität zu einem großen Anteil mieserabel ist. Falsche Titel bei Ärzten ("Dr. XXX"), teils keine LANR und BSNR vorhanden (Lebenslange ArztID und Betriebsstättennummer), häufig kein Personenbezug sondern nur "Gemeinschaftspraxis XXX", falsche Schwerpunkte.
Diese Adressredaktionen gibt es natürlich auch bei den Pflegeheimen und Pflegediensten.
Bei Pflegeheimen und -diensten werden Angebote aufgeführt die nicht erbracht werden. Insbesondere bei Pflegediensten ist die Fluktuation extrem hoch (Schließung/Neugründung von kleinen Pflegediensten).
Aber wie in allen anderen Bereichen gibt es auch hier eigentlich eine zentrale Information nämlich das schon im Krankenhausabschnitt oben erwähnte Institutionskennzeichen (IK). Jeder Teilnehmer, der in der gesetzlichen Krankenversicherung unterwegs ist, hat eine solche Nummer für die Abrechnung (neben den schon erwähnten Teilnehmern am Gesundheitssystem sind dies auch Apotheken,...).
Die privat abrechnenden Ärzte und Krankenhäuser ohne Krankenkassenzulassung kommen allerdings ohne aus.
Es müsste vom Bund eigentlich eine zentrale Meldestelle für jeglichen Teilnehmer am Gesundheitssystem geben, der dann
eine Kennung (z.B. die schon verfügbare IK; bzw. LANR und BSNR) erhält (und bitte nur eine und keine Hand voll IKs...gibt es leider auch), so dass ein zentrales Register erstellt werden kann. Dann ist es natürlich mit der Selbstverwaltung in einem zentralen Bereich dahin und da traut sich kein Bundesgesundheitsminister ran. Es wäre aber nötig!
Hier muss dann auch eine zentrale Datenaktualisierung vorgenommen werden. Auch eine "Abmeldung" muss hier erfolgen, wenn der Betrieb eingestellt wird.
Ein Zugriff auf diese Informationen müsste jedem auf Anfrage möglich sein. Die Datenmenge ist im Grunde für diese Datenbasis überschaubar. Wir sprechen hier von rund 2100 Krankenhäusern, ein paar hunderttausend Ärzten, Pflegeeinrichtungen,... rundum eine problemlos zu verarbeitende Menge an Stammdaten selbst über mehrere Jahre sehe ich hier kein Problem.
Der Pflegeaufwand wäre da, aber statt das jedes Bundesland sein eigenes Süppchen kocht hatte man eine zentrale Stelle, was bei einem strengen relationalen Modell auch die Erfassung von "Schrott" vermeiden hilft (Lookup Tabellen für PLZ und Ortsnamen, Vorwahl, etc.).
Dies würde helfen den Sumpf im Gesundheitssystem auszutrocknen und wäre die Basis für mehr Transparenz, die die Krankenhäuser, Ärzte,... oder ihre Interessenverträter definitiv
nicht wünschen.
Da ist man von Patientendaten noch meilenweit entfernt, aber alleine das Kosteneinsparpotential wäre enorm (wie gesagt die verschiedenen Kassen kaufen sich bei den Adressredaktionen die Daten ein,...) und bezüglich der Datenqualität wäre eine Verbesserung möglich, wenngleich die Aktualisierung ein Problem darstellt, dass angegangen werden müsste.
Edit:
Ein aktuelles Problem das Ärzte scheinbar überhaupt nicht auf dem Schirm haben ist z.B. MS Office 365 und die "Cloud" Anbindung. Da werden dann mit Office Arztbriefe verfasst die auf Microsoft Servern gespeichert werden. Solche Daten gehören nicht in die Cloud. Microsoft garantiert zwar das man alles unternimmt das diese Daten auch sicher sind, aber je größer die Verbreitung desto mehr lohnt sich auch der Angriff auf einen Dienst. Wenn nun wirklich der Zugriff auf die Cloud gelingt, dann ist der Schaden um ein vielfaches höher als bei der bisherigen "Insellösung". Bezüglich absichtlicher Backdoors lasse ich mich nicht aus, das sollte nach den Enthüllungen der letzten Jahre eigentlich klar sein. Der Klassiker "Ich habe nichts zu verbergen" zählt nicht als Argument.