Auch innerhalb der Sozialen Arbeit und Sozialwirtschaft wird vermehrt über KI-Lösungen diskutiert. Ein Aspekt, der mir dabei aber zu kurz kommt: Für gute KI-Lösungen werden sinnvolle Daten als Grundlage benötigt. Daher sollte der erste Fokus auf einem systematischen Datenmanagement in sozialen Organisationen liegen. Dieser Blog-Beitrag ist ein ‚Zwischenruf‘ in der aktuellen Debatte.

Der Beitrag ist der erste Teil einer dreiteiligen Reihe rund um Daten in der Sozialen Arbeit und Sozialwirtschaft:

Vor der KI braucht es ein systematisches Datenmanagement!

Datenkompetenz in der Sozialen Arbeit und Sozialwirtschaft

Daten-Framework für die Soziale Arbeit und Sozialwirtschaft

KI-Modelle benötigen Daten

Alle entwickelten KI-Lösungen haben eins gemein: Sie basieren auf (bereits bestehenden) Daten. Diese werden als Trainingsdaten bezeichnet, d.h. sie werden genutzt, um Modelle zu trainieren, damit diese dann auf zukünftige Daten und Fragen angewendet werden können.

Machen wir es mal ganz konkret an einem Beispiel: Möchte man eine KI-Lösung entwickeln, um das geeignetste Angebot für potenzielle Klient*innen zu finden, muss hierfür zunächst ein Modell trainiert werden. Diesen Trainingsdaten liegen bisherige Verläufe und Effekte von Nutzer*innen verschiedener Angebote zugrunde. Anhand dieser Daten lernt das Modell beispielsweise, welches Angebot für bestimmte Personen besonders hilfreich war. Hier zeigen sich bereits zwei Herausforderungen: Solche Daten müssten zum einen strukturiert vorliegen, zum anderen müssen sie aber auch den Anforderungen an den Datenschutz entsprechen, sodass keine Rückführung auf einzelne Personen möglich ist.

Systematisches Datenmanagement ausbauen

Aus diesem Grund plädiere ich dafür, dass sich soziale Organisationen verstärkt mit dem Thema des systematischen Datenmanagements und Datennutzung auseinandersetzen. Dies ist aus meiner Sicht der erste Schritt, um dann auch sinnvolle KI-Lösungen entwickeln zu können. Hierbei sollten vor allem auch fachliche Daten über Effekte und die Wirkung der eigenen Arbeit in den Blick genommen werden.

Doch was bedeutet dies konkret? Zuerst sollte innerhalb einer Organisation identifiziert werden, welche Daten überhaupt erfasst und gespeichert werden. Danach kann, z. B. im Rahmen einer Datenstrategie, festgelegt werden, wie zukünftig mit diesen Daten umgegangen wird. Wichtig ist hierbei, dass klare Rollen definiert werden und es unter anderem sogenannte Data Stewards gibt, also Personen, die sich um die regelmäßige Pflege von bestimmten Datenbeständen kümmern.

Neben diesen Aspekten gilt es zu überlegen, ob eine zentrale Datenplattform aufgebaut werden kann, also die Daten an einem zentralen Ort gespeichert und von dort für Auswertungen zur Verfügung gestellt werden können. Man spricht in diesem Zusammenhang auch von einer Datenarchitektur.

Mit Pilotprojekten starten

Um die Organisation nicht zu überfordern, erscheint es sinnvoll, dass die oben genannten Schritte für ein konkretes Angebot oder eine konkrete Abteilung in einer Organisation durchgeführt werden. Im Rahmen eines solchen Pilotprojektes können verschiedene Tools zunächst ausprobiert und bei einer erfolgreichen Umsetzung auf weitere Organisationsteile skalieret werden.

Übergreifende Datenökosysteme

Vielleicht werden Sie sich gefragt haben, wie dies einzelne Organisationen leisten sollen. Die Frage ist berechtigt und eine einfache Antwort habe ich aktuell auch noch nicht. Ich denke aber, dass zukünftig noch stärker ein übergreifendes Datenökosystem aufgebaut werden muss. Darunter versteht man die benötige Infrastruktur, um ein systematisches Datenmanagement zu betreiben und Anwendungen zur Datenanalyse – oder dann auch für KI-Lösungen – zur Verfügung zu stellen.

Der Aufbau kann aber gerade kleine Organisationen in der Sozialen Arbeit und Sozialwirtschaft vor Herausforderungen stellen. Zugleich denke ich aber, dass die benötigte Kompetenz und Infrastruktur nicht komplett von extern eingekauft werden sollte. Idealerweise sollte hier eine Mischung vorliegen, also entsprechende Kompetenz und Infrastruktur sollte zumindest auch zum Teil in der Organisation vorhanden sein.

Wie dies konkret aussehen kann, wird sich in den nächsten Jahren zeigen. Erfreulich ist, dass es erste Projekte in Wohlfahrtsverbänden gibt, die sich mit dem Thema der systematischen Datennutzung beschäftigen. So ist beim DRK das Data Science Hub gestartet, der AWO Bundesverband hat sich auf eine Datenreise gemacht und auch der Caritas Bundesverband beschäftigt sich mit der verstärkten Nutzung von Daten.

Braucht es eine Datengenossenschaft für die Sozialwirtschaft?

Ich denke, dass Bundes- und Landesverbände hier auch entsprechende Ressourcen und Kompetenzen vorhalten können, auf denen dann die Einrichtungen und Organisationen vor Ort zurückgreifen können. Langfristig stellt sich für mich aber die Frage, ob – zusätzlich dazu – nicht auch andere Lösungen sinnvoll sind. Interessant finde ich in diesem Zusammenhang, dass die Genossenschaftsbanken sich zusammengetan und ein eigene „Smart Data Company“ gegründet haben.

Vielleicht benötigen wir so etwas auch für die Soziale Arbeit und die Sozialwirtschaft: Verschiedenen Träger und Organisationen tun sich zusammen und gründen eine eigene Organisation, die Datenökosysteme betreibt und tiefergehende Kompetenzen im Bereich Datenmanagement und Datenanalyse zur Verfügung stellt. Eine solche Organisation könnte in einer Genossenschaft organisiert werden – eine Datengenossenschaft für die Sozialwirtschaft. Ein solches Modell hätte auch den Vorteil, dass gemeinsame Standards erarbeitet werden und daher Daten systematischer über Organisationsgrenzen hinaus erhoben und genutzt werden können.

Open Data in der Sozialen Arbeit?

Einen letzten Aspekt möchte ich noch zum Ende des Beitrags einbringen. Sinnvoll erscheint es mir, nicht nur Daten innerhalb der eigenen Organisation besser verfügbar zu machen, sondern auch zu überlegen, ob diese nicht als OpenData zur Verfügung gestellt werden können.

OpenData oder „offene Daten sind Daten, die von jedermann frei benutzt, weiterverwendet und geteilt werden können – die einzige Einschränkung betrifft die Verpflichtung zur Nennung des Urhebers.“

Definition aus dem Open Data Handbook

Dies bedeutet, dass bestimmte Datensätze, die innerhalb von Organisationen der Sozialen Arbeit erfasst werden, frei zur Verfügung gestellt werden. Wichtig ist hierbei, dass die Daten in einem maschinenlesbaren Format vorliegen. Dies kann ein Verzeichnis von Beratungsstellen sein, aber auch Daten über Themen und Gründe, weswegen Beratungsstellen aufgesucht werden. Auf dem Portal GovData findet man Informationen, wie die Bereitstellung offener Daten erfolgen kann. Natürlich gilt auch hier, dass die Anforderungen an den Datenschutz beachtet werden müssen. Gerade innerhalb der Arbeitsfelder der Sozialen Arbeit werden oft sensible und besonders schützenswerte Daten verarbeitet. Dennoch denke ich, dass es auch Daten gibt, die als offene Daten zur Verfügung gestellt werden können. Im Hinblick auf das Thema KI ergibt sich hier der Vorteil, dass diese Daten auch für Trainingszwecke von KI-Modellen herangezogen und kostenfrei genutzt werden können.

Fazit

Mit diesem Beitrag wollte ich das Bewusstsein für ein systematisches Datenmanagement in der Sozialen Arbeit und Sozialwirtschaft schärfen. Dies erscheint mir gerade im Hinblick auf die Diskussion über mögliche KI-Lösungen in den Arbeitsfeldern für angebracht. Nur wenn gute Daten zum trainieren von KI-Modellen vorliegen, können auch gute KI-Lösungen entwickelt werden. Diese Lösungen können dann die Fachkräfte vor Ort unterstützen oder auch einzelne Aufgaben übernehmen, damit mehr Zeit für die Arbeit von Mensch zu Mensch bleibt.

Ich freue mich daher, wenn sich Organisationen auf den Weg zu einem systematischen Datenmanagement machen und darüber hinaus auch ein Austausch zu diesem Thema stattfindet. Denn eine gemeinsame Entwicklung, z. B. von Standards, erscheint auch innerhalb der Sozialen Arbeit und Sozialwirtschaft sinnvoll.

Gedanken und Anmerkungen zu diesem Beitrag können gerne in die Kommentare gepostet werden. Ich freue mich über den Austausch und die Diskussion!