Die Universitäten Köln und Bochum arbeiten gemeinsam an der Bereitstellung einer KI-Infrastruktur. Open Source-KI.nrw soll es Lehrenden, Forschenden und Studierenden in Zukunft erlauben, offene KI-Modelle zu nutzen und mit eigenen Inhalten zu erweitern. Ganz nebenbei werden sie unabhängig von kommerziellen Anbietern und können ihre vertraulichen Daten besser schützen.
Von Robert Hahn
Künstliche Intelligenz – KI – ist in aller Munde. Es ist die neue Technologie, die unser Leben und Arbeiten bestimmen wird. Das Land NRW hat deswegen eine entsprechende Landesstrategie entworfen und Technikprojekte für Zugänge zu generativer KI an Hochschulen im Bundesland initiiert. Teil dieser Strategie ist das neue Projekt des ITCC (IT Center University of Cologne) unter Leitung von Professor Stefan Wesner mit der Uni Bochum.
In einem neuen gemeinsamen Projekt entsteht Open Source-KI.nrw. Dieses Projekt wird mit 600.000 Euro vom Land gefördert und ist gleichermaßen Forschungs- und Infrastrukturprojekt. Während die Universität zu Köln Fragen zur Betriebsumgebung und Integration der Hardware in ihrem neuen High-Performance-Computing (HPC) Rechner RAMSES adressiert, wird die Uni Bochum die nötige Software entwickeln.
Die Wissenschaftler*innen entwickeln einen Chatbot mit der Technik der sogenannten Retrieval-Augmented-Generation (RAG), der auf eigene Wissensbestände (zum Beispiel Dokumentsammlungen) zurückgreifen kann. Das kann für Studierende die Literatur aus einem Kurs sein oder ein Skript. Für Forschende soll die KI ein Instrument werden, große Datenmengen wissenschaftlicher Literatur zu durchsuchen.
Grundlage für den Chatbot sind sogenannte offene Sprachmodelle, die vom ITCC auf RAMSES betrieben werden. Die bestehenden Modelle sollen dann mit ausgewählten Daten noch einmal nachjustiert werden. »Die meisten Sprachmodelle sind erst einmal notorische Lügner«, erklärt Ingo Kleiber vom Prorektorat Lehre und Studium, wo er als Senior-Experte Digitale Bildung & Educational Technology das Projekt betreut. »Deswegen legen wir so einen großen Wert auf die Nutzung von eigenen Wissensbeständen.« Fragen der Datensicherheit und der Datenhoheit spielen bei der Nutzung Künstlicher Intelligenz für die Hochschulen eine entscheidende Rolle.
Ein weiteres wichtiges Motiv für den Aufbau einer eigenen KI sieht Kleiber in den eigenen Kompetenzen: »Man kann zu einem der großen Anbieter – Microsoft, OpenAI, Google – gehen und das einkaufen. Aber man hat dann weder Souveränität über die Daten noch Verständnis für die Technologie. Damit macht man sich bei einer Kern- und Zukunftstechnologie komplett abhängig davon, was diese Firmen tun.«
Langfristig sollen der KI-Chatbot und die Möglichkeit mit eigenen Wissensbeständigen zu arbeiten über Plug-ins für ILIAS und Moodle für Studierende und Forschende an den Unis Köln und Bochum zugänglich gemacht werden. Wenn alles funktioniert, kann das System dann auch in ganz NRW angewendet werden.