Projekt News

Was macht eigentlich EMIL? – Status Quo des Entscheidungsmoduls

Illustration Künstliche IntelligenzIn den letzten Monaten haben wir uns intensiv mit der Entwicklung unseres KI-basierten Entscheidungsmoduls EMIL beschäftigt. Die Entwicklung basiert auf dem neuesten Stand der Technik von Fully Connected Neural Networks, zu Deutsch etwa „vollständig verbundene neuronale Netzwerke“. Ziel des zu entwickelnden KI-Modells ist es, Empfehlungen zu individuellen Lernpfaden und Lernangeboten auf der Grundlage der Bedürfnisse von Nutzer:innen zu geben.

Zu diesem Zweck wurden verschiedene Empfehlungssysteme systematisch untersucht, um ihre Eignung für das Projekt zu ermitteln. Das Hauptaugenmerk lag dabei auf den zu erwartenden Daten, die entweder direkt aus dem Lernmanagementsystem (LMS) Illias oder indirekt über eingebettete Plug-ins wie H5P bezogen werden. Die so erhaltenen Daten werden in einem Learning Record Stores (LRS) gespeichert. Die damit erstellten Nutzerprofile liefern der KI weitere Test- und Trainingsdaten. Nach dem Vergleich von elf Empfehlungssystemen wurde ein hybrides Modell entwickelt, das aus einem kollaborativen, einem wissensbasierten und einem inhaltsbasierten Empfehlungssystem besteht.

Die Umsetzung des Empfehlungssystems erfolgt über die Nutzung neuronaler Netze, in denen alle Neuronen miteinander verbunden sind. Als Input dienen dabei sämtliche Interaktionsdaten der Nutzer:innen mit den Micro Learning Einheiten (MLEs) im LMS. Der Output des Netzwerkes besteht aus einer Vorhersage der Interaktionswahrscheinlichkeiten der Nutzer:innen mit anderen MLEs im LMS. Dieses Verhalten beschreibt die Bedürfnisse der Nutzenden mit den Lerninhalten, ähnlich den Empfehlungen von YouTube oder der „Two-Tower”-Strategie von Google.

Bekannte Probleme von KIs, wie das Problem der Datenknappheit und das Cold-Start Problem, werden im Rahmen des Projekts bearbeitet und durch die Untersuchung verschiedener Strategien gelöst:

  1. Das Problem der Datenknappheit ergibt sich aus einer zu geringen Anzahl von Trainingsdaten. Um dies zu umgehen, werden zwei Strategien erprobt:
    • Online-Batch Training: Das neuronale Netz wird während des Betriebs trainiert und evaluiert.
    • GAN (Generative Adversarial Network): Das neuronale Netz wird vor der Ausführung des Modells mit künstlich generierten Daten ergänzt und trainiert, um so die Genauigkeit der Gewichte einzelner Neuronen zu verbessern. Die künstlichen Daten basieren dabei auf wenigen, realen Daten von Nutzer:innen.
  2. Das Cold-Start Problem besteht darin, dass das System keine Aussagen über Nutzer:innen treffen kann, über die es noch nicht genügend Informationen gesammelt hat. Um dies zu umgehen, liefern Daten einer Initiativumfrage dem Modell erste Informationen über die/den Nutzenden, bevor das System die Vorhersagen trifft.