• Erweiterung AutoNLP

    AutoNLP ist eine Webanwendung zur Automatisierung des Trainings von NLP-Modellen für typische Aufgaben wie Named Entity Recognition oder Textklassifikation. Die Anwendung wurde von Timo Neuhaus im Rahmen seiner Masterarbeit End-to-End-Automatisierung des Machine Learning Workflows für Natural Language Processing entwickelt.

    Zur Erweiterung der Anwendung es eine Reihe von möglichen Themen.

    Abschluss- und Projektarbeiten zu AutoNLP

    • End-to-End-Automatisierung des Machine Learning Workflows für Natural Language Processing (Timo Neuhaus)
      In dieser Masterarbeit wurde AutoNLP entwickelt und der Tasktyp Token Classification implementiert. Damit lässt sich das Training von Entitätserkennung automatisieren.
    • Implementierung des Tasktyps Textklassifikation im Paket TagFlip-AutoNLP (Kevin Fitkau)
      In dieser Bachelorarbeit wurde der Tasktyp Textklassifikation ergänzt.
    • Integration der Textannotation in AutoNLP
      Für die Verwaltung von Trainingsdaten soll die Annotation von Texten in AutoNLP integriert werden.
    • Testautomation
      Aktuell ist nur ein kleiner Teil der Anwendung durch Testfälle abgedeckt. Im Rahmen einer Projektarbeit könnten verschiedene Arten von Testfällen (Unit-Tests, End-to-End-Tests) umgesetzt und automatisiert werden.
    mehr ...
  • Cluster für KI und Data Science

    Die Fachhochschule Südwestfalen baut aktuell einen Cluster für Lehre in den Bereichen KI und Data Science auf. Dabei sind eine Reihe von Aufgaben für Abschlussarbeiten zu vergeben.

    Aufgabenstellungen für Abschlussarbeiten

    • Monitoring des Clusters
      Der Cluster wird im Lehrbetrieb genutzt. Daher ist ein Monitoring erforderlich, das die Auslastung und die Verfügbarkeit des Clusters überwacht und bei Bedarf Alarm schlägt.

    • Benutzerverwaltung
      Die Anmeldung an den Cluster erfolgt über eine Keycloak-Instanz, die ein Single-Sign-On mit der Campus-Kennung der FH Südwestfalen ermöglicht. Innerhalb von Kubernetes werden aktuell alle Benutzer auf eine Unix-Userid abgebildet, da die Benutzer innerhalb der Nodes des Clusters nicht bekannt sind. Mithilfe von FreeIPA soll eine Benutzerverwaltung aufgebaut werden, die die Benutzer innerhalb des Clusters verwaltet und eine Synchronisation mit der Keycloak-Instanz ermöglicht.

    • Dashboard für den Cluster
      Die Benutzer des Clusters sollen über ein Dashboard einen Überblick über die Auslastung des Clusters erhalten. Dazu sollen die Daten aus dem Monitoring-System und aus Kubernetes zusammengeführt werden. Das Dashboard soll als Web-Anwendung realisiert werden.

    • MLFlow
      Die Benutzer des Clusters sollen ihre Experimente über MLFlow verwalten können. Dazu soll eine Instanz von MLFlow auf dem Cluster installiert werden.

    Weitere mögliche Themen finden finden Sie auch im GitHub Projekt zum Aufbau des Clusters.

    mehr ...
  • Konferenz-Management für Seminare

    In verschiedenen Studiengängen unseres Fachbereichs bieten wir ein Konferenzseminar an, das eine wissenschaftliche Konferenz simuliert. Für “echte” Konferenzen gibt es etablierte Tools wie Easy Chair, die die Verwaltung von Beiträgen, Gutachten und die Organisation der Konferenz unterstützen. Für unser Seminar sind diese Tools nur bedingt geeignet, da sie nicht auf die speziellen Anforderungen eines Seminars zugeschnitten sind und etwa nicht vorsehen, dass eine Person gleichzeitig Autor und Gutachter sein kann.

    Ziel dieser Arbeit ist es, ein Konferenz-Management-Tool in Form einer Webanwendung zu entwickeln, das die speziellen Anforderungen unseres Seminars erfüllt. Dazu soll insbesondere untersucht werden, wie die Anwendung mit den Systemen der Fachhochschule Südwestfalen (Moodle, Single Sign On) integriert werden kann.

    mehr ...