Am 27. März veranstaltete der Fachbereich Informatik der Universität Hamburg eine lebendige Ausstellung, auf der zehn Gruppen von Studierenden ihre akademischen Leistungen in Form von Bachelor- und Masterarbeiten sowie Ergebnisse aus verschiedenen Projekten und Praktika präsentierten.
Diese Veranstaltung bot den Studierenden eine Plattform, um ihre innovativen Arbeiten einem breiteren Publikum zu präsentieren, darunter Kommilitonen, Fakultätsmitglieder, potenzielle Studierende und Vertreter aus der Unternehmenswelt.
Zu den Höhepunkten gehörte das CRAMT-Projekt, ein Ergebnis der Zusammenarbeit innerhalb des Digital and Data Literacy in Teaching Lab (DDLitLab). Das von den Studenten Christian Schuler, Tramy Thi Tran, Deepesha Saurty, Anran Wang und Raman Ahmad geleitete und von Dr. Seid Muhie Yiman, House of Computing & Data Science (HCDS), betreute Projekt wurde für seinen neuartigen Ansatz bei der Erstellung eines Textkorpus ausgezeichnet, der Sprachen verbindet, die in der Forschung bisher nicht miteinander verbunden waren.
Diese innovative Arbeit sicherte sich den zweiten Platz auf der EXPO und unterstreicht das Engagement der Universität für die Förderung der interdisziplinären Forschung und der digitalen Kompetenz.
Mehr über CRAMT
Das Projekt MTACR (Multilingual Text As Corpus Repository for Machine Translation of Low-Resource Languages) begann mit dem Ziel, die Herausforderungen zu bewältigen, mit denen ressourcenarme Sprachen konfrontiert sind, d. h. Sprachen mit begrenzter Präsenz im Internet. Ziel des Projekts war es, Sprachdaten zu sammeln und zu pflegen, um die Verarbeitung natürlicher Sprache zu unterstützen, insbesondere die Entwicklung robuster Übersetzungssysteme für ressourcenarme Sprachen wie Mauritisches Kreolisch, den kurdischen Dialekt Kobani, Vietnamesisch und Chinesisch.
Trotz einer Förderung von 10.000 € durch das DDLitLab der Universität Hamburg erwies sich die Sammlung von Daten für die Zielsprachen als schwierig. Dies führte zur Gründung eines ergänzenden Projekts, CRAMT (Cross-Lingual Resource Aggregation of Low-Resource Machine Translation and Metadata). Dieses Tool erleichtert die Erstellung mehrsprachiger, abgestimmter Textdaten für extrem ressourcenarme Sprachen und verbessert die Qualität der Datensätze durch ein Annotationsschema, das einsprachige Muttersprachler einbezieht.
Die Bemühungen des Projektteams gipfelten in einer Präsentation von CRAMT auf der EXPO-2024 an der Universität Hamburg, wo es mit dem zweiten Platz und einem Preisgeld von 200 € ausgezeichnet wurde. Diese Anerkennung unterstreicht die Bedeutung der Beiträge des Projekts in diesem Bereich.
Wer CRAMT weiter erforschen möchte, findet das GitHub-Repository unter: https://github.com/christianschuler8989/CRAMT.
Darüber hinaus können Informationen über das ursprüngliche MTACR-Projekt auf der digitalen Plattform des DDLitLab an der Universität Hamburg gefunden werden: https://www.isa.uni-hamburg.de/en/ddlitlab/data-literacy-studierendenprojekte/third-round/textcorpus.html."