Zum Dossier 'Temu-Strategie'
KI-Forschungsprojekt soll Chatbots voranbringen
28.06.2021 Um KI effizienter einsetzen zu können, wird an der Universität Paderborn an Lösungen für mehrsprachige Datenquellen geforscht.
An einer entsprechenden Lösung arbeiten nun Wissenschaftler der Fachgruppe 'Data Science' am Institut für Informatik der Universität Paderborn in einem neuen Forschungsprojekt. Mithilfe von Wissensgraphen soll Endanwendern die Abfrage großer Mengen mehrsprachiger Textdaten ermöglicht werden. Damit soll der Einsatz von KI-gestützten Lösungen in Unternehmen effizienter werden, etwa bei Frage-Antwort-Systemen (Question Answering, kurz: QA) in Form von Chatbots oder Enterprise Search, also firmeninternen Suchmaschinen.
Das Projekt trägt den Titel 'Polylingual Hybrid Question Answering' (PORQUE). Es wird für die nächsten drei Jahre vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Förderprogramms 'Eurostars' mit insgesamt 1,2 Millionen Euro gefördert. Projektpartner aus der Industrie sind unter anderem die Semantic Web Company und der Softwareentwickler SiteFusion .
Neue Plattform vereint mehrsprachige Daten
"Unser Projekt zielt darauf ab, polylinguale, also mehrsprachige, konversationelle KI weiterzuentwickeln, um Nutzenden die Möglichkeit zu bieten, eine Vielzahl mehrsprachiger Datenquellen abzufragen", erklärt Prof. Dr. Axel-Cyrille Ngonga Ngomo , Leiter der Fachgruppe. Dadurch könnten Unternehmen weltweit verfügbare Daten besser nutzen. Der neue Ansatz kombiniert dabei automatische maschinelle Übersetzung und Wissensgraphen."Wissensgraphen bilden die Grundlage, ohne die viele KI-Anwendungen und -Assistenten heute nicht funktionieren würden: Sie stecken in Lösungen zum Auffinden von Informationen und QA-Systemen", erläutert Artem Revenko , Director Research, PoolParty Semantic Suite . So verbergen sich die Datensätze etwa hinter den Informationsblöcken, die Google bei Suchanfragen einblendet, noch bevor man eine Seite aufruft, oder werden bei Amazon zum Beantworten von Fragen an Alexa genutzt. "Neben der Schwierigkeit, dass ein Mensch eine Frage auf viele verschiedene Arten stellen kann, mangelt es an Wissensgraphen in anderen Sprachen als Englisch, da knapp die Hälfte aller Informationen im Web nicht auf Englisch verfügbar sind", erklärt Informatiker Ngonga Ngomo.
Die neue Plattform zur mehrsprachigen Beantwortung von Fragen soll eine Hybrid-Lösung werden, erläutert der Wissenschaftler. Sie soll die Übersetzung und sprachübergreifende Anreicherung von Wissensgraphen, gekoppelt mit Informationen aus Texten aus dem Web umfassen. "Sobald ein Wissensgraph mit mehrsprachigem Inhalt angereichert ist, wollen wir ihn als Hintergrundwissen für die Erstellung und Qualitätsverbesserung von polylingualen QA-Systemen verwenden." Dies sei insbesondere für den europäischen Raum relevant, da es hier Daten in einer Vielzahl von Sprachen gibt.
"Kommerzielle Anwendungen, die ein mehrsprachiges QA ermöglichen, hängen bislang stark von Menschen ab, die einen Teil der Qualitätssicherung der Daten übernehmen, was zeitaufwendig und kostenintensiv ist", sagt Ngonga Ngomo. "Indem wir die maschinelle Übersetzung als automatisiertes System mit spezifischen Sprachverarbeitungstechniken kombinieren, ermöglichen wir es Endanwendenden, mehrsprachige Fragen zu stellen und automatisiert präzise Antworten zu erhalten."