Technische Umsetzung

Das Projekt PANDIA entwickelt eine KI-basierte automatisierte Überprüfung und Auswertung der Datennutzungsbedingungen von interaktiven Assistenzsystemen. Dabei werden verschiedene Techniken eingesetzt, die wir Ihnen im Folgenden genauer beschreiben wollen:

Big Data

Damit PANDIA funktioniert, bedarf es einer Menge Daten – in diesem Fall einer Menge Datennutzungsbedingungen. Um diese großen Datenmengen aufzuspüren verwenden wir einen Webcrawler. Dieser sucht nach vordefinierten Kriterien die Datennutzungsbedingungen im Netz auf und speichert sie. Anschließend lassen wir die Texte von einem lernenden Algorithmus analysieren. Das wird möglich durch Verfahren aus der Computerlinguistik:

Machine Learning & Natural Language Processing

Wir entwickeln eine Kombination aus Machine Learning und Natural-Language-Processing-Verfahren, um den Inhalt von zehntausenden gecrawlten Datennutzungsbedingungen maschinell auszuwerten. Durch die stetig steigende Anzahl der gecrawlten Datennutzungsbedingungen wird die Datenqualität und der damit zugrundeliegende intelligente Allgorithmus optimiert. Abschließend werden die analysierten Datennutzungsbedingungen in unserem Dashboard für Sie ausgegeben:

Pandipedia

Die analysierten Daten werden für Sie als Nutzer verständlich aufbereitet und auf unserem Dashboard, der Pandipedia, für Sie zur Verfügung gestellt. Hierbei werden Sie auf visuelle und leicht verständliche Zusammenfassungen zurückgreifen können und erhalten somit einen verbraucherfreundlichen Überblick.