Forschungsorientierte Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen
Zur Analyse von Gefahrenmeldungen werden vorhandene unstrukturierte Lageinformationen in strukturierte Daten verwandelt und den Mitarbeitern über eine Suchfunktion zur Verfügung gestellt.
Herausforderung
Die Menge der zum Themenbereich “Cyber Security” verfügbaren Informationen wächst stetig. Es wird daher zunehmend anspruchsvoller, den Überblick zu behalten. Deshalb wünschte sich das BSI ein System, welches die Möglichkeiten der maschinengestützten Textanalyse nutzt, um seinen Mitarbeitern optimale Voraussetzungen bei der Informationsbeschaffung zu bieten.
Lösung
ontolux hat eine für den Kunden maßgeschneiderte Lösung geschaffen. Mit dieser werden zunächst vertrauenswürdige Quellen des World Wide Web nach den relevanten Informationen durchsucht. Hierbei kommt unser Crawler zum Einsatz. Verschiedene Quellenformate können in die Informationsbeschaffung einbezogen werden. Im nächsten Schritt findet eine semantische Anreicherung der Informationen statt, unter anderem auf Basis unseres NLP-Frameworks TXTWerk. Auf dieser Basis wird den Mitarbeitern des Bundesamts über eine intelligente Suche sowie Dashboards ermöglicht, individuelle Lageberichte zu erstellen, etwa zu Schadprogrammen, Datendiebstahl und anderen Bedrohungen. Darüber hinaus kann das System trainiert werden, um seiner Aufgabe immer besser gerecht zu werden.
Unser Kunde
Das Bundesamt für Sicherheit in der Informationstechnik (BSI) ist die deutsche Bundesbehörde für Fragen der IT-Sicherheit. Das BSI gestaltet die Informationssicherheit in der Digitalisierung durch Prävention, Detektion und Reaktion für Staat, Wirtschaft und Gesellschaft.
Kunde seit 2021
Bundesamt für Sicherheit in der Informationstechnik
Projekt
Forschungsorientierte Anwendung von NLP für die Auswertung (un)strukturierter Lageinformationen
Leistung
- Beratung
- Konzeption
- Umsetzung
Technologien
- NLP
- Machine Learning
- TXTWerk
- Haystack
- Elastic Stack
- Poolparty
- Scrapy
- Doccano