Technologie przetwarzania tekstu polskiego zorientowane na potrzeby bezpieczeństwa publicznego
- Projekty zakończone
Kierownik projektu:
- Prof. dr hab. Zygmunt Vetulani – Uniwersytet im. Adama Mickiewicza w Poznaniu.
Kierownicy podprojektów:
- Prof. dr hab. inż. Andrzej Dziech (AGH, KT);
- Prof. dr hab. Wiesław Lubaszewski (AGH, KI);
- Prof. dr hab. Zygmunt Vetulani (UAM, ZLISI).
Instytucje realizujące projekt:
- Uniwersytet im. Adama Mickiewicza w Poznaniu, Wydział Matematyki i Informatyki, Zakład Lingwistyki Informatycznej i Sztucznej Inteligencji (ZLISI);
- Akademia Górniczo-Hutnicza w Krakowie, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Katedra Informatyki (KI);
- Katedra Telekomunikacji (KT).
Cel projektu:
Celem projektu jest rozwój technologii języka naturalnego i technologii informacji na potrzeby systemów informatycznych, w których automatyczne przetwarzanie języka polskiego służy podniesieniu poziomu bezpieczeństwa publicznego.
Opis projektu:
Do realizacji wybrane zostały 3 pilotowe aplikacje, za które odpowiedzialne są odpowiednio ww. instytucje współrealizujące projekt. Aplikacje te (Tematy 1, 2 i 3) wymagają uzupełnienia istniejących luk technologicznych w zakresie narzędzi i cyfrowych zasobów językowych (Temat 4), co jest niezbędnym warunkiem powodzenia wszelkich dalszych przedsięwzięć w zakresie zastosowań technologii języka czy to w zakresie bezpieczeństwa, czy w innych dziedzinach.
- Temat 1 – Komunikacja człowieka z systemem informatycznym w warunkach kryzysowych przy użyciu języka naturalnego (system POLINT-112) (UAM);
- Temat 2 – Inteligentna wyszukiwarka akt sądowych na podstawie doświadczeń z zakresu przetwarzania kopiowanego tekstu i jego archiwizacji (AGH, KT);
- Temat 3 – System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (AGH, KI);
- Temat 4 – Budowa i rozbudowa niezbędnych elektronicznych narzędzi informatyczno-lingwistycznych (AGH; UAM).
Przewidywane wymierne efekty projektu:
Prototyp systemu wspomagania systemów komunikacji (typu „telefon 112”) przetwarzającego informację przekazywaną w języku naturalnym (SMS, w dalszej perspektywie głos), ze szczególnym uwzględnieniem zarządzania kryzysowego w warunkach imprez masowych (typu Euro 2012) (Temat 1).
Prototyp wyszukiwarki akt sądowych szukającej obiektów tekstowych i graficznych na podstawie opisu sytuacyjnego albo z użyciem słów kluczowych (Temat 2).
System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (Temat 3).
Generyczne zasoby inżynierii języka polskiego (Temat 4): słowniki maszynowe, korpusy tematyczne, ontologie typu WordNet (PolNet) i ontologie specjalistyczne, gramatyki i parsery, algorytmy przetwarzania tekstu (wyszukiwanie, klasyfikacja, algorytmy „watermarkingu”).
Projekt finansowany przez Narodowe Centrum Badań i Rozwoju