Technologie przetwarzania tekstu polskiego zorientowane na potrzeby bezpieczeństwa publicznego

Kierownik projektu:

  • Prof. dr hab. Zygmunt Vetulani – Uniwersytet im. Adama Mickiewicza w Poznaniu.

Kierownicy podprojektów:

  • Prof. dr hab. inż. Andrzej Dziech (AGH, KT);
  • Prof. dr hab. Wiesław Lubaszewski (AGH, KI);
  • Prof. dr hab. Zygmunt Vetulani (UAM, ZLISI).

Instytucje realizujące projekt:

  • Uniwersytet im. Adama Mickiewicza w Poznaniu, Wydział Matematyki i Informatyki, Zakład Lingwistyki Informatycznej i Sztucznej Inteligencji (ZLISI);
  • Akademia Górniczo-Hutnicza w Krakowie, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Katedra Informatyki (KI);
  • Katedra Telekomunikacji (KT).

Cel projektu:

Celem projektu jest technologii języka naturalnego i technologii informacji na potrzeby systemów informatycznych, w których automatyczne przetwarzanie języka polskiego służy podniesieniu poziomu bezpieczeństwa publicznego.

Opis projektu:

Do realizacji wybrane zostały 3 pilotowe aplikacje, za które odpowiedzialne są odpowiednio ww. instytucje współrealizujące projekt. Aplikacje te (Tematy 1, 2 i 3) wymagają uzupełnienia istniejących luk technologicznych w zakresie narzędzi i cyfrowych zasobów językowych (Temat 4), co jest niezbędnym warunkiem powodzenia wszelkich dalszych przedsięwzięć w zakresie zastosowań technologii języka czy to w zakresie bezpieczeństwa, czy w innych dziedzinach.

  • Temat 1 – Komunikacja człowieka z systemem informatycznym w warunkach kryzysowych przy użyciu języka naturalnego (system POLINT-112) (UAM);
  • Temat 2 – Inteligentna wyszukiwarka akt sądowych na podstawie doświadczeń z zakresu przetwarzania kopiowanego tekstu i jego archiwizacji (AGH, KT);
  • Temat 3 – System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (AGH, KI);
  • Temat 4 – Budowa i rozbudowa niezbędnych elektronicznych narzędzi informatyczno-lingwistycznych (AGH; UAM).

Przewidywane wymierne efekty projektu:

Prototyp systemu wspomagania systemów komunikacji (typu „telefon 112”) przetwarzającego informację przekazywaną w języku naturalnym (SMS, w dalszej perspektywie głos), ze szczególnym uwzględnieniem zarządzania kryzysowego w warunkach imprez masowych (typu Euro 2012) (Temat 1).

Prototyp wyszukiwarki akt sądowych szukającej obiektów tekstowych i graficznych na podstawie opisu sytuacyjnego albo z użyciem słów kluczowych (Temat 2).

System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (Temat 3).

Generyczne zasoby inżynierii języka polskiego (Temat 4): słowniki maszynowe, korpusy tematyczne, ontologie typu WordNet (PolNet) i ontologie specjalistyczne, gramatyki i parsery, algorytmy przetwarzania tekstu (wyszukiwanie, klasyfikacja, algorytmy „watermarkingu”).

 

Projekt finansowany przez Narodowe Centrum Badań i Rozwoju

Share on facebook
Share on linkedin
Share on twitter
Share on email
Share on print