PSI-Toolkit

Z PrePedia
Skocz do: nawigacja, szukaj

PSI-Toolkit jest zestawem narzędzi do automatycznego przetwarzania języka naturalnego stworzonym i rozwijanym przez Pracownię Systemów Informacyjnych Uniwersytetu im. Adama Mickiewicza w Poznaniu w ramach grantu MNiSW. Został stworzony w 2011, głównie z myślą o języku polskim, ale w taki sposób, żeby można było wykorzystywać go do analizy innych języków.

Na PSI-Toolkit składają się narzędzia przetwarzania języka takie jak: segmentery, tokenizatory, lematyzatory, analizatory składniowe płytkie i głębokie, narzędzia do tłumaczenia automatycznego regułowego i statystycznego, narzędzia do post-edycji. Narzędzia te mogą być łączone ze sobą w celu wykorzystania ich do złożonych zadań. PSI-Toolkit wspiera różne formaty wejścia i wyjścia, takie jak format Narodowego Korpusu Języka Polskiego, pliki HTML, RTF, LaTeX (za pomocą deformatera wzorowanego na Apertium) czy format UTT. Zbiór narzędzi można obsługiwać za pomocą interfejsu konsolowego lub interfejsu webowego. PSI-Toolkit jest udostępniony publicznie na licencji GPL (rdzeń systemu oraz moduły stworzone w ramach grantu są udostępnione na licencji LGPL).

Bibliografia[edytuj]

  • Filip Graliński, Krzysztof Jassem, Marcin Junczys-Dowmunt. PSI-Toolkit: Natural language processing pipeline. „Computational Linguistics - Applications”, 2012. Heidelberg: Springer. 
  • Krzysztof Jassem. PSI-Toolkit – how to turn a linguist into a computational linguist. „TSD 2012. Lecture Notes in Computer Science”, 2012. Springer. 



Źródło: Ten artykuł bazuje na treści artykułu: PSI-Toolkit z Wikipedii; autorzy: w historii edycji; prawa autorskie: licencja CC-BY-SA 3.0 oraz GNU FDL
Information icon4.svg W Wikipedii odbyła się dyskusja nad usunięciem tego artykułu, zobacz ją.
Traffic lights 4 states 3.png Ten artykuł nie spełniał dotychczas kryteriów encyklopedyczności Wikipedii.