DZIEKAN i RADA WYDZIAŁU INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE |
|
---|---|
zapraszają na publiczną dyskusję nad rozprawą doktorską mgr inż. Mariusza Oszusta |
|
Zastosowanie grupowania szeregów czasowych do rozpoznawania wypowiedzi w języku migowym na podstawie sekwencji wizyjnych | |
Termin: | 8 lipca 2013 r. o godz. 12:00 |
Miejsce: | Sala 3.27 C, ul. Kawiory 21, pawilon D-17 |
PROMOTOR: | dr hab. inż. Marian Wysocki, prof. n. PRz – Politechnika Rzeszowska |
RECENZENCI: | prof. dr hab. Stanisław Matwin – Dalhousie University, Halifax, Canada |
dr hab. inż. Bogusław Cyganek – Akademia Górniczo-Hutnicza w Krakowie | |
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 |
mgr inż. Mariusz Oszust
Promotor: dr hab. inż. Marian Wysocki, prof. n. PRz – Politechnika Rzeszowska
Dyscyplina: Informatyka
Celem pracy było opracowanie metody rozpoznawania słów i pojedynczych zdań polskiego języka migowego na podstawie analizy sekwencji wizyjnych. Większość wypowiedzi w języku migowym to gesty dynamiczne, które w wizyjnych systemach rozpoznawania są reprezentowane przez szeregi czasowe, tzn. przebiegi zmienności cech wyznaczonych na podstawie analizy obrazów. Przedmiotem badań była metoda rozpoznawania wykorzystująca modelowanie gestów za pomocą jednostek mniejszych niż słowa. Przypomina to modelowanie za pomocą fonemów w przypadku języka mówionego. Ponieważ nie wiadomo dokładnie, co w wypowiedzi w języku migowym stanowi odpowiedniki fonemów (nazywane cheremami), zaproponowana w pracy metoda wyodrębnienia cheremów opiera się na analizie danych. Polega ona na określeniu sposobu segmentacji szeregów czasowych reprezentujących wypowiedzi, by powstałe fragmenty - traktowane jako poszukiwane cheremy - tworzyły jednorodne grupy. Punkty podziału szeregów czasowych są wyznaczane jako rozwiązanie zadania optymalizacji, znajdowane
z wykorzystaniem algorytmów opartych na analogiach biologicznych (algorytm immunologiczny i genetyczny). Według aktualnej wiedzy autora, tak sformułowane zadanie nie było dotąd rozpatrywane w odniesieniu do rozpoznawania wypowiedzi języka migowego.
W zastosowanym podejściu cherem był reprezentowany przez szereg czasowy znajdujący się w klastrze lub ukryty model Markowa klastra. Metodę zweryfikowano z powodzeniem na bazie 101 słów i 35 zdań używanego w Polsce Systemu Językowo-Migowego (SJM) wykonując liczne eksperymenty. Położono nacisk na ocenę wpływu metod określania podobieństwa między cheremami, metod grupowania i wskaźników oceny klastrów, technik optymalizacji oraz typu klasyfikatora na skuteczność rozpoznawania. Badania potwierdziły zasadność stosowania jednostek mniejszych niż słowa do modelowania wyrażeń SJM. W szczególności, w przypadku dostępności do niewielkiej liczby przykładów uczących uzyskiwano znacząco lepsze rezultaty niż dla klasyfikatora wykorzystującego wyłącznie modele całych słów.
Integralną częścią pracy jest zaprojektowany przez autora prototyp środowiska wspomagającego eksperymenty i gromadzenie oraz udostępniane danych.
Za najważniejsze osiągnięcia pracy autor uważa:
Dłuższa wersja autoreferatu marosz_autoreferat.pdf.
Wybrane publikacje doktoranta: