==== Zaproszenie na obronę pracy doktorskiej ==== ^ **DZIEKAN i RADA WYDZIAŁU** \\ **INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI** \\ **AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE** ^ | zapraszają na \\ publiczą dyskusję nad rozprawą doktorską \\ \\ //mgr. inż. Rafała Samborskiego// \\ | | **WYKORZYSTANIE SZEROKOPASMOWEJ MATRYCY WIELOMIKROFONOWEJ W ROZPOZNAWANIU MÓWCY** | | Dyskusja odbędzie się 30 czerwca 2016 roku o godz. 10:00 w sali 1.19 \\ pawilon D-17, ul. Kawiory 21, 30-059 Kraków | | **PROMOTOR:** prof. dr hab. inż. Mariusz Ziółko – Akademia Górniczo-Hutnicza im. Stanisława Staszica | | ** RECENZENCI:** prof. dr hab. inż. Adam Dąbrowski – Politechnika Poznańska | | ** ** prof. dr hab. inż. Tomasz Zieliński – Akademia Górniczo-Hutnicza im. Stanisława Staszica | | Z rozprawą doktorską i opiniami recenzentów można się zapoznać \\ w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 | \\ ---- ==== Wykorzystanie szerokopasmowej matrycy wielomikrofonowej w rozpoznawaniu mówcy ==== //mgr inż. Rafał Samborski// \\ **Promotor:** prof. dr hab. inż. Mariusz Ziółko (AGH) \\ **Dyscyplina:** Elektronika \\ W pracy przedstawione zostały najważniejsze możliwości zastosowania matryc wielomikrofonowych w technologii mowy, a w szczególności w zakresie rozpoznawania mówcy. Głównym aspektem badawczym było rozwinięcie stosowanych obecnie systemów diaryzacji nagrań opartych o jednoczesne wykorzystanie informacji bazującej na cechach częstotliwościowych (MFCC) i na położeniu mówcy (TDOA) wyznaczonym dzięki wykorzystaniu układu wielu mikrofonów. Zarówno literatura, jak i eksperymenty przedstawione przez autora potwierdzają, że informacja na temat położenia mówcy w znaczący sposób obniża ilość błędnie opisanych wypowiedzi (diarization error rate, DER). Nowością nieopisaną dotychczas w literaturze jest zastosowanie dynamicznego doboru proporcji pomiędzy strumieniami informacji. Proporcja w hybrydowym systemie zaproponowanym przez autora dobierana jest w zależności od aktualnych warunków akustycznych. Praca posiada rozbudowaną część doświadczalną, w której opracowane algorytmy zostały przetestowane na korpusie zawierającym rzeczywiste nagrania. Zaprezentowane wyniki pokazują, że zastosowanie dynamicznych wag pomiędzy strumieniami pozwala na obniżenie ilości DER nawet o 30% w stosunku do systemu ze stałą proporcją. Praca zawiera również porównanie wyników uzyskanych za pomocą opracowanego rozwiązania z opisanymi wcześniej w literaturze. Teza rozprawy została sformułowana w następujący sposób:\\ //**Wykorzystanie kilku strumieni cech w znaczący sposób polepsza skuteczność działania systemu diaryzacji nagrań. Poprzez dynamiczny dobór proporcji pomiędzy informacją pochodzącą z klasycznego systemu identyfikacji mówcy opartego o cechy częstotliwościowe (MFCC) a informacją związaną z lokalizacją mówcy (TDOA) następuje znacząca poprawa wyników algorytmu w stosunku do istniejących rozwiązań.**// Najważniejsze osiągnięcia pracy można streścić w następujących punktach: * dokładna analiza stanu wiedzy na temat zastosowania matryc wielomikrofonowych w technologii mowy, * budowa autorskich rozwiązań sprzętowych (matryca 4- i 16-mikrofonowa) i algorytmicznych, * koncepcja dynamicznego doboru proporcji między strumieniami MFCC i TDOA, * obniżenie ilość błędnie opisanych wypowiedzi (DER) o 30% w stosunku do systemu ze stałą proporcją, * eksperymenty przeprowadzone na specjalnie przygotowanym korpusie nagrań (korpus zgodny z wymaganiami NIST), * dokładne porównanie z istniejącymi algorytmami diaryzacji. ---- ==== Recenzje pracy ==== {{:2016:samborski:recenzja_dabrowski.pdf|prof. dr hab. inż. Adam Dąbrowski}} {{:2016:samborski:recenzja_zielinski.pdf|prof. dr hab. inż. Tomasz Zieliński}} \\ ---- \\ **Ważniejsze publikacje doktoranta**: - Samborski R., Ziółko M., Ziółko B., Gałka J.: Speech extraction from jammed signals in dual-microphone systems, //IASTED International Conference on Signal Processing, Pattern Recognition and Applications//, Innsbruck, Austria, 2010. - Samborski R., Ziółko M., Ziółko B., Gałka J.: Wiener filtration for speech extraction from the intentionally corrupted signals, //IEEE International Symposium on Industrial Electronics//, Bari, Italy, 2010. - Samborski R., Ziółko M.: Filter-based model of multimicrophone array in an adverse acoustic environment, //Engineering Letters//, vol. 20, 2012. - Samborski R., Ziółko M.: Speaker localization in conferencing systems employing phase features and wavelet transform, //IEEE International Symposium on Signal Processing and Information Technology//, Athens, Greece, 2013. - Gałka J., Grzywacz M., Samborski R.: Playback attack detection for text-dependent speaker verification over telephone channels, //Speech Communication//, vol. 67, 2015. - Gałka J., Grzywacz M., Samborski R.: A system and a method for detecting recorded biometric information, European Patent Office, EP 3016314 A1, 2016 ----