\\ ^ **DZIEKAN i RADA WYDZIAŁU** \\ **INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI** \\ **AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE** ^^ | zapraszają na \\ publiczną dyskusję nad rozprawą doktorską \\ \\ //mgr inż. Aleksandra Smywińskiego-Pohla// \\ || | **AUTOMATYCZNA EKSTRAKCJA RELACJI SEMANTYCZNYCH Z TEKSTÓW W JĘZYKU POLSKIM** || ^ Termin:|25 września 2015 roku o godz. 11:00 | ^ Miejsce:|Sala 1.19, \\ ul. Kawiory 21, pawilon D-17, 30-059 Kraków | ^ **PROMOTOR:**|Prof. dr hab. Wiesław Lubaszewski, Uniwersytet Jagielloński; Akademia Górniczo-Hutnicza | ^ ** RECENZENCI:**|Prof. dr hab. Stanisław Matwin, Polska Akademia Nauk, Warszawa; Dalhousie University, Halifax, Kanada | ^ ** **|dr hab. inż. Krzysztof Boryczko, Akademia Górniczo-Hutnicza | | Z rozprawą doktorską i opiniami recenzentów można się zapoznać \\ w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 || \\ ---- \\ ==== Automatyczna ekstrakcja relacji semantycznych z tekstów w języku polskim ==== \\ //mgr inż. Aleksander Smywiński-Pohl// \\ **Promotor:** prof. dr hab. Wiesław Lubaszewski (UJ, AGH) **Dyscyplina:** Informatyka \\ Praca dotyczy ekstrakcji informacji z polskich tekstów. Zasadniczym jej tematem jest rozpoznawanie relacji semantycznych w oparciu o automatycznie konstruowane wzorce ekstrakcyjne. Przedstawiono w niej również algorytm selekcji zdań, na podstawie których tworzony jest model ekstrakcji oraz algorytmy ujednoznaczniania i semantycznej klasyfikacji wyrażeń języka polskiego. Wzorce ekstrakcyjne są konstruowane na podstawie przykładowych zdań zawierających wyrażenia połączone relacjami oraz wyposażane są w ograniczenia semantyczne zdefiniowane z wykorzystaniem pojęć ontologii Cyc. Ograniczenia określane są na podstawie trzech metod: ręcznej oceny zdań, predykatów ontologii Cyc oraz danych znajdujących się w DBpedii. --** Teza rozprawy:**-- Jako tezę niniejszej rozprawy doktorskiej autor przedstawia następujące twierdzenie:\\ //** możliwe jest skonstruowanie hybrydowego algorytmu ekstrakcji wybranych relacji semantycznych z tekstów w języku polskim, który:**// - //**dawałby wyniki bardziej precyzyjne niż te, otrzymywane za pomocą algorytmów statystycznych,**// - //**nie byłby ograniczony do pojedynczej dziedziny wiedzy,**// - //**wymagałby mniejszego nakładu pracy ręcznej, niż algorytm wytrenowane na ręcznie oznakowanym zbiorze uczącym.**// Przeprowadzono szereg eksperymentów weryfikujących skuteczność opisywanych algorytmów, w szczególności dotyczących ekstrakcji relacji całość-część. Pokazują one, że użycie ograniczeń semantycznych prowadzi do istotnej poprawy precyzji ekstrahowanych informacji. Porównanie wyników ekstrakcji dla ograniczeń uzyskanych na różne sposoby pozwala obronić tezę pracy o możliwości automatycznej ekstrakcji relacji semantycznych z wykorzystaniem algorytmu hybrydowego, łączącego symboliczne zasoby wiedzy z danymi statystycznymi. ---- \\ **Streszczenie** {{:2015:asp:a_smywinski_pohl_streszczenie.pdf|pełne streszczenie pracy doktorskiej}}. \\ ---- \\ **Praca doktorska** {{:2015:asp:a_smywinski_pohl_phd.pdf|treść pracy "Automatyczna ekstrakcja relacji semantycznych z tekstów w języku polskim"}} \\ ---- \\ **Recenzja 1** {{:2015:asp:a_smywinski_pohl_matwin_review.pdf|recenzja pracy prof. dr hab. Stanisław Matwin}} \\ **Recenzja 2** {{:2015:asp:a_smywinski_pohl_boryczko_review.pdf|recenzja pracy dr hab. inż. Krzysztof Boryczko}} \\ ---- \\ **Ważniejsze publikacje doktoranta**: - A. Pohl (2013). //Knowledge-based Named Entity Recognition in Polish//, [w:] //Proceedings of the 2013 Federated Conference on Computer Science and Information Systems (FedCSIS)// - A. Pohl, B. Ziółko (2013). //Using Part of Speech N-grams for Improving Automatic Speech Recognition of Polish//, [w:] //Machine Learning and Data Mining in Pattern Recognition//, LNCS vol. 7988, s. 492-504, ISBN: 978-3-642-39711-0, DOI: 10.1007/978-3-642-39712-7_38 - A. Pohl, B. Ziółko (2013). //A Comparison of Polish Taggers in the Application for Automatic Speech Recognition//, [w:] //Proceedings of the 6th Language & Technology Conference (LTC 2013)//, s. 294-298. - A. Pohl (2012). //Classifying the Wikipedia Articles into the OpenCyc Taxonomy//, [w:] //Proceedings of the Web of Linked Entities Workshop in conjuction with the 11th International Semantic Web Conference//, Giuseppe Rizzo, Pablo Mendes, Eric Charton, Sebastian Hellmann, Aditya Kalyanpurs (red.), s. 5-16, ISSN: 1613-0073. - A. Pohl (2012). //Improving the Wikipedia Miner Word Sense Disambiguation Algorithm//, [w:] //Federated Conference on Computer Science and Information Systems (FedCSIS)//, s. 241-248, ISBN: 978-1-4673-0708-6 - A. Pohl (2012). //An Ontology-based Method for an Efficient Acquisition of Relation Extraction Training and Testing Examples//, [w:] //Security and Intelligent Information Systems//, P. Bouvry et al. (Eds.) LNCS vol. 7053 s. 318-331, ISBN 978-3-642-25260-0, DOI: 10.1007/978-3-642-25261-7_25 - A. Pohl (2010). //The Semi-automatic Construction of the Polish Cyc Lexicon// [w:] //Investigationes Linguisticae//, vol. XXI, s. 17-38, ISSN 1733-1757 - A. Pohl (2010). //The Polish Cyc lexicon as a bridge between Polish language and the Semantic Web//, [w:] //Proceedings of the International Multiconference on Computer Science and Information Technology, IEEE//, s. 485-492 ISBN: 978-83-60810-22-4, ISSN: 1896-7094 - A. Pohl (2010). //Automatyczna analiza składniowa haseł w słowniku dwujęzycznym//, [w:] //Rocznik Kognitywistyczny III/2009//, Aleksander Pohl, Martyna Goc, Tomasz Konik, Marta Siedlecka (red.). Wydawnictwo UJ: Kraków, s. 117-124, ISBN: 978-83-233-2923-7 - A. Pohl (2009). //Automatic Construction of the Polish Nominal Lexicon for the OpenCyc Ontology//, [w:] //Recent Advances in Intelligent Information Systems//, Mieczysław A. Kłopotek et al red., Oficyna Wydawnicza Exit: Warszawa, s. 51-64, ISBN: 978-83-60434-59-8 ----