Doktoraty Wydziału IET

DZIEKAN i RADA WYDZIAŁU INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na publiczną dyskusję nad rozprawą doktorską mgr inż. Aleksandra Smywińskiego-Pohla
AUTOMATYCZNA EKSTRAKCJA RELACJI SEMANTYCZNYCH Z TEKSTÓW W JĘZYKU POLSKIM
Termin:	25 września 2015 roku o godz. 11:00
Miejsce:	Sala 1.19, ul. Kawiory 21, pawilon D-17, 30-059 Kraków
PROMOTOR:	Prof. dr hab. Wiesław Lubaszewski, Uniwersytet Jagielloński; Akademia Górniczo-Hutnicza
RECENZENCI:	Prof. dr hab. Stanisław Matwin, Polska Akademia Nauk, Warszawa; Dalhousie University, Halifax, Kanada
	dr hab. inż. Krzysztof Boryczko, Akademia Górniczo-Hutnicza
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30

Automatyczna ekstrakcja relacji semantycznych z tekstów w języku polskim

mgr inż. Aleksander Smywiński-Pohl

Promotor: prof. dr hab. Wiesław Lubaszewski (UJ, AGH) Dyscyplina: Informatyka

Praca dotyczy ekstrakcji informacji z polskich tekstów. Zasadniczym jej tematem jest rozpoznawanie relacji semantycznych w oparciu o automatycznie konstruowane wzorce ekstrakcyjne. Przedstawiono w niej również algorytm selekcji zdań, na podstawie których tworzony jest model ekstrakcji oraz algorytmy ujednoznaczniania i semantycznej klasyfikacji wyrażeń języka polskiego.

Wzorce ekstrakcyjne są konstruowane na podstawie przykładowych zdań zawierających wyrażenia połączone relacjami oraz wyposażane są w ograniczenia semantyczne zdefiniowane z wykorzystaniem pojęć ontologii Cyc. Ograniczenia określane są na podstawie trzech metod: ręcznej oceny zdań, predykatów ontologii Cyc oraz danych znajdujących się w DBpedii.

– Teza rozprawy:– Jako tezę niniejszej rozprawy doktorskiej autor przedstawia następujące twierdzenie:

możliwe jest skonstruowanie hybrydowego algorytmu ekstrakcji wybranych relacji semantycznych z tekstów w języku polskim, który:

dawałby wyniki bardziej precyzyjne niż te, otrzymywane za pomocą algorytmów statystycznych,
nie byłby ograniczony do pojedynczej dziedziny wiedzy,
wymagałby mniejszego nakładu pracy ręcznej, niż algorytm wytrenowane na ręcznie oznakowanym zbiorze uczącym.

Przeprowadzono szereg eksperymentów weryfikujących skuteczność opisywanych algorytmów, w szczególności dotyczących ekstrakcji relacji całość-część. Pokazują one, że użycie ograniczeń semantycznych prowadzi do istotnej poprawy precyzji ekstrahowanych informacji. Porównanie wyników ekstrakcji dla ograniczeń uzyskanych na różne sposoby pozwala obronić tezę pracy o możliwości automatycznej ekstrakcji relacji semantycznych z wykorzystaniem algorytmu hybrydowego, łączącego symboliczne zasoby wiedzy z danymi statystycznymi.

Streszczenie pełne streszczenie pracy doktorskiej.

Praca doktorska treść pracy "Automatyczna ekstrakcja relacji semantycznych z tekstów w języku polskim"

Recenzja 1 recenzja pracy prof. dr hab. Stanisław Matwin

Recenzja 2 recenzja pracy dr hab. inż. Krzysztof Boryczko

Ważniejsze publikacje doktoranta:

A. Pohl (2013). Knowledge-based Named Entity Recognition in Polish, [w:] Proceedings of the 2013 Federated Conference on Computer Science and Information Systems (FedCSIS)
A. Pohl, B. Ziółko (2013). Using Part of Speech N-grams for Improving Automatic Speech Recognition of Polish, [w:] Machine Learning and Data Mining in Pattern Recognition, LNCS vol. 7988, s. 492-504, ISBN: 978-3-642-39711-0, DOI: 10.1007/978-3-642-39712-7_38
A. Pohl, B. Ziółko (2013). A Comparison of Polish Taggers in the Application for Automatic Speech Recognition, [w:] Proceedings of the 6th Language & Technology Conference (LTC 2013), s. 294-298.
A. Pohl (2012). Classifying the Wikipedia Articles into the OpenCyc Taxonomy, [w:] Proceedings of the Web of Linked Entities Workshop in conjuction with the 11th International Semantic Web Conference, Giuseppe Rizzo, Pablo Mendes, Eric Charton, Sebastian Hellmann, Aditya Kalyanpurs (red.), s. 5-16, ISSN: 1613-0073.
A. Pohl (2012). Improving the Wikipedia Miner Word Sense Disambiguation Algorithm, [w:] Federated Conference on Computer Science and Information Systems (FedCSIS), s. 241-248, ISBN: 978-1-4673-0708-6
A. Pohl (2012). An Ontology-based Method for an Efficient Acquisition of Relation Extraction Training and Testing Examples, [w:] Security and Intelligent Information Systems, P. Bouvry et al. (Eds.) LNCS vol. 7053 s. 318-331, ISBN 978-3-642-25260-0, DOI: 10.1007/978-3-642-25261-7_25
A. Pohl (2010). The Semi-automatic Construction of the Polish Cyc Lexicon [w:] Investigationes Linguisticae, vol. XXI, s. 17-38, ISSN 1733-1757
A. Pohl (2010). The Polish Cyc lexicon as a bridge between Polish language and the Semantic Web, [w:] Proceedings of the International Multiconference on Computer Science and Information Technology, IEEE, s. 485-492 ISBN: 978-83-60810-22-4, ISSN: 1896-7094
A. Pohl (2010). Automatyczna analiza składniowa haseł w słowniku dwujęzycznym, [w:] Rocznik Kognitywistyczny III/2009, Aleksander Pohl, Martyna Goc, Tomasz Konik, Marta Siedlecka (red.). Wydawnictwo UJ: Kraków, s. 117-124, ISBN: 978-83-233-2923-7
A. Pohl (2009). Automatic Construction of the Polish Nominal Lexicon for the OpenCyc Ontology, [w:] Recent Advances in Intelligent Information Systems, Mieczysław A. Kłopotek et al red., Oficyna Wydawnicza Exit: Warszawa, s. 51-64, ISBN: 978-83-60434-59-8

Doktoraty Wydziału IET

Narzędzia użytkownika

Narzędzia witryny

Automatyczna ekstrakcja relacji semantycznych z tekstów w języku polskim

Narzędzia strony