Narzędzia użytkownika

Narzędzia witryny


2019:luszpaj:start

Zaproszenie na obronę pracy doktorskiej

DZIEKAN i RADA WYDZIAŁU
INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI
AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na
publiczną dyskusję nad rozprawą doktorską

mgr inż. Adama Łuszpaja
ZDECENTRALIZOWANA INFRASTRUKTURA DO INTEGRACJI WIEDZY W SEMANTIC WEB
Dyskusja odbędzie się 19 września 2019 roku o godz. 12:00 w sali 2.41
Pawilon D-17, ul. Kawiory 21, 30-059 Kraków
PROMOTOR: Prof. dr hab. inż. Grzegorz Dobrowolski, Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie
RECENZENCI: Prof. dr hab. inż. Ngoc Thanh Nguyen, Politechnika Wrocławska
Prof. dr hab. inż. Krzysztof Zieliński, Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie
Z rozprawą doktorską i opiniami recenzentów można się zapoznać
w Czytelni Biblioteki Głównej AGH w Krakowie, Al. Mickiewicza 30



Zdecentralizowana infrastruktura do integracji wiedzy w Semantic Web

mgr inż. Adam Łuszpaj

Promotor: prof. dr hab. inż. Grzegorz Dobrowolski (AGH)
Dyscyplina: Informatyka


STRESZCZENIE

Sieć Web zrewolucjonizowała dostęp do wiedzy. Semantic Web niesie ze sobą nowy paradygmat dostępu, jakim jest automatyczne przetwarzanie danych w sieci globalnej przez aplikacje rozumiejące ich znaczenie. Nowe metody reprezentacji i manipulowania wiedzą, takie jak RDF, OWL czy SPARQL przekształcają sieć dokumentów w sieć zasobów, dostarczając zunifikowanego modelu danych i formalizmów wyrażania semantyki. Modele dostępu do danych, w tym gromadzenie danych RDF w centralnych repozytoriach, nawigowanie w sieci Linked Data, wyszukiwarki semantyczne czy systemy federacyjne, napotykają na dwie przeszkody. Pierwsza z nich, nazwana barierą architektoniczną, dotyczy problemu lokalizacji źródeł i transparentnego pozyskiwania wiedzy; druga, nazwana semantyczną, związana jest z zagadnieniami różnorodności i niedopasowania ontologii.

W ramach rozprawy sformułowane zostało zadanie pozyskiwania wiedzy, wobec którego kierowanych jest 6 postulatów efektywności. Zadanie polega na rozproszonym wykonaniu zapytania SPARQL opartego na ontologiach, w którym zakłada się identyfikację źródeł wiedzy w oparciu o elementy terminologiczne zapytania. Treścią rozprawy jest propozycja zdecentralizowanej infrastruktury ActiveDiscovery, która wspiera realizację zadania pozyskiwania w zgodzie z postulatami efektywności, stanowiąc architekturę dostępu konceptualnie mierzącą się z obiema barierami.

Tytułowa integracja wiedzy dotyczy z jednej strony agregacji danych współdzielonych pomiędzy różnymi źródłami, z drugiej, odwzorowań pomiędzy ontologiami. Zadanie efektywnego pozyskiwania wiedzy w oparciu o ActiveDiscovery spełnia warunek transparentności dostępu i aktywności sieci, ponieważ nie wymaga adresowania zapytania oraz maksymalizuje zbiór wyników poprzez integrację terminologiczną. Infrastruktura konstrukcyjnie nawiązuje do rozwiązań federacyjnych SPARQL oraz do internetowego systemu nazw domenowych.

Zaproponowano indeks źródeł wiedzy instancyjnej (ABox) oraz indeks odwzorowań wiedzy terminologicznej (TBox) w architekturze rozproszonych węzłów, które osiągalne są poprzez wprowadzone rozszerzenia adnotacyjne dla ontologii OWL w Semantic Web. Niezaadresowane zapytanie źródłowe typu ABox przetwarzane jest przez węzeł mediatora, którego zadaniem jest ekstrakcja predykatów występujących w zapytaniu, zlokalizowanie źródeł wiedzy oraz translacja i optymalizacja zapytania z użyciem informacji kontekstowych, a następnie wykonanie docelowego zapytania federacyjnego wobec zlokalizowanych punktów dostępowych SPARQL.

Wykonano prototypową implementację opracowanych węzłów infrastruktury, rozszerzeń adnotacyjnych, protokołu interakcji mediatora z pozostałymi węzłami i algorytmu translacji zapytania oraz przeprowadzono ewaluację, której wyniki wskazują na wartość dodaną i skalowalność zaproponowanej infrastruktury.


ABSTRACT

The Web has deeply changed the way we acquire knowledge. The Semantic Web brings a new paradigm of machine-processable knowledge on a global scale by intelligent, semantics-aware applications. New methods of knowledge representation and manipulation, such as RDF, OWL and SPARQL, transform a document-centric medium into resource-oriented space by providing a uniform data model and means to express data semantics. The proposed knowledge access approaches, namely collecting data in central repositories, navigating in Linked Data, semantic indexing searchers or federated systems, face two general impediments. The first, called an architectural barrier, regards the problem of knowledge discovery and transparency of knowledge sources access; the second, called a semantic barrier, is related to the question of semantic heterogeneity.

The dissertation discusses the problem of knowledge acquisition required to satisfy 6 conditions of effectiveness. The problem refers to the distributed execution of an ontology-based SPARQL query in which knowledge sources are dynamically detected, based on the query’s terminological boxes. The contribution of the dissertation is a proposal of a decentralized infrastructure named ActiveDiscovery, designed to support a solution to the problem of knowledge acquisition in compliance with the effectiveness conditions, consitituting an architectural pattern which attempts to overcome both access barriers.

The knowledge integration concerns aggregation of data shared among disparate sources and ontology matching. The problem of effective knowledge acquisition in ActiveDiscovery meets the requirement of transparent access and network proactivity thanks to non-addressing query handling and extends query resultset through cross-ontology TBox mappings. The proposed infrastructure is conceptually related to federated SPARQL architectures and worldwide Domain Name System.

An index of assertional (ABox) knowledge sources as well as an index of terminological (TBox) knowledge mappings have been proposed within an architecture of distributed nodes. Index nodes accessibility throughout the network is enabled by annotation extensions introduced in OWL ontologies. A non-addressing ABox source query is processed by the mediator node which is responsible for an extraction of TBoxes from the query, discovery of relevant knowledge sources, translation and optimization of the query based on context meta-data and finally an execution of the target query against federated SPARQL endpoints.

A proof-of-concept implementation has been carried out regarding the previously designed node applications, annotation extensions, interaction protocol between mediator node and other parties as well as an algorithm for query translation. Finally, an evaluation has been performed, revealing value added and scalability of the proposed infrastructure.



Recenzje rozprawy
Prof. dr hab. inż. Ngoc Thanh Nguyen (PW)
Prof. dr hab. inż. Krzysztof Zieliński (AGH)




Ważniejsze publikacje doktoranta:

  1. Adam Łuszpaj and Grzegorz Dobrowolski, Decentralized infrastructure for knowledge discovery in the Semantic Web, Special Issue of Journal of Intelligent \& Fuzzy Systems on Collective Intelligent Information and Database Systems (CIIDS 2019), IOS Press, 2019 (w druku)
  2. Krzysztof Kluza, Grzegorz J. Nalepa, Mateusz Ślażyński, Krzysztof Kutt, Edyta Kucharska, Krzysztof Kaczor and Adam Łuszpaj, Overview of selected business process semantization techniques, W: Advances in business ICT: new ideas from ongoing research / eds. Tomasz Pełech-Pilichowski, Maria Mach-Król, Celina M. Olszak. — Switzerland : Springer, cop. 2017. — (Studies in Computational Intelligence ; ISSN 1860-949X ; vol. 658). — ISBN: 978-3-319-47207-2 ; e-ISBN: 978-3-319-47208-9. — S. 45–64. — Bibliogr. s. 62–64, Abstr.
  3. Grzegosz J. Nalepa, Mateusz Ślażyński, Krzysztof Kutt, Edyta Kucharska and Adam Łuszpaj, Unifying business concepts for SMEs with Prosecco ontology, W: FedCSIS : abstracts of the Federated Conference on Computer Science and Information Systems : September 13-16, 2015, Łódź, Poland. — [Piscataway : IEEE], [2015]. — W bazie Web of Science seria: ACSIS-Annals of Computer Science and Information Systems ; ISSN 2300-5963 ; vol. 5. — Opis częśc. wg okł.. — ISBN: 978-8-3608-1066-8. — S. 96. — Publikacja dostępna w części: 6\textsuperscript{th} International workshop on Advances in business ICT. — Pełny tekst na dołączonym Dysku Flash. — S. 1331-1336. — Wymagania systemowe: Adobe Reader. — Bibliogr. s. 1336, Abstr. — W Bazie Web of Science zakres stron: 1321–1326
  4. Adam Łuszpaj, Edward Nawarecki, Anna Zygmunt, Jarosław Koźlak, Grzegorz Dobrowolski, Upper ontology based method for ontologies matching improvement, Systems Science ; ISSN 0137-1223. — 2008 vol. 34 no. 1, s. 85–96. — Bibliogr. s. 95–96
  5. Adam Łuszpaj, Edward Nawarecki, Anna Zygmunt, Jarosław Koźlak and Grzegorz Dobrowolski, Ontology matching in communication and Web services composition for agent community, W: Multi-agent systems and applications V : 5th international Central and Eastern European conference on Multi-Agent Systems, CEEMAS 2007 : Leipzig, Germany, September 25–27, 2007 : proceedings / eds. Hans-Dieter Burkhard [et al.]. — Berlin ; Heidelberg : Springer-Verlag, 2007. — (Lecture Notes in Computer Science ; ISSN 0302-9743. Lecture Notes in Artificial Intelligence ; LNAI 4696). — Opis częśc. wg okł.. — ISBN: 978-540-75253-0 ; ISBN10: 3-540-75253-6. — S. 337–339. — Bibliogr. s. 339, Abstr.
  6. Adam Łuszpaj, Anna Zygmunt, Jarosław Koźlak and Edward Nawarecki, A concept, implementation and testing of an algorithm for knowledge integration using upper ontology, W: Proceedings of the 16th international conference on Systems science : 4–6 September 2007, Wrocław, Poland. Vol. 2, Manufacturing systems ; Distributed computer systems and computer networks ; Knowledge-based and intelligent systems ; Decision support and expert systems / ed. Adam Grzech. — Wrocław : Oficyna Wydawnicza Politechniki Wrocławskiej, 2007. — ISBN: 978-83-7493-340-7. — S. 397–404. — Bibliogr. s. 404
  7. Jarosław Koźlak, Anna Zygmunt, Adam Łuszpaj, Kamil Szymański, The process of integrating ontologies for knowledge base systems, W: Software engineering : evolution and emerging technologies / eds. Krzysztof Zieliński, Tomasz Szmuc. — Amsterdam, [etc.] : IOS Press, 2005. — (Frontiers in Artificial Intelligence and Applications ; ISSN 0922-6389 ; vol. 130). — ISBN: 978-1-58603-559-4. — S. 259–270. — Bibliogr. s. 270, Abstr.
2019/luszpaj/start.txt · ostatnio zmienione: 2020/03/27 19:20 przez Adam Łuszpaj