2015:skalkow:start

DZIEKAN i RADA WYDZIAŁU INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na publiczą dyskusję nad rozprawą doktorską mgr inż. Kornela Skałkowskiego
Adaptation of Service-Oriented Systems Based on Reinforcement Learning
Termin:	25 lutego 2015 roku o godz. 10:00
Miejsce:	pawilon D-17, ul. Kawiory 21, 30-059 Kraków
PROMOTOR:	Prof. dr hab. inż. Krzysztof Zieliński - Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
RECENZENCI:	Prof. dr hab. inż. Ngoc Thanh Nguyen - Politechnika Wrocławska
	Prof. dr hab. inż. Witold Dzwinel - Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30

Adaptation of Service-Oriented Systems Based on Reinforcement Learning

mgr inż. Kornel Skałkowski

Promotor: prof. dr hab. inż. Krzysztof Zieliński (AGH) Dyscyplina: Informatyka

Celem pracy doktorskiej jest przedstawienie nowego podejścia do adaptacji systemów zorientowanych na usługi, opartego o metody uczenia maszynowego. Praca przedstawia nowatorskie podejście do realizacji wzorca adaptacji MAPE-k (ang. Monitoring, Analysis, Planning, Execution - knowledge) dla systemów SOA (ang. Service-Oriented Architecture), wykorzystującego algorytmy klasteryzacji strumieni danych do realizacji komponentu analizy, oraz algorytmy uczenia ze wzmocnieniem do realizacji komponentu planowania.

Koncepcja pracy opiera się o analizę przestrzeni stanów systemów SOA za pomocą metod klasteryzacji strumieni danych oraz dobór akcji do wykonania za pomocą algorytmów uczenia ze wzmocnieniem. Podstawowym elementem koncepcji jest algorytm uczenia ze wzmocnieniem, który na podstawie obserwacji stanów systemu i wpływu wykonanych akcji na system uczy się, które akcje są właściwe dla których stanów systemu. Zastosowanie algorytmów uczenia ze wzmocnieniem do planowania akcji adaptacji ma szereg zalet w stosunku do istniejących podejść:

Nie wymaga dostarczenia żadnej wiedzy na temat adaptowanego systemu SOA.
Nie wymaga interwencji (aktualizacji, restartu) w przypadku wprowadzania zmian w adaptowanym systemie.
Nie ogranicza logiki adaptacji, np. do określonego zbioru reguł/polityk.

Bezpośrednie zastosowanie algorytmów uczenia ze wzmocnieniem do adaptacji systemów SOA nie jest jednak możliwe z uwagi na szereg ich cech, takich jak nieskończona przestrzeń stanów, ciągła ewolucja, mnogość parametrów opisujących ich stan czy zmienna szybkość zmian. Z tego względu, koncepcja przedstawiona w pracy proponuje aby działanie algorytmów uczenia ze wzmocnieniem wspomóc algorytmami klasteryzacji przestrzeni stanów w celu wyodrębnienia quasi-stabilnych stanów systemu i śledzenia ich ewolucji. Zastosowanie algorytmów ciągłej klasteryzacji do analizy przestrzeni stanów systemów SOA pozwala nie tylko na ekstrakcję stabilnych stanów (w formie klastrów) ale również na odróżnienie ich od stanów przejściowych bądź niestabilnych (odrzucanych jako tzw. „szum” w procesie klastrowania), oraz śledzenie ich ewolucji (łączenie, dzielenie, dryfowanie bądź zanikanie). Ponadto, analiza klastrów pozwala na określenie, które z wymiarów definiujących przestrzeń stanów systemu w największym stopniu przyczyniają się do zmian w nim zachodzących. Pozwala to algorytmom uczenia ze wzmocnieniem wiązać decyzje o wykonywanych akcjach adaptacji tylko z parametrami mającymi istotny wpływ na funkcjonowanie systemu.

W toku badań nad dostępnymi algorytmami uczenia ze wzmocnieniem i algorytmami klastrowania strumieni danych, do realizacji zaproponowanego podejścia wybrane zostały dwa algorytmy uczenia ze wzmocnieniem: Adaptive Gradient Descent i Q-learning oraz dwa algorytmy klasteryzacji strumieni danych: DenStream oraz D-Stream. Zaproponowane podejście do budowy adaptowalnych systemów SOA zostało zaimplementowane i przetestowane z wykorzystaniem wytypowanych algorytmów (algorytm Q-learning został zaimplementowany z wykorzystaniem czterech polityk: max-Q, ϵ-greedy, Boltzmanna i licznikowej). Ocena poprawności i efektywności zaproponowanej adaptowalnej architektury SOA została wykonana na dwóch systemach SOA: symulowanym i rzeczywistym. Oba przypadki testowe wykazały przewagę algorytmu Q-learning nad algorytmem Adaptive Gradient Descent w realizacji procesu planowania akcji adaptacji. Szczególnie dobre wyniki dało zastosowanie polityk zachłannych (max-Q, ϵ-greedy). W odniesieniu do komponentu analizy realizowanego przez algorytmy klasteryzacji strumieni danych, oba zaproponowane algorytmy uzyskały podobne wyniki. Algorytm DenStream dał lepsze wyniki w przypadku symulowanego systemu, w którym zmiany stanów zachodziły często i gwałtownie, natomiast algorytm D-Stream sprawdził się lepiej w przypadku rzeczywistego systemu SOA, którego ewolucja przebiegała wolniej.

Dłuższa wersja autoreferatu

Ważniejsze publikacje dokotoranta

Automatic Adaptation of SOA Systems Supported by Machine Learning, Kornel Skałkowski, Krzysztof Zieliński, Technological Innovation for the Internet of Things, vol. 394 IFIP Advances in Information and Communication Technology / eds. Luis M. Camarinha-Matos, Slavisa Tomic, Paula Graça. - Berlin ; Heidelberg : Springer, cop. 2013
Applying Formalized Rules for Treatment Procedures to Data Delivered by Personal Medical Devices, Kornel Skałkowski, Krzysztof Zieliński, Journal of Biomedical Informatics; ISSN 1532-0464. – 2013 vol. 46 iss. 3 s. 530-540. – ISBN 978-3-642-37290-2 – S. 61-68.
QoS-based storage resources provisioning for grid applications, Kornel Skałkowski, Renata Słota, Dariusz Król, Jacek Kitowski, Future Generation Computer Systems ; ISSN 0167-739X. — 2013 vol. 29 iss. 3 s. 713–727. — Bibliogr. s. 725–726, Abstr.
Management of data access with quality of service in PL-Grid environment, Renata Słota, Darin Nikolow, Kornel Skałkowski, Jacek Kitowski, Computing and Informatics / Slovak Academy of Sciences. Institute of Informatics ; ISSN 1335-9150. — Tyt. poprz.: Computers and Artificial Intelligence. — 2012 vol. 31 no. 2 s. 463–479. — Bibliogr. s. 476–477, Abstr.

Uzasadnienie wyróżnienia pracy

Doktorant jest autorem bądź współautorem 18 artykułów naukowych, z czego trzy [2-4] zostały opublikowane w czasopismach na liście filadelfijskiej z wysokimi współczynnikami IF. Na swoim koncie ma on również trzy rozdziały w książkach. Doktorant uczestniczył ponadto w czterech projektach badawczych finansowanych z programów krajowych oraz europejskich. Jest on także współautorem jednego wniosku patentowego (Biuletyn Urzędu Patentowego RP, 13/2014, ISSN-1689-0124).