Narzędzia użytkownika

Narzędzia witryny


2022:bzurkowski:start

Zaproszenie na obronę pracy doktorskiej


PRZEWODNICZĄCY I RADA DYSCYPLINY
INFORMATYKI TECHNICZNEJ I TELEKOMUNIKACJI
AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na
publiczą dyskusję nad rozprawą doktorską

mgr inż. Bartosza Żurkowskiego
ANALIZA ŹRÓDEŁ DEFEKTÓW DZIAŁANIA APLIKACJI DUŻEJ SKALI W CHMURZE OBLICZENIOWEJ
Termin:21 października 2022 roku o godz. 12:00
Miejsce:sala 1.20, Centrum Informatyki D-17, ul. Kawiory 21
PROMOTOR:prof. dr hab. inż. Krzysztof Zieliński, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
PROMOTOR POMOCNICZY:dr inż. Kazimierz Bałos, Samsung R&D Institute Poland
RECENZENCI:prof. dr hab. inż. Krzysztof Goczyła, Politechnika Gdańska
prof. dr hab. inż. Jerzy Brzeziński, Politechnika Poznańska
Z rozprawą doktorską i opiniami recenzentów można się zapoznać
w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30




Analiza źródeł defektów działania aplikacji dużej skali w chmurze obliczeniowej


mgr inż. Bartosz Żurkowski


Promotor: prof. dr hab. inż. Krzysztof Zieliński (AGH)
Promotor pomocniczy: dr inż. Kazimierz Bałos (Samsung)
Dyscyplina: Informatyka Techniczna i Telekomunikacja


W ostatniej dekadzie architektura mikroserwisów stała się głównym nurtem tworzenia aplikacji realizujących złożone procesy biznesowe. Aplikacje te ewoluowały w złożone siatki usług składające się z setek serwisów rozproszonych w wielowarstwowym środowisku chmury obliczeniowej. Jednocześnie, ilość oraz różnorodność danych telemetrycznych generowanych przez te systemy w połączeniu z wysoką częstotliwością zmian charakterystyczną dla środowiska chmurowego stwarzają trudne wyzwanie w lokalizowaniu przyczyn awarii. Prowadzi to do częstych naruszeń jakości usług stanowiąc przeszkodę w zapewnieniu gwarancji parametrów wydajności oraz dostępności. Nowoczesne systemy wymagają opracowania rozwiązania zdolnego do zapewnienia wieloaspektowego wglądu w wielowarstwową architekturę aplikacji oraz wdrożenia mechanizmów umożliwiających zautomatyzowaną analizę przyczyn awarii (Root Cause Analysis - RCA) z przejrzystym wytłumaczeniem ich przebiegu dla operatora.

Teza rozprawy:– Jako tezę niniejszej rozprawy doktorskiej autor przedstawia następujące stwierdzenie:

Synergia metod korelacji symptomów oraz aktywne gromadzenie wiedzy dot. struktury oraz zachowania systemu umożliwia zbudowanie rozwiązania RCA będącego w stanie w sposób automatyczny identyfikować źródła złożonych defektów działania aplikacji dużej skali w chmurze obliczeniowej.

W szczególności omawiana praca dotyczy opracowania oraz weryfikacji całościowej metody diagnostycznej dedykowanej dla aplikacji chmurowych. Kluczowym elementem metody jest proces aproksymacji zależności przyczynowo-skutkowych między analizowanymi symptomami przez konsolidację wybranych metod korelacji. Realizacja rozwiązania wiąże aspekty statystyczne z aspektami strukturalnymi obserwowanego systemu zapewniając holistyczny wgląd w przebieg awarii.

W rezultacie główne wyniki badań można podsumować w następujący sposób:

  • Definicja wymagań dotyczących analizy defektów działania aplikacji dużej skali w chmurze obliczeniowej.
  • Eksploracja istniejących rozwiązań RCA oraz określenie ich istotnych ograniczeń w kontekście zdefiniowanych wymagań.
  • Opracowanie koncepcji rozwiązania RCA adresującej zidentyfikowane ograniczenia.
  • Realizacja metodologii korelacji symptomów, która przez konsolidację metod analitycznych rozpatrujących awarię w wielu płaszczyznach działania aplikacji, stanowi skuteczną aproksymację zależności przyczynowo-skutkowych między symptomami.
  • Realizacja modelu RCA obejmującego zestaw struktur danych zapewniający holistyczny wgląd w strukturę systemu oraz semantykę występujących w nim symptomów.
  • Realizacja algorytmu wnioskowania, który przy użyciu przyjętej metodologii korelacji symptomów oraz w oparciu o skonstruowany model RCA, w sposób zautomatyzowany, dokonuje diagnozy przyczyn obserwowanych awarii.
  • Wdrożenie prototypu rozwiązania implementującego kompletny proces diagnostyczny.
  • Praktyczna ocena przygotowanego prototypu w rzeczywistych scenariuszach awarii.

Wyniki badań potwierdzają, że automatyzacja procesu diagnozowania przyczyn awarii w chmurze obliczeniowej jest możliwa a przyjęta koncepcja użycia synergii metod korelacji zapewnia skuteczny mechanizm wnioskowania zależności między symptomami na potrzebę rekonstrukcji trajektorii awarii. Dodatkowo, szereg szczegółowych rozważań i wniosków w zakresie projektowania i realizacji elementów rozwiązania stanowi podstawę do budowy przyszłych systemów produkcyjnych omawianej klasy.

Rozprawa doktorska stanowi część programu Ministerstwa Edukacji i Nauki „doktorat wdrożeniowy” rozwijanego we współpracy z firmą Samsung R&D Institute Poland.



Praca udostępniona publicznie:

Analiza źródeł defektów działania aplikacji dużej skali w chmurze obliczeniowej

Recenzje:

Recenzja prof. dr hab. inż. Krzysztof Goczyła

Recenzja prof. dr hab. inż. Jerzy Brzeziński


2022/bzurkowski/start.txt · ostatnio zmienione: 2022/10/11 10:10 przez Bartosz Żurkowski