DZIEKAN i RADA WYDZIAŁU INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE |
|
---|---|
zapraszają na publiczną dyskusję nad rozprawą doktorską mgr inż. Piotra Pawliczka |
|
Metody poprawiania efektywności algorytmu skalowania wielowymiarowego w kontekście wizualizacji dużych zbiorów danych |
|
Termin: | 10 października 2012 roku o godz. 14:00 |
Miejsce: | sala 1.36 w pawilonie D-17, ul. Kawiory 21 |
PROMOTOR: | Prof. dr hab. inż. Witold Dzwinel, Akademia Górniczo-Hutnicza |
RECENZENCI: | Dr hab. inż. Bogdan Kwolek, prof. nadzw. PRz, Politechnika Rzeszowska |
Dr hab. inż. Krzysztof Boryczko, prof. nadzw. AGH, Akademia Górniczo-Hutnicza | |
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30 |
mgr inż. Piotr Pawliczek
Promotor: prof. dr hab. inż. Witold Dzwinel (AGH)
Dyscyplina: Informatyka
Szybki rozwój techniki komputerowej umożliwia coraz łatwiejsze i tańsze gromadzenie wielkich ilości danych. Z jednej strony pozwala to na pozyskiwanie większej ilości informacji o badanych zjawiskach, z drugiej prowadzi do coraz większych problemów z ich przetwarzaniem i analizą. Często z powodu zbyt dużej ilości danych trudno jest pozyskać z nich poszukiwane informacje.
Elementy przetwarzanych zbiorów danych często są reprezentowane przez wektory cech. Wprowadzenie odpowiedniej metryki do takiej przestrzeni pozwala na obliczenie odległości pomiędzy wektorami cech, a tym samym określenie podobieństwa pomiędzy nimi. Jednym z istotnych aspektów jest potrzeba wizualizacji tego typu danych, co pozwoliłoby wprawnemu operatorowi na szybkie wychwycenie niektórych ich własności. W ciągu kilkudziesięciu lat rozwoju narzędzi przetwarzania danych opracowano szereg różnego typu metod służących do wizualizacji zbiorów wielowymiarowych wektorów. Jedną z najważniejszych jest ekstrakcja nieliniowa reprezentowana przez popularny algorytm (grupę algorytmów) skalowania wielowymiarowego (ang. Multidimensional Scaling), oznaczany również skrótem MDS.
Jako tezy niniejszej rozprawy doktorskiej autor przedstawia następujące twierdzenia:
1. Istnieje równoległy algorytm MDS, który pozwala na mapowanie dużych zbiorów danych (n>100000) poprzez rozproszenie obliczeń w środowisku klastra komputerów. Obliczenia w obrębie pojedynczego węzła mogą być efektywnie przyśpieszone poprzez ich rozdzielenie na wiele procesorów (w architekturze SMP) lub wykorzystanie współczesnych procesorów graficznych.
2. Odpowiedni wybór elementów macierzy odległości D uwzględnianych podczas skalowania wielowymiarowego powoduje, że ze wzrostem ilości wektorów n w zbiorze danych, ilość elementów macierzy odległości potrzebnych do uzyskania zadanego błędu względnego rośnie znacznie wolniej niż n*n. Pozwala to na poprawienie złożoności obliczeniowej algorytmu MDS.
Autoreferat: autoreferat.pdf.
Ważniejsze publikacje doktoranta: