Doktoraty Wydziału IET

Zaproszenie na obronę pracy doktorskiej

DZIEKAN i RADA WYDZIAŁU INFORMATYKI, ELEKTRONIKI I TELEKOMUNIKACJI AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na publiczną dyskusję nad rozprawą doktorską mgr inż. Michała Wrzeszcz
Transparent Data Access in Federated Computational Infrastructures
Termin:	23 września 2019 roku o godz. 10:30
Miejsce:	Sala 1.19, ul. Kawiory 21, pawilon D-17
PROMOTOR:	prof. dr hab. inż. Jacek Kitowski, Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie
PROMOTOR POMOCNICZY:	dr hab. inż. Renata Słota, Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie
RECENZENCI:	dr hab. inż. Łukasz Szustak – Politechnika Częstochowska
	dr hab. inż. Paweł Czarnul, prof. n. PG – Politechnika Gdańska
Z rozprawą doktorską i opiniami recenzentów można się zapoznać w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30

Transparent Data Access in Federated Computational Infrastructures

mgr inż. Michał Wrzeszcz

Promotor: prof. dr hab. inż. Jacek Kitowski
Promotor pomocniczy: dr hab. inż. Renata Słota
Dyscyplina: Informatyka

Abstract

Current scientific problems require strong support from data access and management tools, especially in terms of data processing performance and ease of access. However, when analysing elements that influence user operations it is impossible to choose a single set of mutually non-exclusive features that satisfy all the requirements of data access stakeholders. Thus, the author has decided to study how a large-scale data access system should operate in order to meet the needs of a multiorganizational community.

The author has identified context, represented by metadata, as a key aspect of the solution. On this basis the author postulates that context awareness enables data to be provisioned to users in a transparent manner while maintaining quality of access. However, along with the growth of the environment in terms of round-trip times, metadata management becomes challenging due to access and/or management overheads, often resulting in bottlenecks. Thus, the author has identified and classified contextual metadata, taking into account consistency and synchronization models, utilizing BASE (Basic Availability, Soft-state, Eventual consistency) rather than ACID (Atomic, Consistent, Isolated, Durable) whenever possible.

This dissertation describes steps undertaken in order to validate the author's thesis, starting with analysis of the requirements of federated computational infrastructure stakeholders and shortcomings of existing data access tools. The core element of the thesis is a description of the Model of Transparent Data Access with Context Awareness (MACAS), designed to accommodate dynamic changes of factors which affect data access in order to provide the desired access characteristics to specific groups. To solve this complex task, the model introduces layers and cross-cutting concerns which cover different aspects of data access, such as interactions with diverse storage resources, users' interactions with the data access system, coordination of execution of multiple operations to utilize more than one storage system, efficient utilization of network resources, cooperation of resource providers and distribution of the environment.

The author also presents an implementation of proposed model that focuses on the ability to process large amounts of metadata, along with notifications which enable broad provisioning of up-to-date context information. The dissertation is concluded by a description of tests carried out in a federated environment, without any assumptions regarding the providers' mutual relationships. These tests validate the model's quality as well as its capability for adaptation to nonfederated environments.

Streszczenie

Aktualne problemy naukowe wymagają odpowiednich narzędzi zapewniających nie tylko wydajny dostęp do danych ale i łatwe zarządzanie danymi. Analizując elementy, które mają wpływ na operacje wykonywane przez użytkownika, nie jest jednak możliwe wybranie jednego zestawu funkcjonalności, który satysfakcjonuje wszystkich zainteresowanych dostępem do danych. W związku z tym autor zaproponował i poddał badaniom system dostępu do danych spełniający wymagania społeczności użytkowników zrzeszonych w wielu niezależnych organizacjach.

Autor zidentyfikował kontekst, reprezentowany jako metadane, jako kluczowy element rozwiązania, formułując tezę, że znajomość kontekstu umożliwia transparentne dostarczanie danych użytkownikom, utrzymując przy tym jakość dostępu. Jednak wraz z rozrastaniem się infrastruktury, zarządzanie metadanymi staje się coraz bardziej wymagające z powodu narzutów na synchronizację i/lub opóźnień w dostępie, które mogą doprowadzić do powstania wąskiego gardła w systemie dostępu do danych. W związku z tym autor zidentyfikował metadane opisujące kontekst i sklasyfikował je na podstawie modeli spójności i synchronizacji, w celu zapewnienia dostępności i efektywności kosztem transakcyjnego, atomicznego przetwarzania, tam gdzie jest to możliwe.

Rozprawa zawiera opis etapów realizowanych w celu weryfikacji sformułowanej w rozprawie tezy, zaczynając od analizy wymagań oraz niedoskonałości istniejących narzędzi zapewniających dostęp do danych. Głównym osiągnięciem pracy jest model transparentnego dostępu do danych z wykorzystaniem kontekstu (ang. Model of Transparent Data Access with Context Awareness - MACAS), który umożliwia dynamiczne zmiany parametrów wpływających na dostęp do danych, aby zapewnić pożądaną charakterystykę dostępu do danych przez poszczególnych użytkowników. Aby rozwiązać tak złożone zadanie, model składa się z warstw obejmujących różne aspekty dostępu do danych, takie jak interakcja z różnymi systemami składowania danych, interakcja użytkowników z systemem dostępu do danych, koordynacja wykonania wielu operacji w celu wykorzystania więcej niż jednego systemu składowania danych, wydajne wykorzystanie zasobów sieciowych, współpraca organizacji dostarczających zasoby dyskowe i obliczeniowe oraz rozproszenie środowiska.

Autor przedstawia także implementację proponowanego modelu, która koncentruje się na możliwości przetwarzania dużej ilości metadanych oraz powiadomień, które umożliwiają dostarczanie szerokich i aktualnych informacji kontekstowych. Na zakończenie prezentowane są testy w środowisku sfederowanym, które udowadniają jakość systemu utworzonego na bazie modelu, a także zdolność dostosowania modelu do niesfederowanych środowisk.

Doktoraty Wydziału IET

Zaproszenie na obronę pracy doktorskiej

Transparent Data Access in Federated Computational Infrastructures

Recenzje

Publikacje doktoranta

Doktoraty Wydziału IET

Narzędzia użytkownika

Narzędzia witryny

Zaproszenie na obronę pracy doktorskiej

Transparent Data Access in Federated Computational Infrastructures

Recenzje

Publikacje doktoranta

Narzędzia strony