Wydział Informatyki i Telekomunikacji

Najlepsza praca doktorska o sztucznej inteligencji powstała na WIT

Data: 25.05.2022

Wpis może zawierać nieaktualne dane.

Dr inż. Paweł Zyblewski z naszego wydziału zdobył główną nagrodę w konkursie Polskiego Stowarzyszenia Sztucznej Inteligencji na najlepszą polską pracę doktorską z zakresu AI w 2021 r. Gratulujemy!

GrafikaJury doceniło jego pracę „Classifier selection for imbalanced data stream classification (Selekcja klasyfikatorów w zadaniu klasyfikacji niezbalansowanych strumieni danych)”, której promotorem był prof. Michał Woźniak z Katedry Systemów i Sieci Komputerowych.

Paweł Zyblewski– Tematyka mojej rozprawy doktorskiej jest ściśle powiązana z realizowanym na PWr projektem „Algorytmy klasyfikacji niezbalansowanych strumieni danych” finansowanym przez Narodowe Centrum Nauki – mówi dr inż. Paweł Zyblewski. – Miał on na celu połączenie ze sobą dwóch istotnych trendów badawczych z dziedziny rozpoznawania wzorców w zakresie analizy tzw. danych trudnych, tj. klasyfikacji strumieni danych (ang. data stream classification) oraz klasyfikacji danych niezbalansowanych (ang. imbalanced data classification) – dodaje.

Dane niezbalansowane charakteryzują się odmienną liczbą obiektów należących do poszczególnych klas problemu, co znacząco utrudnia zadanie klasyfikacji w przypadku wykorzystania standardowych algorytmów, które posiadają tendencję do faworyzowania – często mniej dla nas istotnej – klasy większościowej.

Z kolei strumienie danych wymagają ciągłej poprawy wykorzystywanych modeli, ze względu na możliwość wystąpienia w nich zjawiska tzw. dryfu koncepcji (ang. concept drift). Zjawisko to może prowadzić do przesunięcia się granicy decyzyjnej problemu, a w konsekwencji do degeneracji zdolności decyzyjnej klasyfikatora w trakcie jego eksploatacji. Te niekorzystne z praktycznego punktu widzenia zaburzenia danych w konsekwencji wpływają negatywnie na prognozowanie wielu ważnych procesów gospodarczych, w tym wspomagania decyzji medycznych, logistycznych i konsumenckich.

GrafikaNasz naukowiec zdecydował się na zajęcie tym tematem m.in. ze względu na stosunkowo niewielką liczbę prac poruszających ten problem, pomimo tego, że rzeczywiste strumienie danych często mogą wykazywać się wysokim i dynamicznie zmieniających się stopniem niezbalansowania. Powoduje to rosnące zapotrzebowanie na projektowanie algorytmów zdolnych do radzenia sobie w tych trudnych warunkach.

– Aby poradzić sobie z tymi problemami, zaproponowałem metody bazujące na dynamicznej selekcji klasyfikatorów (ang. dynamic classifier selection), które dobierają skład zespołu klasyfikatorów (ang. classifier ensemble) w zależności od wartości miar kompetencji dla danego obiektu – wyjaśnia dr inż. Paweł Zyblewski. – Podejścia te zostały uzupełnione o techniki wstępnego przetwarzania danych (ang. data preprocessing), mające na celu zbalansowanie liczności klas analizowanych problemów w celu zredukowania stronniczości w stosunku do klasy większościowej – dodaje.

Celem pracy było wykorzystanie naturalnej zdolności algorytmów selekcji klasyfikatorów do radzenia sobie z niezbalansowaniem danych oraz zaproponowanie nowych, efektywnych rozwiązań rzadko poruszanego w literaturze problemu klasyfikacji wysoce niezbalansowanych strumieni danych.

W oparciu o te założenia w pracy sformułowana i uprawdopodobniona została hipoteza zakładająca, że istnieją metody wykorzystujące zarówno wstępne przetwarzanie danych, jak i metody selekcji klasyfikatorów, które przewyższają jakość predykcji znanych z literatury metod stosowanych w klasyfikacji danych trudnych.

Rozprawa doktorska dostępna jest w Dolnośląskiej Bibliotece Cyfrowej.

Pełne wyniki konkursu można znaleźć na stronie PSSI.

Dr inż. Paweł Zyblewski jest obecnie jednym z członków zespołu realizującego projekt SWAROG, którego celem jest opracowanie systemu wykrywającego źródła celowej dezinformacji.

W najbliższym czasie wyjedzie także na miesięczny staż naukowy na University of Birmingham w Wielkiej Brytanii w ramach współpracy z zespołem prof. Leandro Minku. Staż będzie dotyczył zastosowania uczenia półnadzorowanego w zadaniu klasyfikacji strumieni danych.

Galeria zdjęć

Politechnika Wrocławska © 2024

Nasze strony internetowe i oparte na nich usługi używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Ochrona danych osobowych »

Akceptuję