Trzech studentów z naszego wydziału wystąpiło w finale HackING – hackathonu ING Banku Śląskiego. Zespół z WIT w składzie: Ireneusz Placek, Bartosz Procki oraz Bartłomiej Koba zajął drugie miejsce i wygrał 6 tysięcy złotych. Gratulujemy!
Hackathon rozpoczął się 18 maja w formacie online i trwał 48 godzin. Rywalizowało w nim 30 zespołów, tworzonych przez niespełna 100 studentów kierunków technicznych z całej Polski. Przy wsparciu doświadczonych mentorów i ekspertów, zespoły pracowały nad stworzeniem najcelniejszego modelu rozpoznawania i klasyfikacji dokumentów na podstawie spreparowanych danych w postaci tekstów i skanów. Na zwycięzców czekały nagrody pieniężne z puli 20 tysięcy złotych.
Celem hackathonu była budowa społeczności skupionej wokół rozwiązań AI oraz przybliżenie młodym talentom zagadnień związanych z wykorzystaniem źródeł danych, technologii i narzędzi w instytucjach finansowych. W pierwszej edycji uczestnicy konkursu mogli zapoznać się z nowoczesnymi technikami oraz dowiedzieć jak wygląda praca w IT w banku.
Drużynę o nazwie Drapaki współtworzyli studenci drugiego roku Inżynierii Systemów I stopnia. Ireneusz Placek, Bartosz Procki oraz Bartłomiej Koba zajęli drugie miejsce i wygrali nagrodę pieniężną o wartości 6 tysięcy złotych.
Zadanie polegało na kategoryzacji ok. 3500 dokumentów w języku polskim i angielskim do 21 różnych kategorii za pomocą dowolnego algorytmu klasyfikacji przy użyciu języka Python – wyjaśniał jeden z członków drużyny. Jego zespół miał otrzymać nagrodę przede wszystkim za dokładność w klasyfikacji algorytmu, ale dodatkowe punkty przeniósł im również czysty i czytelny kod.
– Nasz projekt używał wstępnej kategoryzacji językowej (Algorytm OCR Google'a + modele językowe do rozpoznania języka) do podziału dokumentów na kategorie polskie i angielskie, ponieważ w przypadku polskich dokumentów były one mocno schematyczne i w przypadku ich kategoryzacji algorytm opierał się na wektorach własnych najczęściej występujących słów dla każdej klasy (np w przypadku PITu słowo PIT pojawiało się bardzo często). Natomiast w przypadku dokumentów w języku angielskim nasz algorytm opierał się na wyuczonych na ok. 9000 dokumentach treningowych modelach algorytmów CNN (zdjęcia) i RNN (wcześniej wczytany tekst) – doprecyzowywał Ireneusz Placek.
Kod stworzony przez studentów WIT w finale hackathonu ING możecie zobaczyć tutaj.