Technologia umożliwiła pozyskiwanie ogromnej liczby informacji o naszych interakcjach z innymi ale i stworzyła nowe wyzwania w zakresie wnioskowania. Dlatego badania interakcji społecznych wymagają nowych metod analitycznych bazujących na m.in. na strumieniach danych. Takich modeli poszukują nasi naukowcy z WIT.
Projekt „Modelowanie interakcji społecznych z wykorzystaniem strumieni danych” został dofinansowany w ramach prowadzonego przez NCN programu Opus. Badaniami pokieruje dr inż. Radosław Michalski z Katedry Sztucznej Inteligencji.
Technologia wpływa na relacje
Interakcje społeczne w sieci - grafika– Współczesne społeczeństwo jest silnie powiązane z technologią. Z jednej strony pozwala to m.in. na szybszy obieg wiedzy, ale z drugiej pojawiają się nowe wyzwania wynikające ze zmiany sposobu, w jaki nawiązujemy i utrzymujemy relacje międzyludzkie – mówi dr inż. Radosław Michalski. – Systemy teleinformatyczne stworzyły także niespotykane dotąd możliwości gromadzenia dużych danych, które wcześniej nie były dostępne – dodaje.
Trzeba przy tym pamiętać, że część tych danych jest generowana w sposób automatyczny, np. metadane o naszej komunikacji lub też informacje o lokalizacji. Ogromna jest także rola mediów społecznościowych, w których podstawową rolę odgrywa treść generowana przez użytkowników. Media te oprócz roli informacyjnej stały się także platformą, gdzie tworzymy relacje międzyludzkie, z których część także ma swoją kontynuację poza światem wirtualnym.
– Tego rodzaju dane umożliwiają prowadzenie analiz w dziedzinie nauk społecznych, które odpowiadają na liczne pytania dotyczące m.ni. dynamiki relacji międzyludzkich, formowania grup czy też wpływu społecznego. Jednak w wielu przypadkach nie jest to możliwe bez wsparcia innych dyscyplin. W przypadku tego rodzaju problemów, współpraca informatyków, socjologów i fizyków skutkuje często pozyskaniem nowej wiedzy dotyczącej funkcjonowania naszego społeczeństwa, szczególnie w obrębie komunikacji i interakcji międzyludzkich. To nie byłoby możliwe w tak dużej skali, gdyby nie dostępność danych dostarczanych przez nas samych oraz metod modelowania i symulacji oferowanych przez te dyscypliny – zauważa badacz.
Nie oznacza to jednak, że pozyskiwane w ten sposób informacje są jedynym sposobem na analizowanie relacji w naszym społeczeństwie. Wciąż powszechnie prowadzone są bowiem badania eksperymentalne na małych grupach i badania ankietowe. Można nawet powiedzieć, że oba podejścia uzupełniają się, na przykład poprzez możliwość weryfikacji słuszności obserwacji poczynionych w dużej skali na mniejszych grupach.
Więcej danych, więcej wyzwań
– Niewątpliwie ogromna ilość danych daje nam możliwość obserwacji zjawisk społecznych w zupełnie innej skali. Niestety podejście to ma także pewne ograniczenia, takie jak ograniczony zakres informacji (np. do pewnego medium komunikacyjnego), duża złożoność obliczeniowa czy częsty brak wiedzy o prawdziwych przyczynach pewnych decyzji (tzw. ground truth). Niektóre z nich już zostały rozwiązane, jednak inne ciągle wymagają dużego nakładu pracy naukowców – wyjaśnia dr inż. Radosław Michalski.
Bardzo częstym podejściem do modelowania i późniejszego wnioskowania o interakcjach między ludźmi jest wykorzystanie sieci społecznych. W tym wariancie badacze gromadzą informacje o interakcjach, budują z nich grafy reprezentujące sieci społeczne, a następnie dzięki technikom obliczeniowym, wyciągają wnioski o różnych zjawiskach.
Chociaż to podejście wciąż jest szeroko stosowane, to jednak dla niektórych problemów nie może być użyte. Dobrym przykładem jest tutaj np. wyszukiwanie istotnych węzłów w sieci lub metody maksymalizacji wpływu. Tego typu zagadnienia są wciąż zbyt złożone obliczeniowo, a dodatkowo wiele platform społecznościowych ogranicza dostęp naukowcom do pełnych zbiorów danych pozwalających na budowę grafów.
– W takiej sytuacji pojawia się pytanie, czy zamiast budować sieci, podejście bazujące wprost na strumieniach danych nie byłoby właściwsze. Jest ono bowiem bliższe temu, w jaki sposób dane są dostarczane – zaznacza dr inż. Radosław Michalski.
Co kryją strumienie danych?
Interakcje społeczne w sieci - grafikaI to właśnie zbadanie możliwości i wyzwań wykorzystania strumieni danych do modelowania interakcji społecznych zakłada projekt prowadzony przez naszych naukowców. Współpraca informatyków, socjologów i fizyków pozwoli przekonać się, w jakim stopniu strumienie danych umożliwiają opisanie tych relacji w taki sposób, aby możliwe było m.in. ich policzenie i zinterpretowanie - bez konieczności przechodzenia do etapu budowy sieci społecznej.
– W projekcie przeanalizowane zostanie kilka zjawisk społecznych, takich jak formowanie się grup, dyfuzja informacji lub wpływ społeczny. Będziemy bazować wprost na strumieniach danych jako podstawowym nośniku informacji, a efektem naszej pracy będą sposoby modelowania zjawisk społecznych – zapowiada dr inż. Radosław Michalski. – Opracowane rozwiązania będą mogły znaleźć zastosowanie w wielu obszarach, które badają, w jaki sposób funkcjonuje nasze społeczeństwo i jak się w nim komunikujemy – dodaje.
Aby zweryfikować wydajność i dokładność modeli i metod, naukowcy planują użyć wielu różnych źródeł danych, które zawierają informacje o interakcjach społecznych, takich jak media społecznościowe, lecz wychodząc poza nie, będą to także dane telekomunikacyjne, wirtualne światy czy też inne zbiory danych dostarczone przez partnerów projektu.
Badania będą realizowane we współpracy z socjologami z University of California Los Angeles (Stany Zjednoczone) oraz z informatykami i fizykami z Rensselaer Polytechnic Institute (Stany Zjednoczone), ISI Foundation (Włochy), Central European Univerisity (Austria) oraz University of Technology Sydney (Australia).
Projekt został rozpisany na trzy lata, a wysokość grantu NCN wynosi blisko 740 tys. zł.