SIG AI w Poznaniu – prosimy o więcej!

Spotkanie stanowiło okazję, by podzielić się pomysłami, doświadczeniami i najlepszymi praktykami w zakresie #AI wykorzystywanymi przez wiodące instytucje naukowo-badawcze w Europie. Wśród prelegentów, z ramienia PCSS, znaleźli się: Bartosz Belter z Działu Sieci Nowych Generacji, Cezary Mazurek z Działu Medycyny Cyfrowej, Tomasz Hoffman z Działu Bibliotek Cyfrowych i Platform Wiedzy oraz Marcin Wolski z Działu Inżynierii Danych i Platform Analitycznych.

Marcin Wolski pełnił jednocześnie funkcję koordynatora wydarzenia i opowiedział nam o kulisach inicjatywy SIG-AI: – Grupa robocza SIG-AI, działająca pod auspicjami GÉANT, zawiązała się na przełomie tego roku. Pomysł organizacji pierwszego spotkania grupy w Poznaniu narodził się pod koniec sierpnia, podczas jednej z rozmów dotyczących pierwszych działań grupy. Niewątpliwym atutem naszego miasta były i są nadal lokalizacja, która pozwala w łatwy i szybki sposób dotrzeć z różnych zakątków Europy, niebywała gościnność jego mieszkańców, pyszne tradycje kulinarne, jak również uznanie PCSS jako centrum badawczo-rozwojowego ICT i NRENu. Spotkanie stanowiło okazję, by wspólnie podzielić się pomysłami, doświadczeniami i najlepszymi praktykami w zakresie AI wykorzystywanymi przez wiodące instytucje naukowo-badawcze w Europie.

W ramach spotkania przedstawiciele różnych NRENów takich jak GRNet, Surf, NORDUnet czy DFN CERT przedstawili strategie rozwoju usług i aplikacji AI. Dużym zainteresowaniem cieszyły się ponadto prezentacje technologiczne, w których eksperci przybliżyli zaawansowanie aspekty wykorzystania AI np. w obszarze cyberbezpieczeństwa. Eksperci z PCSS przedstawili szeroki wachlarz usług i projektów zastosowania AI w obszarze sieci nowej generacji, medycynie, edukacji, przemyśle oraz nauk humanistycznych.

Tomasz Hoffman omówił zastosowanie AI w obszarze humanistyki cyfrowej i szeroko pojętego dziedzictwa kulturowego. Jak sam mówi: – Moja prezentacja skupiona była wokół naszych dotychczasowych doświadczeń z użyciem modeli AI. Wybrałem dwa konkretne przykłady ich użycia: wyszukiwanie muzyczne w zbiorach FBC (projekt FBC TENE) oraz upraszczanie języka pism urzędowych (projekt Proste Pismo). W przypadku wyszukiwania muzycznego skupiłem się na zastosowaniu wytrenowanego przez nas modelu OMR (Optical Music Recogniction). W tym w szczególności o zbiorze treningowym obejmującym około 700 tys. ręcznych anotacji nut. Pokazałem, jak wygląda interfejs wyszukiwawczy, który zamiast pola tekstowego zawiera mini klawiaturę pianina, na której można podać nuty wyszukiwanej sekwencji muzycznej. W rezultacie uzyskujemy wszystkie utwory, które zawierają daną sekwencję dźwięków (niezależnie od wariantu), a także kontekst, gdzie znaleziono dopasowanie.

Równie interesujący dla uczestników SIG – AI był kontekst związany z Prostym Pismem i opowieść Tomka o współpracy z Urzędem Miasta Poznania i Uniwersytetem im. Adama Mickiewicza.

– Podjęliśmy się zadania przygotowania narzędzia dla językoznawców i ekspertów, które posłuży do sprawnego upraszczania treści pism. Powiedziałem o tym, że pierwotnie to miała być baza pism i narzędzie do gromadzenia zmian eksperckich, budowania słownika, a później, jak pojawił się chat GPT uznaliśmy, że jesteśmy w stanie na zgromadzonym zbiorze danych dotrenować model typu Transformers (z tej samej rodziny, co chat GPT), który mógłby automatycznie upraszczać tekst. Wspominałem o rozmiarze zbioru treningowego (około 25 tys. ręcznych podmian fraza -> fraza) i drugie tyle syntetyzowanych automatycznie i tylko zweryfikowanych przez ekspertów. Wskazałem jak mierzymy prostotę języka – indeks FOG (mglistości tekstu) oraz indeks Pisarka (dedykowany dla języka polskiego) – wyjaśnia Tomasz.

Ważną rolę w wydarzeniu odegrali także jego odbiorcy. Maksymilian Marcinowski z Działu Bezpieczeństwa ICT zauważył znaczący postęp w dziedzinie rozwoju sztucznej inteligencji. – Porównując na przykład z grudniem 2022, okazuje się, że dwa lata w branży AI mogą być całą epoką. Żeby nadążać za tak szybkim tempem rozwoju, potrzebne są nie tylko własne samodzielne projekty, czy śledzenie i stosowanie opracowanych w innych ośrodkach nowinek, ale też pewne usprawnienie działań, które wynika ze współdzielenia wiedzy i doświadczeń, czy to wewnętrznie, czy też z innymi instytutami. Takie założenie stało u podstaw pierwszego w historii spotkania grupy SIG-AI (Special Interest Group on Artificial Intelligence for NRENs. Spotkanie ukazało z mojej perspektywy kilka znaczących faktów. Po pierwsze wachlarz inicjatyw związanych z zastosowaniami sztucznej inteligencji w ramach sieci GEANT jest bardzo szeroki. Wśród projektów innych ośrodków pojawiły się tematy monitoringu sieci, usprawniania edukacji, optymalizacji energetycznej czy też nawet stworzenie ojczystego (greckiego w tym przypadku) dużego modelu językowego. Po drugie – “dziękujemy, prosimy o więcej” – potrzeba kooperacji przy nowych, wspólnych inicjatywach związanych z AI jest bardzo duża, moderowana dyskusja pokazała jak wiele use case’ów dla zastosowań AI siedzi w naszych głowach, a nawet, że nie zawsze mamy świadomość, jak szerokie mogą one być, dopóki nie wymienimy się doświadczeniami w tym zakresie – wyjaśnia Maksymilian.

Kolejne spotkanie grupy SIG-AI jest planowane na kwiecień 2025 roku, podczas GÉANT Security Days w Pradze, gdzie jako sieć PIONIER planujemy również wystąpić.

Karolina Michalak