PDF Basket
Od odkrywania i opracowywania leków po medycynę spersonalizowaną – sztuczna inteligencja (SI) ma ogromny potencjał w naukach przyrodniczych. Znaczna jego część pozostaje jednak niewykorzystana. Integrację SI jest często utrudnia złożoność techniczna i brak ustandaryzowanych danych.
Wyzwaniom tym stawia czoła zespół projektu AI4LIFE, prowadzony przez Dorotheę Dörr, kierowniczkę naukową projektu w Euro-BioImaging w Finlandii. „Wdrażanie i wykorzystywanie modeli SI często wymaga zaawansowanej wiedzy specjalistycznej w zakresie programowania, metod uczenia maszynowego, a nawet infrastruktury obliczeniowej, której wielu naukowców zajmujących się naukami przyrodniczymi nie ma”, mówi. „Ta luka w wiedzy sprawia, że duża grupa badaczy nie jest w stanie w pełni wykorzystać możliwości SI”.
Zespół AI4LIFE tworzy przyjazne dla użytkownika platformy, dzięki którym narzędzia SI i zbiory danych są dostępne nawet dla osób niemających doświadczenia w naukach obliczeniowych. Ułatwią one analizę obrazów biologicznych, takich jak mikroskopowe skany próbek tkanek. Systemy te umożliwiają badaczom wykorzystanie SI do skomplikowanych zadań, takich jak segmentacja, wykrywanie obiektów i ekstrakcja cech.
Projekt koncentruje się w szczególności na zasadach FAIR (możliwe do znalezienia, dostępne, interoperacyjne i nadające się do ponownego wykorzystania) w odniesieniu do zestawów danych i modeli obrazów gotowych do wykorzystania SI. „Aby SI była skuteczna w naukach przyrodniczych, zbiory danych wykorzystywane do trenowania modeli SI muszą być nie tylko obszerne i wysokiej jakości, ale także spełniać zasady FAIR i być przygotowane do współpracy z SI”, wyjaśniają Anna Kreshuk i Florian Jug, koordynatorzy naukowi projektu.
Oznacza to, że dane są formatowane, czyszczone i znakowane tak, aby można było je łatwo wykorzystać do trenowania nowego lub zasilania już istniejącego modelu SI. W tym celu w projekcie AI4LIFE opracowano standard adnotacji zestawów danych obrazów gotowych do współpracy z SI. Takie rozwiązanie sprzyja współpracy i wtórnemu wykorzystaniu, a jednocześnie zmniejsza potrzebę ponownego przetwarzania danych przez poszczególnych badaczy, tym samym obniżając koszty obliczeniowe.
Współpraca i otwarta nauka
Konsorcjum AI4LIFE rozwija oparte na społeczności repozytorium zgodnych z zasadami FAIR modeli SI do analizy obrazów biologicznych, noszące nazwę BioImage Model Zoo. „Modele SI opracowywane w projekcie AI4LIFE są tworzone wspólnie przez naukowców zajmujących się naukami przyrodniczymi i ekspertów w dziedzinie SI”, wyjaśniają Kreshuk i Jug. „Daje to pewność, że są one najnowocześniejsze i dostosowane do rzeczywistych potrzeb badań z zakresu nauk przyrodniczych”.
Repozytorium nie tylko umożliwia naukowcom dostęp do wstępnie wytrenowanych modeli, które mogą być wdrażane przy użyciu popularnych narzędzi do analizy obrazu, ale także zachęca ich do tworzenia własnych, aby budować dynamiczny ekosystem narzędzi, które mogą być ponownie wykorzystywane i dostosowywane w różnych dziedzinach badań.
Dowodem na otwarty i oparty na współpracy charakter inicjatywy są także innowacyjne przypadki użycia. Jednym z przykładów jest program otwartych zaproszeń do składania wniosków, w ramach którego projekt AI4LIFE oferuje wsparcie na potrzeby prowadzenia analiz obrazu opartej na uczeniu głębokim, ukierunkowanej na zaspokojenie konkretnych potrzeb badawczych. Program ten pomógł już zautomatyzować skomplikowane, pracochłonne zadania, dzięki czemu naukowcy mogą skupić się na interpretacji danych biologicznych zamiast na zajmowaniu się szczegółami technicznymi. „Poprzez wykorzystanie uczenia głębokiego naukowcy mogą dokładniej i bardziej efektywnie analizować duże i złożone zbiory danych”, mówią Kreshuk i Jug, zwracając uwagę zwiększenie wydajności możliwe dzięki rozwiązaniom AI4LIFE.
W ramach projektu ogłoszono też otwarty konkurs na opracowanie najlepszych metod sztucznej inteligencji w celu poprawy jakości obrazów mikroskopowych. Konkursy pozwalają twórcom udoskonalać swoje metody i dają uczonym zajmującym się naukami przyrodniczymi możliwość zapoznania się z najbardziej skutecznymi dostępnymi narzędziami. Sprzyja to innowacjom oraz zwiększa widoczność najlepszych rozwiązań, ułatwiając ich wprowadzenie w całym środowisku naukowym.
Dbanie o długofalowy wpływ
Oprócz opracowywania modeli SI zespół projektu AI4LIFE zajmuje się angażowaniem społeczności i działaniami informacyjnymi, aby zmaksymalizować oddziaływanie opracowywanych w jego ramach rozwiązań. „Zespół aktywnie uczestniczy w szeroko zakrojonych działaniach upowszechniające, organizując szkolenia i prezentacje dla naukowców”, mówi Dörr. Dzięki nim naukowcy zajmujący się naukami przyrodniczymi na wszystkich szczeblach kariery mogą zdobywać umiejętności potrzebne do wykorzystania SI w badaniach.
Ponadto zespół AI4LIFE regularnie publikuje wyniki swoich badań w czasopismach o otwartym dostępie i prezentuje ich wyniki na międzynarodowych konferencjach. To otwarte podejście pozwala na wykorzystanie modeli AI4LIFE także innym naukowcom.
Współpraca z projektem AI4EOSC pomaga z kolei wspierać rozwijanie nowych zastosowań na potrzeby europejskiej infrastruktury. Włączenie modeli SI do ram europejskiej chmury dla otwartej nauki sprawi, że będą one łatwo dostępne i skalowalne, a partnerstwa z przemysłem zapewnią, że rozwiązania AI4LIFE przyniosą korzyści nie tylko w dziedzinie badań akademickich, ale także praktycznych zastosowań tworzonych w różnych sektorach.
Dzięki ułatwianiu dostępu do SI, wspieraniu współpracy i stosowaniu zasad otwartej nauki projekt AI4LIFE przygotowuje grunt pod transformacyjne postępy w badaniach z zakresu nauk przyrodniczych w całej Europie. Dörr tłumaczy: „Przestrzeganie zasad FAIR daje pewność, że modele SI mogą być łatwo ponownie wykorzystywane i dostosowywane przez innych badaczy do ich własnych danych”. Dzięki takim wysiłkom projekt AI4LIFE przyczynia się do budowy nowej ery, w której narzędzia SI będą nie tylko najnowocześniejsze, ale także dostępne dla wszystkich, niezależnie od posiadanej wiedzy technicznej.