MPC-Learning – bezpieczna sieć uczenia federacyjnego dla osiągnięcia wspólnego dobra
Projekt polega na stworzeniu – zamiast pracy z jednym scentralizowanym zbiorem danych – rozproszonego modelu obliczeniowego, umożliwiającego zachowanie prywatności i poufności danych oraz pozwalającego na przenoszenie automatycznych modeli uczenia maszynowego wszędzie tam, gdzie znajdują się dane.
Anonimizacja jest narzędziem zmniejszającym ryzyko w przypadku masowego pozyskiwania i przetwarzania danych osobowych. Polega ona na ukrywaniu informacji osobowych lub wrażliwych, umożliwiając ich ujawnienie bez naruszania praw osób do ochrony danych. Niemniej jednak zanonimizowane bazy danych są narażone na tzw. ataki reidentyfikacyjne, polegające na próbie wyśledzenia anonimowych zapisów poprzez zapisy innej powiązanej bazy danych lub źródła danych w celu wydobycia poufnych informacji.
W tym kontekście GMV uczestniczy w projekcie „MPC-Learning: bezpieczne i kontrolowane uczenie maszynowe metodą wymiany tajemnic”. Jest to projekt współfinansowany przez dział badawczo-rozwojowy GMV Secure e-Solutions oraz Ministerstwo Gospodarki i Transformacji Cyfrowej, którego celem jest rozwój technik matematycznych i obliczeniowych umożliwiających realizację obliczeń numerycznych bez konieczności udostępniania danych. „GMV odgrywa podwójną rolę w tym projekcie. Z jednej strony oferuje swoje doświadczenie z sektorów takich jak bankowość czy opieka zdrowotna, pomagając w ten sposób w tworzeniu przykładów zastosowań umożliwiających rozwiązywanie problemów klientów. Z drugiej strony GMV wnosi swoją wiedzę z zakresu nauki o danych – dziedziny odpowiedzialnej za opracowywanie bezpiecznych metod obliczeniowych. Synergia wynikająca z tego podejścia pozwoli na pomyślne sprostanie wyzwaniom tego projektu” – podkreśla Juan Miguel Auñón-García, Data Scientist z GMV Secure e-Solutions.
Projekt MPC-Learning zrodził się z następującego założenia: w wielu przypadkach istnieje zainteresowanie wymianą informacji ze strony kilku organizacji, tak aby każdy mógł uczyć się od każdego, lecz istnieją bariery dla tej wymiany, takie jak np. obowiązujące przepisy/regulacje prawne lub prawnie uzasadnione interesy. Multi-Party Computation (MPC) łączy podmioty (parties), które chcą przeprowadzić obliczenia (computation) bez konieczności ujawniania swoich danych i które mają przy tym świadomość, że współpraca jest niezbędna do osiągnięcia wspólnego dobra.
Projekt ma na celu stworzenie platformy uczenia federacyjnego oraz rozproszonego modelu obliczeniowego, który pozwoli zachować prywatność i poufność danych, przy czym w jego ramach partnerzy będą mogli w bezpieczny sposób doskonalić swoje modele Machine/Deep Learning, a wszyscy uczestnicy będą uczyć się od siebie nawzajem.