Millora de les aplicacions d'observació de la Terra mitjançant dades sintètiques

GMV ha conclòs amb èxit el seu projecte SD4EO, una iniciativa d'investigació desenvolupada amb la col·laboració del grup ARTEC de la Universitat de València i finançada pel programa FutureEO de l'Agència Espacial Europea.
El projecte «Synthetic Data for Earth Observation» té com a objectiu demostrar els avantatges de la integració de dades físiques i basades en IA en les aplicacions d'observació de la Terra (EO). SD4EO s'ha centrat en dos tipus de simulació:
Processament físic. El grup ARTEC va utilitzar el motor gràfic Unity per generar imatges sintètiques realistes mitjançant la simulació precisa del comportament de la llum i les característiques dels sensors.
Simulació mitjançant IA. GMV va implementar models avançats de difusió condicional, començant per la distribució estadística aleatòria i modelada de manera iterativa amb obstacles, permetent així l'evolució de les característiques per assemblar-se a la imatge o senyal de l'objectiu.
Les dades sintètiques es van integrar amb dades reals d'EO en pipelines de dades impulsats per IA per explorar el seu potencial per millorar el rendiment en aplicacions de categorizació d'objectius:
Categorizació de camps de conreu. La integració de dades sintètiques va mantenir o va millorar lleugerament el rendiment en la classificació. La combinació de dades sintètiques de cultius rars únicament (civada i alfals) amb dades EO reals va oferir la màxima precisió i va destacar l'efectivitat de les dades sintètiques dirigides per abordar reptes relacionats amb la classificació en tasques multiclasse.
Categorizació d'assentaments humans. La integració va millorar el rendiment general en la detecció de zones urbanitzades. Els resultats prometedors obtinguts utilitzant només dades sintètiques garanteixen noves investigacions, especialment en casos en què és complicat obtenir dades EO reals.
- Seguiment de panells fotovoltaics. El rendiment dels models va millorar en termes generals; no obstant això, l'ús de conjunts de dades físiques i basades en IA va proporcionar els millors resultats. Els descobriments indiquen que la quantitat adequada de dades sintètiques pot millorar el rendiment dels models i que la quantitat ideal varia en funció de la distribució i el volum de les dades.
Aquests resultats prometedors estableixen les bases per a investigacions més detallades, com la depuració de dades sintètiques i la realització d'experiments addicionals que permetin entendre millor els avantatges en aplicacions EO. Els conjunts de dades simulats i les eines utilitzades s'han posat a disposició del públic per fomentar noves investigacions i desenvolupaments:
Les dades sintètiques generades estan disponibles a Zenodo.
El codi per generar les dades físiques i les dades basades en IA està disponible a GitHub.