Ve srovnání s předchozími modely se ukazuje nový algoritmus strojového učení jako přesnější, což může lépe pomoci při humanitárním úsilí.
V průběhu občanské války v Sýrii, která zuří od roku 2011, roste počet vysídlených uprchlíků alarmující měrou. Uprchlický tábor v Rukbanu u jižní hranice země s Jordánskem je jedním z příkladů, které otvírající oči. Podle dat Spojených národů se počet stanů uprchlíků v oblasti zvýšil ze zhruba 132 na 11 702 (!) v průběhu čtyř let (2015- 2019).
Schopnost monitorovat rozšiřování uprchlických táborů je důležité pro humanitární plánování a přidělování zdrojů. Ale mít spolehlivý přehled o počtech se ukazuje náročné, když se tábory natolik rozrostou. Na podporu těchto snah bylo vytvořeno několik modelů, které analyzují satelitní data a odhadují obyvatelstvo táborů podle počtu napočítaných stanů. Jeden nedávný výzkumný projekt financovaný vládní agenturou DARPA vedl k vytvoření nového algoritmu strojního učení s vysokou precizností a přesností. (V tomto případě je preciznost a přesnost úzce souvisí, ale nejsou to synonyma. Přesnost znamená poměr všech správně identifikovaných pixelů, se stany a bez nich; preciznost je správná identifikace pixelů obsahujících pouze stany).
Jiang Li, profesor na Univerzitě Old Dominion, je spolutvůrcem nového modelu. Program byl vyškolen a testován pomocí satelitních dat mezi dvěma časovými body v letech 2016 a 2017. Program vezme satelitní snímky a rozloží je na náhodné kousky, přičemž z nich získá spektrální a prostorové informace. Filtry pomáhají klasifikovat data na úrovni pixelů. Tento přístup bývá označován jako model plně konvoluční sítě (FCN).
Ve své studii vědci srovnávali svůj model FCN s několika dalšími modely a zjistili mírný nárůst v přesnosti a značný nárůst v preciznosti. Jejich model byl až o 4,49 % přesnější než jiné a preciznější dokonce o 41,99 %.
„Ve validačních údajích bylo při manuálním označování napočítáno 775 stanů, zatímco náš model FCN našel 763 stanů s chybou 1,55 %,” říká Li. „Všechny ostatní konkurenční modely mají chybovost od 12,9 do 510,9 % (to znamená, že napočítali drasticky vyšší počty stanů), a jsou přesnější.”
S vytvořeným modelem teď profesor Li a jeho tým čekají na pokyny z vládní agentury DARPA, než nástroj zavedou do prostředí reálného světa.
„Jsme si jistí, že reálné použití našeho nového modelu bude vyžadovat, abychom se spojili s některými potenciálními uživateli, jako je UNOSAT, americké Ministerstvo vnitřní bezpečnosti a další vládní agentury. Tento proces bude vyžadovat čas. V každém případě je náš model obecný a může být použit i v jiných aplikacích, např. pro zhodnocení škod po povodni či hurikánu, zjišťování změn ve městech atd..“
I když model může být použit i v dalších aplikacích, profesor Li upozorňuje, že to může být namáhavý proces. Jeho tým se spoléhal na existující databázi označených obrazových dat, aby vytvořil model FCN snímající stany, ale adaptace modelu pro jiné účely může vyžadovat manuální označování nového datasetu relevantních zobrazení.
„Problém hladu po datech v současnosti znamená velkou překážku pro tento typ aplikace. Zkoumáváme nejmodernější strategie rozšiřování dat a metody aktivního učení jako alternativy, abychom mohli dále zlepšit účinnost školení,” říká Li.