Kinijos mokslininkai sukūrė didžiulę 3D veidų duomenų bazę ir naują dirbtinio intelekto modelį, kuris leidžia robotams nustatyti pagrindinius veido taškus nenaudojant 2D vaizdų ar skaitmeninių šablonų. Tai padeda humanoidams natūraliau atpažinti žmones, perteikti emocijas ir sąveikauti.
Šią sistemą sukūrė profesoriaus Songo Zhango komanda iš Kinijos mokslų akademijos Šendženo Pažangiųjų technologijų instituto ir daktaro Ye Yupino tyrėjai iš Fudziano technologijos universiteto. Jie sukūrė sprendimą, leidžiantį rinkti 3D ir 4D veido duomenis, ir suformavo duomenų bazę iš maždaug 200 000 itin tikslių 3D skenų.
Duomenų bazėje sukaupti įvairių veido išraiškų skenai, veido orientyrai, itin tikslūs viso kūno 3D modeliai ir dinamiškos 4D veido išraiškos. Šis rinkinys atrinktas į Fudziano provincijos programą „Aukštos kokybės DI duomenys 2025“.
Vietoje darbui su tekstūruotais vaizdais įprastų metodų mokslininkai sukūrė CF-GAT tinklą, kuris apdoroja taip vadinamus „taškų debesis“ – koordinačių rinkinius, aprašančius veido geometriją be tekstūrų. Modelis koncentruojasi į vietines formos detales ir kartu įvertina bendrus veido struktūros ryšius, todėl tampa atsparesnis triukšmui ir tikslesnis nustatant smulkias ypatybes.
Bandymuose CF-GAT parodė geresnį gebėjimą prisitaikyti prie skirtingų veido formų ir tiksliau nustatyti pagrindinius veido taškus. Tai itin svarbu kuriant realistiškas veido išraiškas ir tikslų judesių sekimą. Tyrimo rezultatai rodo, kad dideli ir detalūs realių duomenų rinkiniai reikšmingai pagerina algoritmų veikimą.
Pasak tyrėjų, ši technologija gali padaryti humanoidinius robotus gerokai natūralesnius, patikimesnius ir „žmogiškesnius“. Ji taip pat gali būti plačiai pritaikoma biometrinėse atpažinimo sistemose ir virtualiuose avataruose, naudojamuose pramogų industrijoje, sveikatos priežiūroje ir paslaugų sektoriuje.
