Googleov algoritam za ručno praćenje u stvarnom vremenu koristi pametni telefon za poboljšanje prepoznavanja znakovnog jezika

Teh / Googleov algoritam za ručno praćenje u stvarnom vremenu koristi pametni telefon za poboljšanje prepoznavanja znakovnog jezika 2 minute čitanja Praćenje ruku u stvarnom vremenu

Praćenje ruku u stvarnom vremenu



Znakovni jezik koriste milijuni ljudi širom svijeta. Istraživači rade na stvaranju tehnologija koje mogu razumjeti geste i automatski ih pretvoriti u jezik razumljiv čovjeku. Međutim, takvi projekti nisu postigli golem uspjeh u pogledu točnosti.

Google je nedavno razvio algoritam koji se može koristiti za praćenje ruku u stvarnom vremenu. Inteligentni sustav koristi strojno učenje za stvaranje mape ruke. Karta se kreira uz pomoć fotoaparata ili pametnog telefona. Ne možemo poreći činjenicu da većina sustava ne uspijeva točno uhvatiti brze pokrete ruku. Google se u ovom istraživanju posebno pozabavio ovim problemom. Zanimljivo je da su ograničili količinu podataka koje su algoritmi prethodno obrađivali.



Kako funkcionira praćenje ruku u stvarnom vremenu?

Većina postojećih projekata prevodi znakovni jezik otkrivanjem veličine i položaja kompletne ruke. Ovim istraživanjem. istraživači su eliminirali potrebu za rukovanjem pravokutnim oblicima različitih veličina. Googleov sustav samo prepoznaje dlan kvadratnog oblika. Drugo, za prste se radi zaseban postupak analize.



Google

Geste rukama



Istraživači su koristili oko 30.000 slika ruku kako bi uvježbali algoritam strojnog učenja. Te su slike snimljene u različitim uvjetima osvjetljenja i poziranja. Sustav zatim detektira gestu uspoređujući pozu ruke i popis poznatih entiteta poput lopte ili sreće. Google opisuje prepoznavanje gesta u a post na blogu .

Zatim mapiramo skup stanja prstiju u skup unaprijed definiranih gesta. Ova izravna, ali učinkovita tehnika omogućuje nam da razumnu kvalitetu procijenimo osnovne statičke geste. Postojeći cjevovod podržava brojanje gesta iz više kultura, npr. Američki, europski i kineski, te razni ručni znakovi, uključujući 'Palac gore', zatvorenu šaku, 'OK', 'Rock' i 'Spiderman'.

Konačni algoritam praćenja ruku daje najsuvremenije rezultate u pogledu brzine i točnosti. Algoritam za pokretanje koristi okvir MediaPipe. Ova tehnika čini se velikim napretkom na području znakovnog jezika. Iako još uvijek ima puno prostora za poboljšanje. stvoriti bolje razumijevanje znakovnog jezika. Svatko može proširiti ovaj rad tako da koristi izraze lica i obje ruke kako bi postigao bolje rezultate.



Iako od Googlea nema vijesti, postoji mogućnost da Google može poboljšati ovu tehnologiju praćenja ruku u stvarnom vremenu kako bi je koristio u svojim proizvodima. U međuvremenu, ako se želite poigrati s kodom, jest javno dostupno na GitHubu .

Oznake google