Tijekom proteklih nekoliko desetljeća, istraživači su redovito razvijali uređaje namijenjene prevođenju američkog znakovnog jezika (ASL) na engleski jezik, nadajući se olakšanju komunikacije između gluhih i nagluhih ljudi. Mnoge od tih tehnologija koriste rukavice za hvatanje pokreta potpisivanja, što može biti glomazno i nespretno.
Sada je skupina istraživača sa Sveučilišta Michigan State (MSU) razvila uređaj bez rukavica veličine cijevi šipke za koji se nadaju da će poboljšati ASL-engleski prijevod.
Tehnologija, nazvana DeepASL, koristi kameru za snimanje pokreta ruke, a zatim podatke unosi pomoću algoritma dubokog učenja, koji je u skladu s znakovima ASL. Za razliku od mnogih prethodnih uređaja, DeepASL može prevesti čitave rečenice umjesto pojedinačnih riječi i ne zahtijeva da korisnici prave pauze između znakova.
"Ovo je doista nenametljiva tehnologija", kaže Mi Zhang, profesor elektrotehnike i računalnog inženjerstva koji je vodio istraživanje.
Zhang i njegov tim nadaju se da DeepASL može pomoći osobama gluhim i nagluvim služeći kao prevoditelj u stvarnom vremenu. To bi moglo biti osobito korisno u hitnim situacijama, kaže Zhang, kad bi čekanje prevoditelja moglo koštati dragocjene minute. Zhang kaže da uređaj, koji bi mogao biti integriran s telefonom, tabletom ili računarom, također može naučiti ASL. Budući da se više od 90 posto gluhe djece rađa roditeljima koji slušaju, postoji velika zajednica odraslih osoba koja brzo moraju naučiti ASL. DeepASL bi mogao poslužiti kao digitalni učitelj, dajući povratne informacije o tome da li se učenici pravilno potpisuju.
Zhang se prijavio za patent i nada se da će uređaj imati na tržištu u roku od godinu dana. Budući da se temelji na pristupačnoj tehnologiji - sustav za snimanje pokreta Leap Motion prodaje se za 78 dolara - mogao bi biti široko dostupan od prethodnih napora.
Istraživači Biyi Fang i Mi Zhang demonstriraju DeepASL. (Državno sveučilište Michigan)Ali Christian Vogler, profesor studija komunikologije na sveučilištu Gallaudet, sveučilištu za osobe gluhe ili nagluhe, sumnjičav je prema uređajima dizajniranim za prevođenje ASL-a, a njegov skepticizam dijele mnogi u gluvoj zajednici.
Uređaji uglavnom ne "prevode" ASL, samo prepoznaju znakove ruku i pretvaraju ih u englesku riječ po znaku, kaže Vogler. To znači da su izgubljeni ključni gramatički podaci, informacije o tome je li fraza pitanje, negacija, relativna rečenica i tako dalje. Dok DeepASL prevodi pune rečenice, neke značajke ASL gramatike nadilaze znakove ruku - izrazi lica često se koriste kao modifikatori, podizanje obrva može pretvoriti frazu u pitanje, a pozicioniranje tijela može ukazivati na to kada korisnik ASL-a citira nekoga drugog.
Do sada, „nijedan od sustava nije ni približno koristan ljudima koji se potpišu“, kaže Vogler, dodajući da istraživači često imaju „vrlo mali kontakt sa zajednicom [gluvih i nagluhih] i vrlo malo ideje o njihovoj stvarnosti potrebe."
Zhang-ov tim nije testirao uređaj na gluhim i nagluvim osobama, već na studentima u programu prevođenja znakovnog jezika. Zhang naglašava da je DeepASL dizajniran tako da u ovom trenutku omogućava samo osnovnu komunikaciju i da je ovo tek početno mjesto. Kaže da se njegov tim nada da će u budućnosti proširiti i mogućnosti DeepASL-a da zabilježi izraze lica.
"To će nam biti sljedeća značajna prekretnica", kaže on.
Vogler kaže da je pozitivno što MSU tehnologija koristi metode dubokog učenja koje su uspjele s govornim jezikom. No, iako rukavica ne zahtijeva, uređaj vjerojatno ima iste zamke kao i bilo koji prethodni sustav, jer ne bilježi pokrete lica i tijela.
Vogler smatra da bi se istraživači trebali odmaknuti od ideje da uređaji za prepoznavanje jezika znaka doista mogu zadovoljiti osobne komunikacijske potrebe.
"Imamo mnogo opcija za olakšavanje lične komunikacije i dok ne budemo imali nešto što stvarno poštuje jezična svojstva potpisanih jezika i stvarno komunikacijsko ponašanje potpisnika, ti napori neće biti ni blizu zamjena ili zamjene", kaže on. "Umjesto toga, ljudi trebaju raditi s stvarnim članovima zajednice i s ljudima koji razumiju složenost potpisanih jezika."
Vogler kaže da bi bilo korisno za tehnologiju prepoznavanja jezika znakova poput MSU-a za rad s glasovnim sučeljima poput Alexa. Rast ovih sučelja predstavlja izazov za pristup osobama gluhim i nagluvim, kaže on, čak i što je internet, uglavnom vizualni medij, predstavljao veliki izazov za slijepe ljude.
"Trenutno nemamo djelotvoran i učinkovit način interakcije s tim glasovnim sučeljima ako nismo u mogućnosti ili ne želimo koristiti svoj glas", kaže on. "Prepoznavanje jezika znaka savršeno je podudaranje za ovu situaciju, i ono što bi zapravo moglo biti korisno i navikavanje."