https://frosthead.com

Ljubljenje jezičnih barijera zbogom

Univerzalni prevoditelj već dugo vremena je opsesija pop kulture. Star Trek predstavlja ga kao ručni stroj, nalik mikrofonu koji može odmah prevesti većinu jezika . Vodič za autostopu Galaksijom krasi babelsku ribu, stvorenje koje, kad zaglavi u nečijem uhu, nudi trenutačni prijevod bilo kojeg jezika u galaksiji.

Stoga ne bi trebalo biti iznenađenje da današnji ljudi pokušavaju stvoriti uređaj koji jednako dobro funkcionira. Postoje desetine aplikacija za pametne telefone, ali većina prevodi riječi na jednostavan, jedan na jedan; korisnik utipkava ili izgovara riječ, a aplikacija odbija od prijevoda. Sada je cilj i pravi monetarni pad, inženjeri i poduzetnici omogućiti dvoje ljudi da razgovaraju na različitim jezicima, dok mali uređaj izbacuje prijevode u stvarnom vremenu.

Postojeće aplikacije za prevođenje

Na putovanju u Grčku razbolio se engleski govornik Andrew Lauder.

"Otišao sam u ljekarnu, a oni nisu mogli razumjeti nijedan engleski, tako da nisam dobio lijekove", kaže Lauder, izvršni direktor Vocre Translatea. Etikete lijekova bile su mu doslovno grčke. Jezične barijere uobičajene su za svjetske putnike. U stranoj državi male transakcije poput kupnje lijekova ili dobivanja uputa - još jedna poteškoća s kojom se Lauder suočio - postaju herkulovski zadaci.

Kada se vratio u stranu, Lauder je stvorio Vocre Translate, aplikaciju za prevođenje glasa i teksta. Započela je kao aplikacija tekst-u tekst (koja se naziva MyLangauge), a zatim se u početku transformirala u model govora u tekst koji je, poput drugih aplikacija uključujući SayHi Translate, koristio tradicionalni model u kojem riječ prevodi izravno na drugu riječ. Recite "Zdravo", a pametni telefon ili tablet odmah se aktivira. "Zbogom" postaje "Sayonara". I tako dalje, slično kao prevoditelj teksta.

Da bi stvorili jednostavan audio prijevod, tvorcima tih aplikacija potrebni su podaci. Vocre je svoje podatke izvlačio iz javnih snimaka i dokumenata, poput starih filmova ili javnih rasprava. "U osnovi smo molili uslugu prepisivanja govorne pošte kako bismo koristili njihov oblak za prepoznavanje govora", kaže izvršni direktor SayHi Lee Bossier.

Nakon što su inženjeri dobili audio i tekstualne podatke, uparili su zvuk i tekst, riječ za riječ. Softver za prepoznavanje glasa prepoznaje "sir" i pretvara ga u tekst. To se pretvara u francuski, a aplikacija pronalazi francuski izgovor za "izdajstvo".

To kaže, ako korisnik žustro naziva nešto "sirom", prevoditelj ne radi tako dobro, jer govorni jezik nije ni približno tako statičan kao pismeni jezik. Kadenca, sleng, flekcija, izgovor, dijalekt i razgovorni tok mogu promijeniti značenje

S vremenom je, međutim, Lauder želio razgovorniji uređaj. U e-poruci kaže: „Na temelju podataka o upotrebi ustanovili smo da ljudi govore vrlo različito od načina na koji pišu. Govorna riječ je mnogo spontanija i mnogo manje formalna i doslovna. "Tako je koristio statistički strojni prijevod, pristup koji također koristi Google koji koristi podatke za pronalaženje uobičajene uporabe riječi, prelazeći tradicionalni model prijevoda od riječi do riječi. U osnovi, Vocre uči kako se koristi. "Uči na temelju svakog razgovora, svake fraze koja prođe kroz njega. To je nešto što s vremenom postaje pametnije “, kaže Lauder.

Ipak, trenutačno je obema aplikacijama potrebno nekoliko sekundi za prijevod, ali su nesumnjivo učinkovite, posebno u skladu s jezikom tijela, za transakcijske razgovore poput naručivanja obroka. Uostalom, ljudi već godinama naručuju hranu na nepoznatim jezicima i uvijek uspijevaju jesti. Ali nisu mogli voditi detaljne, složene razgovore.

S Vocreom i SayHijem, razgovori mogu teško stupiti naprijed, ali to nije isto što i razgovarati na vašem materinjem jeziku. Google to namjerava u potpunosti promijeniti.

Googleov pristup (Prijevod statističkog stroja)

Kada učimo novi jezik u školi, započinjemo s pojmovima pojedinih rječnika. No, jezik je fluidniji - riječima treba kontekst.

"Pristup [Google] zauzima općenitiji je pristup", kaže Josh Estelle, softverski inženjer za Google Translate. "Umjesto da pokušavamo tvrdo kod svih tih pravila, pravila pokušavamo naučiti gledajući podatke."

Tehnološka kompanija izbjegava jednostruku metodu „riječ-u-riječ“ i umjesto toga koristi statistički strojni prijevod, ne gledajući što znače riječi, već kako se modelira jezik, što se uči preko podataka . Dakle, cilj je šuma, a ne drveće. Primjer na engleskom: poznajemo definicije riječi "break" i "up", ali izraz "break up" nije doslovna kombinacija dviju riječi.

Statistički strojni prijevod zahtijeva podatke. Planine od toga. Da bi metoda djelovala, ne treba samo činjenica da je "porijeklo" francuski za sir, već 100 primjera i "porijekla" i sira koji se koristi u stvarnim rečenicama.

Estelle kaže da ako govornik engleskog jezika ima dva menija, identična osim činjenice da je jedan ispisan na engleskom, a drugi na kineskom, "vjerojatno možete shvatiti što je kineski znak za" juhu "." Kontekst je kralj. Ali da biste stvorili taj kontekst, potreban vam je milijun izbornika i svaki drugi dokument koji se može zamisliti.

Što upravo Google ima. Bez web diva koji bi prikupio mnoštvo podataka, stvarna riba Babel ne bi mogla postojati. Pazi po webu i prikuplja sve - tekst i zvuk. Zatim podatke unosi u algoritme koji sve uspoređuju sa svim ostalim. Te usporedbe pomažu doći do korijena načina na koji jezik prirodno funkcionira.

"Jedna stvar koja iznenađuje ljude kada govorimo o Prevodu je da naš tim nema jezikoslovce", kaže Estelle. „Pokrenuli smo 71 jezik i rekao bih da naš tim ne zna kako ih velika većina govori. Ljudski prevoditelj neće moći naučiti sve ove pojmove i stvari onako brzo koliko naši [podaci] mogu naučiti s interneta. "

U čemu je poanta?

Kao i Google, i Facebook vidi prednosti. Razmislite o prelasku na web stranicu društvenih medija.

"Misija Facebooka je povezivanje cijelog svijeta, a jedna od prepreka povezivanju svijeta nije što svi govore istim jezikom", kaže Tom Stocky, direktor inženjeringa u Facebooku. "Na strani prijevoda, mislim da je zaista ambiciozna vizija budućnosti ako biste mogli koristiti Facebook na svom materinjem jeziku i komunicirati s bilo kojim drugim jezikom."

Prošlog kolovoza Facebook je kupio Jibbigo, aplikaciju za prevođenje od govora do govora koja je dostupna za Android i iOS uređaje.

Oduševljeni korisnici Facebooka primijetit će da društvena stranica već koristi neki prijevod. Ako ste ikada na svojoj stranici sa engleskim jezikom imali španjolski post, odmah ste dobili priliku da ga prevedete na svoj maternji jezik.

Ali Stocky glasovnu komponentu vidi kao potencijalni izmjenjivač igara. Porast pametnih telefona i tableta pozdravlja stalno povezani svijet, a porast softvera za prepoznavanje govora poziva na nova sredstva web interakcije. Stocky predviđa budućnost u kojoj korisnici mogu samo govoriti naredbu svojim pametnim telefonima i komunicirati s drugim korisnicima, osim što razlikuju jezične razlike.

"Ne postavlja se pitanje na kraju jer su jedina ograničenja snaga jezičnog motora i naravno vrijeme obrade i moć obrade", kaže on.

Laura Murphy, profesorica na katedri za globalne zdravstvene sustave i razvoj na Sveučilištu Tulane i priznata tehnološka skeptičarka, dovodi u pitanje vrijednost univerzalnog prevoditelja i ne mora znati više od jednog jezika.

Smatra da bi uređaj mogao biti pomalo koristan u putovanjima, poslovnim i međunarodnim odnosima, ali ne i revolucionarno. Na određenoj razini već imamo prevoditelje (ljude) na mjestu, a većina koja radi u stranim odnosima poznaje odgovarajuće jezike. Uređaj, vjeruje Murphy, mogao bi imati negativne posljedice.

"Mislim da to može učiniti ljude lijenima", kaže Murphy. Prevođenje jezika može biti mentalno teško ako prisilite mozak - pogotovo onaj koji zna više od dva jezika - da radi na drugačiji način, ali vježba je ipak korisna. Mozak se povlači s mjesta jezične empatije do koje ni najljepši govorni prevoditelj nikad ne bi mogao doći.

Iako bi ova univerzalna komunikacija mogla biti pozitivna, Murphy priznaje, "to bi moglo dovesti do toga da ljudi misle kako komuniciraju kad nisu." Kultura nije uvijek potpuno utjelovljena u jeziku (uzmimo na primjer sarkazam), a komunikacija nije uvijek o informacijama koje se prenose.

Kada možemo očekivati ​​da ćemo vidjeti ovu tehnologiju?

"U 2005. godini trebalo nam je 40 sati da prevedemo 1.000 rečenica", kaže Estelle iz Googlea. "Danas vam prevodimo ekvivalent od 1000 rečenica svakih 10 milisekundi."

Kao što Richard Anderson slavno kaže u TV seriji „Šest miliona dolara “ iz 1970-ih, „Mi imamo tehnologiju.“ Sada se samo čeka na prikupljanje i analiziranje podataka. Kako će to trajati ostaje nepoznato, prenosi Estelle. No oprezne procjene stavljaju takav uređaj u naše ruke u roku od deset godina.

Iako tvorci aplikacija poput Bossiera ili divovskih kompanija poput Googlea i Facebooka ne žele graditi vlastite verzije biblijske Babilonske kule, to zapravo želi zaustaviti brbljanje. On predviđa svijet u kojem svi komuniciramo, o medicini, o politici, o idejama.

A, taj svijet možda neće biti daleko.

Napomena urednika: Ažurirali smo ovu priču 4. travnja 2014, kako bismo precizno opisali tehnologiju Vocre Translatea.

Ljubljenje jezičnih barijera zbogom