https://frosthead.com

Razgovor s mašinama

Softver za prepoznavanje glasa, koji bi se većina nas vjerojatno složila, prilično je cool stvar. Ali dijeljenje razgovora s strojevima - bilo da se radi o pametnom telefonu, TV ekranu ili nadzornoj ploči - dobro, ne toliko. Pitate savjet nekog uređaja? Reeks geek. Izgovaranje svake riječi kako biste se razumjeli? Koliko uistinu možeš biti?

No Apple je, istinito oblikovan, preuzeo glavu tako što je unajmio tri zgodne ikone u svojoj posljednjoj reklamnoj kampanji za Siri, glas za iPhone 4S. Tu su Zooey Deschanel (Adorable Cool) i John Malkovich (Cerebral Cool) i Samuel L. Jackson (Ultimate Cool), i svi se oni koji se bave wordplayom i telefonom izgledaju kao sport bogova.

Kritičari, međutim, ističu da Siri u stvarnom životu nije ni tako osjetljiva niti sveznajuća kakva je predstavljena u reklamama. I vi ste sigurni da ste to šokirani. Drugi vide cijelu stvar zrelu za parodiju - vidjeti kako Zooeyev brat Jooey zajedno čini smiješnu ili Die verziju Zooeyeva i Sirijinog kišnog dana.

Nema veze. Siri je postala vodeća pjevačica u horu robota, glasom nove generacije "You Got Mail".

Moderno je u nekim krugovima sugerirati da Siri nije Steve Jobs dostojan, da je on još živ, Jobs bi ga povukao s tržišta ili, barem u najmanju ruku, nikada ne bi odobrio tako važan oglas kampanja za toliko pogrešan proizvod.

No, kako je rekao Jokov nasljednik Tim Cook ranije ovog tjedna, vlasnici iPhonea 4S poput Siri. Prema istraživanju objavljenom u ožujku, gotovo 90 posto ih kaže da ih koristi barem jednom mjesečno. Imajte na umu da Siri, jedan od rijetkih Appleovih proizvoda za koji se smatra da je u beta verziji kad je objavljen, proslavit će svoj prvi rođendan do listopada. Još uvijek uči jezik i, što je još važnije, tek počinje iskorištavati potencijale umjetne inteligencije.

Siri će vjerojatno biti središnje mjesto Apple TV-a, za koji se očekuje da će debitovati u prosincu. Ali velike su šanse da je mjesto na kojem će razgovori sa strojevima postati glavni tok u našim automobilima.

Vozi se, rekla je

Naravno, to se već događa, ali svejedno se morate prebaciti na govor robota ako želite biti shvaćeni. Pa čak i tada nema garancije. To će se početi mijenjati ovog ljeta kada će se neki novi modeli pojaviti opremljeni s nečim što se zove Dragon Drive!

To je izum Nuance Communications, tvrtke sa sjedištem u Massachusettsu, koja je postala moć u poslu s prepoznavanjem glasa. (Smatra se da su mozak iza Siri.) Nuance i prepoznavanje glasa u automobilima imali su veliki korak naprijed prošlog tjedna, kada je firma najavila da je Dragon Drive! moći će taknuti u oblak.

To znači da će sustav dramatično povećati svoju računalnu snagu i sposobnost memorije. A to znači da će glas na vašoj nadzornoj ploči postati više sirijski i omogućiti vam da zapravo razgovarate s njim. Nema više monosilnog vikanja. Dolazi dan kada ćete moći slučajno spomenuti da se osjećate kao neki Allman Brothers i nekoliko sekundi kasnije „Whipping Post“ će doći puštati kroz zvučnike.

Ključno je koliko smo sposobni učiti strojni kontekst i pragmatiku - kako se jezik koristi u društvenim situacijama. A to je lukav posao. Za početak, čak i najsofisticiraniji uređaj za prepoznavanje glasa mora čekati da čovjek završi govor kako bi mogao parirati i protumačiti cijelu rečenicu. Zatim postoji "teorija uma", sposobnost razumijevanja da drugi ljudi mogu imati drugačija uvjerenja i namjere od naših. Koliko znamo, samo ljudi to mogu učiniti.

Nedavna studija dvojice Stanfordovih psihologa može vam dati dojam što je sve povezano s pomaganju intuitivnih strojeva. Istraživači Michael Frank i Noah Goodman postavili su internetski eksperiment u kojem su sudionici zamoljeni da pogledaju niz predmeta, a zatim odaberu koji će od njih biti određena riječ. Na primjer, jedna skupina sudionika vidjela je plavi kvadrat, plavi krug i crveni kvadrat. Pitanje za tu skupinu bilo je: Zamislite da razgovarate s nekim i da se želite odnositi na srednji objekt. Koju biste riječ upotrijebili, plavi ili krug?

Druga grupa je bila upitana: Zamislite da netko razgovara s vama i koristite riječ "plavo" za upućivanje na jedan od tih objekata. O kojem predmetu razgovaraju?

Odgovori su pomogli istraživačima da dobiju jasniju sliku o tome kako slušatelj razumije govornika i kako govornik odlučuje što reći. Iz toga su razvili vrstu matematičkog modela koji može proširiti i oplemeniti misaoni proces računala.

Rekao je Frank: "Trebat će vam godine rada, ali san je računalo koje stvarno razmišlja o onome što želite i što mislite, a ne samo o onome što ste rekli."

Način govora

Evo nekih novijih zbivanja u prepoznavanju glasa:

  • Siri šuti: IBM ima tendenciju da bude jako nervozan zbog korporativnih tajni od izlaska, tako da sada zabranjuje svojim zaposlenicima da koriste javna mjesta za prijenos datoteka, poput Dropboxa. Ali također ima zabranu upotrebe Siri u uredu, jer se zaštitni izvršitelji brinu da bi netko tijekom razgovora s njihovim telefonom mogao otkriti osjetljive informacije koje završavaju na Appleovim poslužiteljima.
  • Uzmite to, Apple !: Samsung je ovog tjedna predstavio svoj novi Galaxy X III pametni telefon u Londonu, a iako njegov veliki zaslon osjetljiv na dodir privlači puno pozornosti, nudi i novi softver za prepoznavanje glasa i lica.
  • Učinite ono što kažem, a ne ono što radim: I Samsung se tu ne zaustavlja. Nedavno je podnio prijavu za patent robota koji razumije ljudski govor. Robot će moći prilagoditi svoje mogućnosti slušanja tako da uzme u obzir ambijentalni šum koji može prekinuti ili poremetiti naredbe koje mu se daju. Takođe bi se moglo prepoznati tko to govori, čak i ako je buka u pozadini vrlo glasna.

Infografski bonus: Mislite da je vaš automobil sada informatiziran. Pričekajte dok se potpuno ne uključi u Internet. Doznajte što povezani automobil može učiniti.

Razgovor s mašinama