
Xiaomi, kompanija koja se bavi proizvodnjom pametnih telefona i IoT uređaja, predstavila je svoju najnoviju govornu tehnologiju, koja predstavlja primjenu naprednih algoritama na polju alata za olakšanu upotrebu.
Tehnologija Text-To-Speech koju je razvio Xiaomi AI Lab je sposobna da u stilu svakodnevnog govora generira jedinstven i prilagođen glas za korisnike sa poremećajima govora.
Ovaj tip korisnika sada može da komunicira sa drugima koristeći “svoj glas”, umjesto tipičnog monotonog elektronskog glasa. Kao dio predistraživačkog projekta „Own My Voice“ koji vodi Tehnološki komitet kompanije Xiaomi, ovaj uspješan projeat demonstrira Xiaomi-jevu posvijećenost „Tech for Good“ (tehnologiji za dobro drugih) i ostvarivanju svoje misije „da inovativne tehnologije poboljšaju život svima na svijetu“.
Sponzorirani članak
Božićni spektakl: Dalmatino donosi ''Božić bijeli'' u Čapljinu!
Zašto je Xiaomi pokrenuo ovaj projekt?
Xiaomi brine o ljudima i nastoji da ispuni njihove različite potrebe kroz tehnološke inovacije. Uslijed želje mnogih korisnika koji imaju oštećenja govora za posjedovanjem sopstvenog glasa za svakodnevnu komunikaciju, osnovan je projektni tim „Own My Voice“ koji je omogućio korisnicima sa oštećenjem govora da koriste usluge Text-To-Speech.
Zhu Xi, pokretač ove teme u Odboru za tehnologiju za Tech for Good, Xiaomi Corporation, rekao je: „Uzbuđeni smo što istražujemo višestruke vrijednosti koje nam donose tehnološke inovacije, kao što je odgovaranje na zahtjeve korisnika za vlastitim identitetom i izgradnjom identiteta.”
Kako je Xiaomi proveo projekt?
Da bi generirao što prikladniji i personalizovaniji glas korisnicima, projektni tim je angažirao više od 200 volontera u Xiaomi-u kako bi „donirali“ svoje glasove. Koristili su algoritam za podudaranje otiska glasa kako bi uporedili karakteristike glasova volontera sa glasovima primatelja.
Ovim pristupom pronašli su najpogodniji glas koji je korišćen kao osnovni zvuk. Uzimajući u obzir personalizaciju i zaštitu privatnosti, izabranim pravim glasom manipulirano je kompleksnom akustičnom modifikacijom da bi se formirao nov i originalan zvuk glasa.
Zatim su koristili tehnologiju Text-To-Speech u stilu svakodnevnog govora kako bi prilagodili AI model, čineći da ovaj novi glas postepeno dobiva prirodan ritam i intonaciju koja može istinito da izrazi emociju i ton čoveka.
Projekt „Own My Voice“ kombinuje niz najnaprednijih algoritama sa Xiaomi-jevom samorazvijenom govornom tehnologijom kako bi se osigurala specifičnost, sigurnost i visoka autentičnost sintetiziranog glasa, stvarajući novu ideju o prilagođenoj sintezi govora za korisnike sa smetnjama.
U čemu je značaj ovog projekta?
Okosnicu ovog projekta čini grupa stručnjaka za govornu tehnologiju iz Xiaomi AI Lab. Oni su od 2017. godine objavili 37 radova o govoru u zbornicima vrhunskih međunarodnih konferencija, poput Međunarodne konferencije o akustici, govoru i obradi signala (ICASSP).
Uspjeh “Own My Voice” uglavnom zavisi od spontanog stila Text-To-Speech tehnologije koju su razvili.
Tehnologija Text-To-Speech u suštini predstavlja sintetizirani glas nalik na ljudski u svojoj intonaciji, pauzi, brzini i drugim karakteristikama.
Ovo čini uobičajeno monoton i neprirodan osjećaj elektronskog glasa prirodnijim. Trenutno se ova tehnologija primjenjuje na mnoge pametne uređaje opremljene funkcijom XiaoAI, AI glasovnim asistentom kompanije Xiaomi.
Projekt „Own My Voice“ pokazuje da spontani stil Text-To-Speech tehnologije također može biti široko prihvaćen i poboljšati korisničko iskustvo.
Zhu Xi je dodao: „Ako primjetimo i odgovorimo na potrebe manjinskih grupa u ranoj fazi, proces širenja tehnologije mogao bi biti znatno skraćen. Ovo omogućava da prednosti novih tehnologija postanu dostupne korisnicima sa posebnim potrebama bez odlaganja.“






