Microsoft Azure permite conversie Speech-To-Text și Neural Text-To-Speech în limba română

„Între numeroasele anunțuri făcute la conferința virtuală Microsoft Ignite 2020, este și cel că sistemele text-to-speech și speech-to-text ale Microsoft Azure sunt acum disponibile și în limba română, cu funcționalitate completă. «Alina» este noua voce sintetizată pentru limba română, bazată pe noile abordări cu rețele neurale, capabilă să redea natural cuvintele, punctuația și inflexiunile necesare și, mai important, complet customizabilă”, anunţă Lucian Ungureanu, Cloud Business Group Lead, Microsoft România.

Serviciile de voce și text din Microsoft Azure permit dezvoltatorilor integrarea unei interfețe vocale bidirecționale în produsele lor.

“Serviciile din categoriile text-to-speech și speech-to-text sunt disponibile în Microsoft Azure sub forma unor interfețe de programare care pot fi integrate în orice fel de aplicații informatice cu destul de multă ușurință. Partea de Machine Learning, cea mai dificilă și consumatoare de resurse de calcul, este gestionată integral de Microsoft Azure. Cu alte cuvinte, un dezvoltator de aplicații nu mai trebuie să dețină cunoștințe avansate de procesare de text și/sau limbaj natural pentru a integra funcții vocale bazate pe limba română”, susține Ciprian Jichici, General Manager Genisoft, Chief Data Scientist Solliance și Microsoft Regional Director.

Câteva exemple de asemenea funcții includ:

  • – Interacțiunea bazată pe voce cu asistenți digitali și roboți conversaționali;
  • – Preluarea mai eficientă a cererilor și reclamațiilor într-un call-center;
  • – Diseminarea de informații cu caracter public în instituții publice;
  • – Creșterea gradului de accesibilitate la informație pentru persoane cu deficiențe de vedere;
  • – Manipularea vocală a echipamentelor industriale;

 Aceste servicii fac parte din familia de servicii Azure Cognitive Services și sunt disponibile la https://azure.microsoft.com/en-us/services/cognitive-services/speech-services/

Asistenții virtuali sunt cel mai vizibil aspect al interacțiunii vocale om-mașină, însă nu sunt nici pe departe cel mai de impact. Folosirea unei interfețe de voce în care să poți avea încredere poate revoluționa interfața și experiența de utilizare a tehnologiei în domenii profesionale – la birou, pentru transcrieri, subtitrări și dictări automate, în industrie, unde poate însemna o reducere remarcabilă a riscurilor de manipulare a echipamentelor sau în servicii, unde poate asigura o interfață completă și continuă în timp real cu clienții, iar exemplele pot continua aproape la nesfârșit.

Până nu de mult, dezvoltarea unui sistem de voce digitală era, prin necesarul de efort și resurse, apanajul exclusiv al marilor companii. Iar acest lucru era un dezavantaj aproape insurmontabil pentru limba română, care nici nu reprezenta o piață potențială destul de mare și nici nu avea companii suficient de mari care să fie interesate de dezvoltarea independentă a unui sistem propriu.