Microsoft Azure pārskats: visprogresīvākā balss apstrāde

Satura rādītājs:

Anonim

Microsoft Azure Speech to Text ir viena no vismodernākajām balss atpazīšanas platformām. Kā daļu no Microsoft kognitīvās runas pakalpojumu klāsta tas izmanto dziļu mācību algoritmus, lai pārvarētu sliktu skaņas kvalitāti, un var pielāgoties dažādiem runāšanas stiliem, lai iegūtu precīzu audio transkripciju. Šajā Microsoft Azure runas uz tekstu pārskatā mēs rūpīgi aplūkosim šo pakalpojumu.

Ir vērts atzīmēt, ka Microsoft Azure Speech to Text nav tradicionāls lietotājam draudzīgas diktēšanas programmatūras gabals. Tā vietā šī ir uz izstrādātāju orientēta platforma, kas paredzēta, lai palīdzētu uzņēmumiem izveidot, testēt un pārvaldīt savus produktus. Ja vēlaties vienkārši pārrakstīt audio failu partiju, alternatīvas runas-teksta lietotnes var būt labāka iespēja. Apskatiet mūsu labāko runas-teksta programmatūras ceļvedi, lai iegūtu labākās alternatīvas.

Microsoft Azure runas teksts: plāni un cenas

Izmantojot Microsoft Azure Speech to Text, varat bez maksas pārrakstīt līdz piecām stundām audio un mēnesī izveidot vienu pielāgotu balss modeli. Tomēr, izmantojot bezmaksas plānu, vienlaikus ir pieejams tikai viens vienlaicīgs audio pieprasījums, kas nozīmē, ka lielākajai daļai uzņēmumu šī opcija nav izdevīga.

Azure runas pakalpojumu norēķini tiek sadalīti vienas sekundes solī.

Ja vēlaties vienlaikus pārrakstīt vairākus runas klipus, jums būs jājaunina uz Azure standarta cenu sistēmu. Tas maksā 1 USD par audio stundu un atbalsta līdz 20 vienlaicīgiem pieprasījumiem. Ja jums jāizmanto pielāgots audio modelis vai jāpārraksta daudzkanālu skaņas faili, tiek piemērota papildu maksa. Šie papildu pakalpojumi maksā attiecīgi 1,40 USD un 2,10 USD par audio stundu.

Lai arī Microsoft, kā tas ir nozares standartā, cenas ir uzskaitītas formātā “par audio stundu”, rēķini faktiski tiek sadalīti vienas sekundes daļās, lai jūs nemaksātu par ilgāku apstrādes laiku, nekā nepieciešams.

Microsoft Azure runas teksts: funkcijas

Galvenā Azure Speech to Text funkcija ir piekļuve, ko tā piešķir Microsoft jaudīgajai dabiskās valodas apstrādes sistēmai. Dažu pēdējo gadu laikā Microsoft runas AI ir sasniegusi vairākus svarīgus pagrieziena punktus. Tas nozīmē, ka tagad tas var izpildīt uzdevumus, kas iepriekš nebija iespējami runas atpazīšanas dienestam, piemēram, precīzi pārrakstīt sarunu mazo grupu sarunu laikā.

Pakalpojumu Microsoft Azure Speech to Text var integrēt ar Office 365, lai panāktu optimālu precizitāti.

Azure darbojas ar desmitiem valodu un dialektu, un to var apmācīt, izmantojot pielāgotus runas atpazīšanas modeļus, lai labāk pielāgotos lietotāja runas stilam, fona vides trokšņiem un vārdu krājumam. Ja jūsu organizācija jau ir apņēmusies darboties Microsoft produktu ekosistēmā, varat izmantot lietotāju Office 365 datus, lai labāk uzlabotu runas atpazīšanas precizitāti organizācijai raksturīgiem terminiem. Un, kas ir svarīgi, to var izdarīt, neapdraudot datu drošību, jo runu uz tekstu var palaist lokāli.

Microsoft Azure runas teksts: iestatīšana

Microsoft Azure ir paredzēts izstrādātājiem, nevis patērētājiem. Tas nozīmē, ka tā izveidošana ir iesaistīta un nedaudz izaicinoša procedūra, kuru vislabāk atstāt personai, kurai ir daudz tehniskās zināšanas.

Azure iestatīšana nav gluži vienkārša, ja vien jums nav kodēšanas pieredzes.

Ātrākais veids, kā konfigurēt Azure, ir Azure Speech SDK izmantošana programmēšanas valodā, piemēram, Java vai C ++. Lai to izdarītu, jums būs jāreģistrējas bezmaksas Azure kontam un savā izstrādes vidē jāizveido tukšs projekts. Pēc tam jums būs jāizmanto Microsoft Visual Studio un jāuzraksta īsa programma, lai inicializētu Microsoft objektu SpeechRecognizer.

Microsoft Azure Runa uz tekstu: saskarne

Tāpat kā citas lielapjoma transkripcijas platformas, Microsoft Azure Speech to Text ir paredzēts darbināt kā lietojumprogrammu saskarni (API), pievienot Office 365 programmām vai integrēt jaunās platformās un pakalpojumos. Tāpēc nav viena Azure Speech to Text saskarnes. Tas, ko redzēs galalietotājs, ir atkarīgs no tā, kā Azure Speech to Text ir integrēts.

Azure tiešsaistes portāls ir intuitīvs un viegli lietojams.

Tikmēr izstrādātājs, kas pārvalda Azure, to darīs, izmantojot Microsoft tiešsaistes Azure portālu, kas jūtas moderns un ir viegli orientējams. Runas pakalpojumu resursu lapas atrašana prasa tikai dažas minūtes, un, tiklīdz jūsu kontam ir pievienota instance, uzraudzības brīdinājumus un lietojumu var skatīt vienā logā.

Microsoft Azure runas teksts: veiktspēja

Kā daļu no mūsu Microsoft Azure runas uz tekstu pārskata, mēs vēlējāmies redzēt, kā šī platforma tika galā ar neapstrādātu balss ierakstu apstrādi, tāpēc, kad mūsu Azure konts bija gatavs darbam, mēs augšupielādējām virkni klipu ar dažādu fona trokšņu līmeni . Visā pasaulē Azure paveica labu darbu, apstrādājot mūsu paraugus, jo novērtēšanas laikā mēs redzējām tikai dažas kļūdas.

Iespējojot Azure pielāgoto runas modeli, tika uzlabota mūsu transkripcijas precizitāte.

Azure nedaudz cīnījās, apstrādājot neparastas vai īpašas frāzes, piemēram, sporta komandu nosaukumus un zinātniskos terminus, taču tas tika ātri atrisināts, iespējojot pielāgotā modeļa izvades opciju. Kad bijām aktivizējuši šo opciju, Azure varēja pielāgoties unikālajam vārdu krājumam un runāšanas stilam, ko izmantojām.

Microsoft Azure runas teksts: atbalsts

Lai uzzinātu, kā mijiedarboties ar Azure Speech Services SDK, izmantojot dažādas programmēšanas valodas, un integrēt funkcijas Azure Speech to Text savā platformā, jums noteikti būs nepieciešama palīdzība. Par laimi, Microsoft ir izveidojis visaptverošu mācību materiālu katalogu Azure platformai, kurā atradīsit kodu piemērus un noderīgus padomus.

Azure vietnes apmācības sadaļā ir daudz noderīgu resursu.

Visi Azure klienti saņem bezmaksas norēķinu un abonēšanas pārvaldības atbalstu, kam var piekļūt, izmantojot biļešu sistēmu. Jūsu kontam var pievienot padziļinātu atbalstu par atkārtotu maksu, sākot no 29 USD mēnesī.

Microsoft Azure Runa uz tekstu: galīgais spriedums

Azure Speech to Text platformā tiek izmantota vismodernākā tehnoloģija, lai nodrošinātu gandrīz perfektu transkripcijas pakalpojumu. Tas ir vispiemērotākais uzņēmumiem, kuri jau ieguldīti Microsoft Office 365 ekosistēmā, jo pielāgotus balss un vārdu krājuma modeļus var droši ģenerēt no esošā dokumentu arhīva. Daži mazie uzņēmumi var cīnīties ar Azure, jo tā pareizai iestatīšanai ir nepieciešama kvalificēta Microsoft mākoņa izstrādātāja uzmanība.

Sacensības

Amazon Transcribe, Google Cloud Speech-to-Text un Watson Speech to Text ir tiešie konkurenti Microsoft Azure. Šīs trīs platformas arī spēj precīzi veikt liela apjoma sērijveida transkripcijas. Google Cloud ir vienīgais tuvais konkurents, kas spēj strādāt ar vairākām valodām nekā Azure, taču tas ir dārgāks, ar sākuma ātrumu tikai 0,006 USD par 15 sekundēm, salīdzinot ar Azure 0,017 USD minūtē (0,00425 USD par 15 sekundēm).

Lai atrastu citas alternatīvas programmai Microsoft Azure Speech to Text, skatiet mūsu programmatūras rokasgrāmatu par labāko teksta pārvēršanu tekstā.