Watson runas uz tekstu apskats: labākais lielapjoma transkripcijas pakalpojums?

Satura rādītājs:

Anonim

Watson ir IBM dabiskās valodas apstrādes datorsistēma. Tas nodrošina slaveno superdatoru, kas atbild uz jautājumiem, kā arī virkni AI balstītu uzņēmuma produktu, tostarp Watson Speech to Text. Pārskatā Watson Speech to Text apskatīsim vienu no labākajām runas-teksta lietotnēm, kas ideāli piemērota ikvienam, kurš vēlas audio pārveidot par tekstu mērogā.

Watson runas apstrādes platforma ir pieejama vietnē IBM Cloud. Tas ir daudzpusīgs rīks, un to var izmantot daudzos gadījumos, tostarp diktēšanā un konferences zvana transkripcijā. Turklāt atšķirībā no lielākās daļas citu runas-teksta lietotņu tas ir pieejams kā API, ļaujot izstrādātājiem to cita starpā iegult balss vadības sistēmās.

Watson Speech to Text: plāni un cenas

Varat izmantot Watson Speech to Text, lai mēnesī bez maksas apstrādātu līdz 500 minūtēm audio. Ja vēlaties konvertēt vairāk par to, jums būs jāmaksā par katru audio minūti, un ātrums mainās atkarībā no apstrādātā audio ilguma. Izmaksas svārstās no 0,01 līdz 0,02 ASV dolāriem minūtē, un, ja nepieciešams IBM pielāgotās valodas modelis, tiek piemērota papildmaksa 0,03 USD minūtē. Ir pieejami arī īpaši cenu piedāvājumi Watson plāni, un tie nodrošina piekļuvi uzlabotām datu privātuma funkcijām un darbspējas laika garantijām.

Vatsona runas uz tekstu pakalpojuma cena ir atkarīga no satura apjoma, kas jums jāpārraksta.

Varat arī piekļūt Watson Speech to Text sistēmai, izmantojot vispārējas nozīmes IBM Cloud abonementu. Dabiskās valodas apstrāde ir tikai viena lietotne plašā AI pakalpojumu klāstā, ko varat iegūt, izmantojot IBM Cloud, tāpēc šī ir laba iespēja jebkurai organizācijai, kurai nepieciešama piekļuve ātrdarbīgiem datu pārsūtīšanas, tērzēšanas robotiem vai teksta-runas rīkiem.

Watson Runa uz tekstu: funkcijas

Pateicoties elastīgai API integrācijai un citiem IBM pirmsizveidošanas rīkiem, runas atpazīšanas pakalpojums Watson sniedz daudz vairāk nekā pamata transkripcijas. Piemēram, ja vēlaties to izmantot klientu apkalpošanas kontekstā, Watson Assistant var iestatīt, lai tieši apstrādātu dabiskās valodas jautājumus vai atbildētu uz jautājumiem pa tālruni.

Vatsonā IBM ir izveidojis daudzfunkcionālu dabiskās valodas apstrādes platformu.

Watson strādā ar tiešraides audio 11 valodās un var importēt skaņas dažādos iepriekš ierakstītos formātos. Straumējot, reāllaika diagnostikas atbalsts nozīmē, ka Vatsons var mudināt lietotājus tuvoties mikrofonam vai mainīt vidi. Iespaidīgs ir arī fakts, ka Watson var atšķirt dažādus runātājus koplietošanas sarunā, pateicoties Speaker Diarization - funkcijai, kas joprojām tiek testēta beta versijā.

Watson Runa uz tekstu: iestatīšana

Lai izmantotu Watson, vispirms ir jāizveido IBM Bluemix konts. Reģistrācija ir bezmaksas un nesāpīga, un tai nepieciešama tikai e-pasta adrese un parole. Kad esat pieteicies, kontā jāpievieno noteikums pakalpojumam Runa uz Tekstu. Šajā posmā jums tiks izsniegti pāris akreditācijas dati, kas jums jāsaglabā savos ierakstos.

Reģistrēšanās IBM Bluemix kontam ir nepieciešama, lai piekļūtu pilnam Watson funkciju kopumam.

Kad esat to izdarījis, lietas kļūst ievērojami sarežģītākas. Lai piekļūtu Watson, šie akreditācijas dati būs jāpievieno klienta vienotu resursu lokatora (cURL) koda partijai un pēc tam palaidiet to savā datorā. Lai uzzinātu, tieši kuru komandu izsaukt, skatiet šo ērto ceļvedi. Alternatīvi, ja jūs vienkārši vēlaties redzēt, cik labi darbojas Watson sistēma, bez nepieciešamības pārlekt visus šos lokus, varat to izmēģināt IBM demonstrācijas vietnē.

Watson Runa uz tekstu: saskarne

Atšķirībā no patērētājiem paredzētajām balss un teksta lietotnēm, Watson pakalpojumi ir paredzēti, lai tiem piekļūtu, izmantojot API un citu sistēmu iegultu kodu. Šī iemesla dēļ nav īstas Watson “saskarnes”. Tā vietā Watson var piekļūt, izmantojot trīs dažādus interneta protokolus. Tie ir WebSockets, REST API un Watson Developer Cloud.

Watson runu uz tekstu var pārvaldīt, izmantojot Watson Developer Cloud sistēmu.

Lai kontrolētu Watson, jums būs jāizmanto komandrindas rīks, kas savienojas ar IBM mākoni, izmantojot vienu no šiem trim maršrutiem. Saskarne, kuru redz galalietotājs, kas mijiedarbojas ar Watson, būs jāveido kādam no jūsu izstrādes komandas atsevišķi.

Vatsons Runa uz tekstu: Performance

Kopumā mūs pārsteidza tas, kā šī dabiskās valodas apstrādes platforma rīkojās ar īstu runu. Mēs izmantojām Vatsonu, lai transkribētu klipus, kurus ierakstījām dažādās izaicinošās vidēs, kā arī slaveno runu skaņu kodumus vairākās no 11 Vatsona 11 atbalstītajām valodām.

Mēs noskaidrojām, ka Vatsons labi darbojās ar iepriekš ierakstītu runu.

Kaut arī klipiem ar lielu fona troksni kļūdas pieauga biežāk, Vatsons kopumā sniedza neticami precīzus rezultātus. Pēc mūsu testiem mēs aprēķinājām, ka nepieļautas kļūdas vidēji notiek tikai reizi 150 vārdos. Tomēr kļuva skaidrs, kāpēc Watson Speaker Diarization funkcija paliek BETA testēšanā, jo vairākas reizes mūsu novērtēšanas laikā viena balss tika nepareizi marķēta kā atsevišķi skaļruņi.

Watson Runa uz tekstu: atbalsts

IBM resursu centrs piedāvā daudz dokumentācijas, lai labāk izprastu, kā Watson piemērot konkrētajam lietošanas gadījumam. Ir arī vērts izmantot API integrācijas un SDK, ko izveidojusi Watson izstrādātāju kopiena un ievietojusi vietnē GitHub.

Watson API GitHub lapa ir labs atbalsta avots pakalpojumam Watson Speech to Text.

Ja jūs neatrodat savas problēmas risinājumu, varat tieši sazināties ar IBM, atverot atbalsta biļeti vai sazinoties ar viņu pa tālruni. Kamēr jūs izvēlējāties kādu no augstākās klases Watson pakotnēm, jūsu Watson lietošanu aizsargās pakalpojuma Uptime līgums.

Vatsona runa uz tekstu: galīgais spriedums

Ja jūsu organizācijai ir zināšanas un resursi, lai pareizi integrētu IBM Watson runas teksta platformu savā sistēmā, jūs izmantosiet tādas uzlabotas funkcijas kā reāllaika skaņas vides diagnostika un starpposma transkripcijas rezultāti. Tomēr mazie uzņēmumi un organizācijas cīnīsies ar tehnisko problēmu, kā pareizi izveidot Vatsonu.

Sacensības

IBM Watson runas uz tekstu pakalpojums ir tiešs konkurents lielapjoma transkripcijas pakalpojumiem Google Cloud Speech-to-Text un Amazon Transcribe. Abi šie ir ievērojami lētāki nekā Watson, piemēram, ar Google Cloud transkripciju sākot no 0,006 USD minūtē. Visiem trim pakalpojumiem ir līdzīgas funkcijas, piemēram, pielāgots vārdu krājums, taču viena iezīme, kuras IBM Watson ļoti trūkst, bet kas pieejama abiem konkurentiem, ir automātiska pieturzīmju atpazīšana.

Vai meklējat citu risinājumu no teksta līdz tekstam? Apskatiet mūsu programmatūras rokasgrāmatu par labāko teksta pārvēršanu tekstā.