Microsoft Azure Speech to Text je jednou z nejpokročilejších platforem rozpoznávání hlasu v okolí. Jako součást produktové řady kognitivních řečových služeb společnosti Microsoft využívá algoritmy hlubokého učení k překonání špatné kvality zvuku a může se přizpůsobit různým stylům mluvení pro přesné zvukové transkripce. V této recenzi Microsoft Azure Speech to Text se podrobně podíváme na tuto službu. 

Stojí za zmínku, že Microsoft Azure Speech to Text není tradičním uživatelsky přívětivým diktátovým softwarem. Místo toho se jedná o platformu zaměřenou na vývojáře, která má podnikům pomoci při vytváření, testování a správě jejich vlastních produktů. Pokud chcete pouze přepsat dávku zvukových souborů, může být lepší volbou alternativní aplikace pro převod řeči na text. Podívejte se na našeho nejlepšího softwaru pro převod řeči na text, kde naleznete nejlepší alternativy.

Microsoft Azure Speech to Text: Plány a ceny

Pomocí programu Microsoft Azure Speech to Text můžete zdarma přepisovat až pět hodin zvuku a vytvořit jeden vlastní hlasový model za měsíc. U bezplatného plánu je však současně k dispozici pouze jedna souběžná zvuková žádost, což znamená, že tato možnost není pro většinu podniků životaschopná..

Fakturace služby Azure speech service je rozdělena do sekundových přírůstků. (Obrazový kredit: Microsoft)

Pokud chcete přepsat více než jeden hovorový klip najednou, budete muset upgradovat na standardní systém Azure. To stojí 1 $ audio za hodinu a podporuje až 20 souběžných požadavků. Další poplatky jsou účtovány, pokud potřebujete použít vlastní zvukový model nebo přepsat vícekanálové zvukové soubory. Tyto dodatečné služby stojí 1,40 $ a 2,10 USD za zvukovou hodinu.

Ačkoli Microsoft uvádí své ceny v “za zvukovou hodinu” ve formátu, stejně jako v průmyslovém standardu, je faktura rozdělena do sekundových přírůstků, takže nebudete platit za více času zpracování, než je třeba.

Microsoft Azure Speech to Text: Funkce

Klíčovou funkcí Azure Speech to Text je přístup, který poskytuje výkonnému systému zpracování přirozeného jazyka společnosti Microsoft. Během několika posledních let dosáhla AI společnosti Microsoft v řeči několika důležitých milníků. To znamená, že nyní může plnit úkoly, které dříve nebyly pro službu rozpoznávání řeči možné, například přesný přepis křížového hovoru během konverzací v malých skupinách.

Služba Microsoft Azure Speech to Text může být integrována s Office 365 pro optimální přesnost. (Obrazový kredit: Microsoft)

Azure pracuje s desítkami jazyků a dialektů a může být vyškolen pomocí vlastních modelů rozpoznávání řeči, aby se lépe přizpůsobil stylu mluvení uživatele, hluku v pozadí a slovní zásobě. Pokud je vaše organizace již odhodlána k produktovému ekosystému společnosti Microsoft, můžete využít data uživatele Office 365 k lepšímu zlepšení přesnosti rozpoznávání řeči pro specifické podmínky organizace. A co je důležité, může to být provedeno bez ohrožení zabezpečení vašich dat, protože Speech to Text lze provozovat přímo na místě.

Microsoft Azure Speech to Text: Nastavení

Microsoft Azure byl navržen spíše pro vývojáře než pro spotřebitele. To znamená, že jeho nastavení je zapojený a poněkud náročný postup, který je nejlépe ponechán někomu s velkým technickým know-how. 

Nastavení Azure není úplně jednoduché, pokud nemáte zkušenosti s kódováním. (Obrazový kredit: Microsoft)

Nejrychlejším způsobem konfigurace Azure je použití sady Azure Speech SDK v programovacím jazyce, jako je Java nebo C ++. Z tohoto důvodu se budete muset zaregistrovat do bezplatného účtu Azure a vytvořit prázdný projekt ve vývojovém prostředí. Poté budete muset použít Microsoft Visual Studio a napsat krátký program k inicializaci objektu Microsoft SpeechRecognizer. 

Rozhraní Microsoft Azure Speech to Text: Interface

Stejně jako jiné hromadné přepisové platformy je Microsoft Azure Speech to Text určen ke spuštění jako aplikační programovací rozhraní (API), přidaný do programů Office 365 nebo integrovaný do nových platforem a služeb. Z tohoto důvodu neexistuje jediné rozhraní Azure Speech to Text. To, co koncový uživatel uvidí, závisí na tom, jak byla Azure Speech to Text integrována.

Online portál Azure je intuitivní a snadno použitelný. (Obrazový kredit: Microsoft)

Mezitím tak bude vývojář spravující Azure dělat prostřednictvím online portálu Azure od společnosti Microsoft, který se cítí moderní a snadno se naviguje. Vyhledání stránky zdroje hlasových služeb trvá jen několik minut a po přidání instance k vašemu účtu lze sledovat výstrahy a použití v jediném okně..

Microsoft Azure Speech to Text: Výkon

V rámci kontroly Microsoft Azure Speech to Text jsme chtěli vidět, jak tato platforma zvládla výzvu zpracování surových hlasových záznamů, takže jakmile byl náš Azure účet připraven, nahráli jsme řadu klipů s různou úrovní šumu v pozadí . Azure napříč zpracováním našich vzorků odvedl dobrou práci, protože jsme v průběhu našeho hodnocení neviděli více než hrst chyb..

Aktivace vlastního modelu řeči Azure zlepšila naši přesnost přepisu. (Obrazový kredit: Microsoft)

Při zpracování neobvyklých nebo speciálních frází, jako jsou jména sportovních týmů a vědeckých výrazů, Azure nejprve lehce bojoval, ale to bylo rychle vyřešeno povolením možnosti výstupu vlastního modelu. Jakmile jsme tuto možnost aktivovali, Azure se dokázal přizpůsobit jedinečnému slovníku a stylu mluvení, který jsme použili.

Microsoft Azure Speech to Text: Podpora

Abyste se naučili, jak komunikovat s sadou Azure Speech Services SDK prostřednictvím různých programovacích jazyků a integrovat funkce Azure Speech to Text do vlastní platformy, určitě potřebujete nějakou pomoc. Naštěstí společnost Microsoft vytvořila komplexní katalog školicích materiálů pro platformu Azure, v níž najdete příklady kódu a užitečné tipy.. 

Sekce školení webu Azure obsahuje mnoho užitečných zdrojů. (Obrazový kredit: Microsoft)

Všichni zákazníci Azure mají také bezplatnou podporu fakturace a správy předplatného, ​​která je přístupná prostřednictvím systému vstupenek. Do vašeho účtu lze za opakující se poplatek přidat podrobnější podporu, a to již od 29 USD měsíčně.

Microsoft Azure Speech to Text: Final verdikt

Platforma Azure Speech to Text využívá nejmodernější technologii k poskytování téměř dokonalé transkripční služby. Je nejvhodnější pro firmy, které již investovaly do ekosystému Microsoft Office 365, protože vlastní modely hlasu a slovní zásoby lze bezpečně vygenerovat z vašeho stávajícího archivu dokumentů. Některé malé firmy mohou s Azure bojovat, protože správné nastavení vyžaduje pozornost kvalifikovaného vývojáře cloudů společnosti Microsoft.

Konkurence

Amazon Transcribe, Google Cloud Speech-to-Text a Watson Speech to Text jsou přímými konkurenty společnosti Microsoft Azure. Všechny tyto tři platformy jsou také schopny přesně provádět velkoobjemové dávkové přepisy. Google Cloud je jediným blízkým konkurentem, který dokáže pracovat s více jazyky než Azure, a je také levnější se startovací sazbou pouhých 0,006 $ za minutu ve srovnání s 0,017 $ Azure.

Chcete-li najít další alternativy k programu Microsoft Azure Speech to Text, podívejte se do našeho průvodce Nejlepší software pro převod řeči na text.