Watson je počítačový systém společnosti IBM pro zpracování přirozeného jazyka. Pohání slavný superpočítač odpovědí na otázky a řadu podnikových produktů založených na AI, včetně Watson Speech to Text. V naší recenzi Watson Speech to Text se podíváme na jednu z nejlepších aplikací pro převod řeči na text, která je ideální pro každého, kdo chce převádět zvuk na text v měřítku.

Platforma zpracování řeči Watson je k dispozici na platformě IBM Cloud. Je to univerzální nástroj a lze jej použít v mnoha kontextech, včetně přepisu diktátu a konferenčního hovoru. A co víc, na rozdíl od většiny ostatních aplikací pro převod řeči na text je k dispozici jako API, což vývojářům umožňuje mimo jiné začlenit jej do systémů hlasového ovládání..

Watson Speech to Text: Plány a ceny

Watson Speech to Text můžete použít ke zpracování až 500 minut zvuku zdarma za měsíc. Pokud chcete převést více než to, budete muset zaplatit za každou zvukovou minutu a rychlost se mění v závislosti na délce zpracovaného zvuku. Náklady se pohybují od 0,01 do 0,02 dolaru za minutu, a pokud požadujete model uživatelského jazyka IBM, platí se poplatek 0,03 dolaru za minutu. K dispozici jsou také prémiové plány Watson, které umožňují přístup k vylepšeným funkcím ochrany osobních údajů a zárukám dostupnosti.

Služba Watson pro převod řeči na text je stanovena na základě objemu obsahu, který potřebujete přepsat. (Obrazový kredit: IBM)

K systému Watson Speech to Text můžete také přistupovat prostřednictvím obecného odběru IBM Cloud. Zpracování přirozeného jazyka je pouze jedna aplikace v široké škále služeb AI, kterou můžete získat prostřednictvím produktu IBM Cloud, takže je to dobrá volba pro jakoukoli organizaci, která potřebuje přístup k vysokorychlostnímu přenosu dat, chatům nebo nástrojům převodu textu na řeč..

Watson řeč k textu: funkce

Díky flexibilní integraci API a dalším předem vytvořeným nástrojům IBM jde služba rozpoznávání řeči Watson daleko za základní přepis. Chcete-li jej například použít v kontextu zákaznických služeb, lze Watson Assistant nastavit tak, aby přímo zpracovával otázky v přirozeném jazyce nebo odpovídal na dotazy prostřednictvím telefonu..

Ve Watsonu IBM vytvořila platformu pro zpracování přirozeného jazyka bohatou na funkce. (Obrazový kredit: IBM)

Watson pracuje s živým zvukem v 11 jazycích a může importovat zvuky v různých předem nahraných formátech. Při streamování umožňuje diagnostická podpora v reálném čase uživatelům možnost vyzvat uživatele, aby se přiblížili k mikrofonu nebo změnili své prostředí. Působivý je také fakt, že Watson dokáže ve sdílené konverzaci rozlišit mezi různými reproduktory díky funkci Diarization Speaker, což je funkce, která stále podléhá beta testování.

Watson Speech to Text: Setup

Chcete-li používat Watson, musíte nejprve vytvořit účet IBM Bluemix. Registrace je bezplatná a bezbolestná, vyžaduje pouze e-mailovou adresu a heslo. Po přihlášení musíte do svého účtu přidat ustanovení pro službu Speech to Text. V této fázi dostanete několik pověření, které byste měli uložit do svých vlastních záznamů.

Registrace účtu IBM Bluemix je nezbytná k získání přístupu k úplné sadě funkcí společnosti Watson. (Obrazový kredit: IBM)

Až to uděláte, věci se stanou podstatně složitějšími. Chcete-li získat přístup k Watsonu, musíte přidat tato pověření do šarže kódu klientského jednotného vyhledávače zdrojů (CURL) a poté jej spustit ve vašem počítači. Chcete-li zjistit, jaký příkaz přesně volat, podívejte se na tohoto praktického průvodce. Pokud chcete pouze zjistit, jak dobře funguje systém Watson, aniž byste museli procházet všemi těmito obručemi, můžete to vyzkoušet na demonstračním webu IBM..

Rozhraní Watson k textu: Rozhraní

Na rozdíl od aplikací zaměřených na zákazníky, kteří využívají hlasový převod textu, jsou služby Watson navrženy tak, aby k nim bylo možné přistupovat prostřednictvím rozhraní API a kódu zabudovaného do jiných systémů. Z tohoto důvodu neexistuje žádný skutečný Watson “rozhraní”. Místo toho je Watson přístupný prostřednictvím tří různých internetových protokolů. Jedná se o WebSockets, REST API a Watson Developer Cloud.

Watson Speech to Text lze spravovat pomocí systému Watson Developer Cloud. (Obrazový kredit: IBM)

Chcete-li ovládat Watson, budete muset použít nástroj příkazového řádku, který se připojí k cloudu IBM prostřednictvím jedné z těchto tří tras. Rozhraní, které koncový uživatel komunikuje s Watsonem, bude muset postavit někdo z vývojového týmu samostatně.

Watson Speech to Text: Performance

Celkově nás ohromil způsob, jakým tato platforma pro zpracování přirozeného jazyka zpracovávala skutečnou řeč. Použili jsme Watson k přepisování klipů, které jsme zaznamenali v celé řadě náročných prostředí, jakož i do zvukových záznamů slavných projevů v několika z 11 podporovaných jazyků Watson.

Zjistili jsme, že Watson si vedl dobře s předem nahranou řečí. (Obrazový kredit: IBM)

Ačkoli chyby rostly častěji u klipů se spoustou šumu v pozadí, Watson obecně produkoval neuvěřitelně přesné výsledky. Z našich testů jsme odhadli, že k nepřesným chybám došlo v průměru pouze jednou za každých 150 slov. Ukázalo se však, proč funkce Watsonova diarizace reproduktorů zůstává v testování BETA, protože několikrát během našeho hodnocení byl jeden hlas označen jako samostatné reproduktory.

Watson Speech to Text: Support

Středisko zdrojů IBM nabízí spoustu dokumentace k lepšímu porozumění tomu, jak aplikovat Watson na váš konkrétní případ použití. Rovněž se vyplatí využívat integrace API a sady SDK vytvořené vývojářskou komunitou Watson a zveřejněné v GitHubu..

Stránka Watson API GitHub je dobrým zdrojem podpory pro službu Watson Speech to Text. (Obrazový kredit: IBM)

Pokud tam nenajdete řešení vašeho problému, můžete se obrátit přímo na IBM otevřením lístku podpory nebo kontaktováním telefonicky. Pokud jste se rozhodli pro některý z prémiových balíčků Watson, bude vaše používání Watson chráněno smlouvou Service Up Uptime.

Watson Speech to Text: Final verdikt

Pokud má vaše organizace know-how a zdroje pro řádnou integraci platformy IBM Watson Speech to Text do vašeho systému, budete mít z pokročilých funkcí, jako je diagnostika zvukového prostředí v reálném čase a výsledky prozatímní transkripce, užitek. Malé podniky a organizace se však budou potýkat s technickou výzvou řádného nastavení Watsonu.

Konkurence

Služba IBM Watson Speech to Text je přímým konkurentem služeb hromadného přepisu Google Cloud Speech-to-Text a Amazon Transcription. Oba jsou výrazně levnější než Watson, například Google Cloud přepis začíná na 0,006 $ za minutu. Všechny tři služby sdílejí podobné funkce, jako je přizpůsobená slovní zásoba, ale jednou funkcí, která z IBM Watsonu chybí, ale je k dispozici u obou konkurentů, je automatické rozpoznávání interpunkce..

Hledáte další řešení pro převod řeči na text? Podívejte se na našeho nejlepšího softwaru pro převod řeči na text.