Nová éra: audio verzi nám dělá umělá inteligence

AI Text to speach

Jak říká klasik: „Pokrok nezastavíš“. V loňském roce jsme dlouho řešili ekonomiku výroby audio verze našeho magazínu a nakonec jsme se rozhodli přejít na automaticky generovaný hlas pomocí AI. Proč? A co to znamená?

Člověk je stále lepší než AI

Audio verze našeho magazínu roky vznikala poctivou řemeslnou cestou. Dana dostávala od redakce texty, které namluvila svým jemným, příjemným a hlavně profesionálním hlasem. Pavel následně vzal nahrávky, provedl jejich profesionální mastering a dohlížel na to, abychom vychytali nejmenší detaily a chybičky. 268 čísel magazínu vzniklo díky této dvojici profesionálů, která si za to zaslouží obrovský dík a uznání.

Po třech měsících testování mohu zodpovědně říct, že minimálně v Češtině se zatím strojově generovaný hlas lidem nevyrovná. Přestože v posledních letech se Text-To-Speach neuvěřitelně posunulo dopředu díky strojovému učení (ML) a umělé inteligenci (AI), stále stroj nedosahuje kvalit člověka. Na druhou stranu, pokud bude pokrok pokračovat tempem, které sleduji poslední dva roky, můžeme se těšit na další významná zlepšení velmi brzy!

Proč jsme se pro změnu rozhodli?

Za vším hledej peníze! Ani v tomto případě to není jinak. Rok 2022 byl pro nás ekonomicky náročný stejně jako pro všechny ostatní a tak jsme se museli znovu podívat na skladbu našich nákladů. Audio verze byla nezanedbatelnou položkou, kterou jsme od samého počátku dotovali. Podle statistik a průzkumů, které jsme si dělali jen necelých 11% předplatitelů pravidelně poslouchá audio podobu magazínu, což negenerovalo dostatek prostředků na výrobu.

Proč jsme audio dotovali? Protože jej považujeme za velmi důležitý nástroj pro uživatele se zrakovým handicapem, a protože věříme, že prémiový magazín by měl nabízet maximální komfort svým předplatitelům. Proto jsme se pokusili v loňském roce zlepšit ekonomiku audio verze reklamní kampaní, cenovým zvýhodněním i tím, že jsme začali dávat audio verzi i na Apple Podcasty. Přineslo to své ovoce, ale výsledek nestačil.

Nakonec jsme našli kompromis. Protože jsme nechtěli audio zrušit, museli jsme snížit náklady. A to se nám nakonec podařilo s využitím moderních technologií. Audio verze generovaná AI není zatím tak dobrá jako byla verze namluvená a zpracovaná člověkem, ale věříme, že je dost dobrá a technologie se rychle zlepšuje.

 

Hledání nejlepší technologie

V posledních 3 měsících jsem vyzkoušel skoro tři desítky různých řešení. Absolvovali jsme několik privátních dem, s několika společnostmi jsme zkoušeli ladit jejich technologii pro naše potřeby a nakonec jsme skončili u Microsoft Cognitive services. Specifikem našich potřeb je fakt, že v českém textu máme poměrně velké množství cizojazyčných názvů firem, technologií a služeb. S touto kombinací se velmi špatně vypořádávají všichni. Zkoušeli jsme samozřejmě technologie Applu, Googlu, Amazonu a Microsoftu. Zkoušeli jsme menší specializované projekty a nakonec se technologie Microsoftu ukázala v češtině jako pro nás nejvhodnější a zároveň nejrychleji se vyvíjející.

 

Vyzkoušejte audio i vy

Chcete si vyzkoušet, jak zní audio verze iPure generovaná pomocí AI, vyzkoušejte aktuální rozhovor s Daníkem Březinou. Víme o slabinách, na kterých dál pracujeme a snažíme se vyladit nastavení, ale i tak nám připadá výsledek velmi dobrý.

A pokud vás audio verze iPure zaujala, můžete se ji předplatit s 30% slevou a to buď samostatně jako předplatné iPure AUDIO nebo se vším ostatním obsahem v rámci iPure ONE. Stačí při registraci nového či prodloužení stávajícího předplatného použít slevový kód AIAUDIO a to nejpozději do 15. února 2023!

 

Předplatit iPure

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *