Subscribe Now

* You will receive the latest news and updates on your favorite celebrities!

Trending News
News

Deepl spouští překlad hlasu v realném čase

Deepl spouští překlad hlasu v realném čase

DeepL, německá společnost známá jako jeden z nejpřesnějších textových překladačů, spustila DeepL Voice – sadu nástrojů pro hlasový překlad v reálném čase. Jde o výrazný posun od textové práce k živé mluvené komunikaci, která má odstranit jazykové bariéry v mezinárodních firmách přímo během hovoru. Technologie kombinuje rozpoznávání řeči, vlastní jazykové modely a syntézu hlasu do jednoho workflow, které překládá okamžitě, jak člověk mluví.

Firma za tím stojí od roku 2009, kdy ji založili Gereon Frahling a Jaroslaw Kutylowski. DeepL Translator, jejich hlavní produkt, přišel v roce 2017 a rychle si získal pověst díky přesnějším překladům než měly tehdejší nástroje od Googlu nebo Microsoftu. Společnost staví na vlastních neuronových sítích trénovaných primárně pro jazykové úlohy, ne jako vedlejší produkt obecného AI vývoje. Dnes s nimi pracuje přes 200 000 firem, od malých týmů až po velké korporace.

DeepL Voice nabízí tři hlavní formáty. DeepL Voice for Meetings funguje jako doplněk pro Zoom a Microsoft Teams – posluchači slyší překlad v reálném čase ve svém jazyce, zatímco mluvčí pokračuje ve svém. DeepL Voice for Conversations je mobilní aplikace pro osobní konverzace tváří v tvář, typicky pro obchodní schůzky nebo podporu zákazníků na místě. Třetí varianta, DeepL Voice for API, umožňuje firmám stavět vlastní řešení pro call centra, firemní aplikace nebo specifické workflows, kde je potřeba překlad integrovat hlouběji do systémů.

Technologie pracuje s více než stem jazyků. Na rozdíl od jednoduššího řetězení existujících nástrojů (speech-to-text, text translation, text-to-speech) DeepL postavil specializované modely, které jsou trénovány specificky pro hlasový překlad. To znamená lepší zachování kontextu, rychlejší odezvu a menší latenci. Firma zdůrazňuje, že překlad běží průběžně – nepřekládá až celou větu, ale postupně, jak mluvčí mluví, což zkracuje čekání.

Klíčovým problémem hlasového překladu je čas. Textový překlad může počkat, dokud uživatel nedokončí myšlenku. U hlasu musí systém začít překládat dřív, než je věta dokončená, jinak vznikají frustrující pauzy. DeepL říká, že jejich modely jsou trénované tak, aby dokázaly predikovat konec věty a překládat s minimálním zpožděním. Podle firmy je to možné díky tomu, že neuronové sítě jsou od začátku stavěné jen pro jazyky, ne jako univerzální LLM, které dělají všechno.

Dalším aspektem je přesnost v technickém kontextu. Firmy používající DeepL Voice potřebují, aby systém správně překládal oborové termíny z inženýrství, medicíny nebo práva. DeepL umožňuje nahrát firemní glosáře – seznamy termínů a jejich preferovaných překladů – které Voice používá při práci. To je důležité pro konzistenci komunikace napříč mezinárodními týmy.

Firma na pozadí také pracuje na voice cloning technologii, která by umožnila zachovat barvu hlasu mluvčího i v překladu. Jde zatím o výzkumnou fázi, ale naznačuje směr: překlad, který nezní jako robotický hlas, ale zachovává osobnost mluvčího. V současné verzi Voice už DeepL nasazuje pokročilé TTS modely, které znějí přirozeněji než starší generace syntetických hlasů.

Zajímavé je nasazení v různých odvětvích. DeepL uvádí použití ve výrobě, kde Voice pomáhá týmům kontroly kvality nebo bezpečnosti komunikovat s mezinárodními partnery bez tlumočníka. V call centrech se API používá pro vícejazyčnou podporu zákazníků – agent mluví svým jazykem, zákazník slyší překlad. V salesu umožňuje Voice rychlejší jednání s klienty, kteří nemluví stejným jazykem.

DeepL Voice je placená služba. Přesné ceny firma neuvádí veřejně, ale jde o enterprise pricing – zákazníci platí podle počtu uživatelů, objemu použití nebo typu integrace. API je fakturované podle počtu minut přeloženého audio. Meetings addon je dostupný jako součást DeepL Pro nebo firemních balíčků.

Konkurence v hlasovém překladu roste. Google nabízí Live Translate v Pixel telefonech, Microsoft má real-time translation v Teams už roky, nově přicházejí startupy jako Interprefy nebo Wordly. DeepL sází na to, že jejich specializace na jazyky a pověst za kvalitu textového překladu jim dají náskok. Firma tvrdí, že jejich přesnost je vyšší díky modelům stavěným čistě pro lingvistiku, ne jako obecný AI produkt.

Zdroje:

Related posts

www.airevue.cz