Startup s rozpoznáváním hlasu se vydal na ambiciózní cestu, aby přeskočil Apple, Google a další technologické giganty. S AI by měl software rozumět 7 000 světových jazyků.
Speechmatika, britský startup pro rozpoznávání hlasu, právě zajistil financování série B ve výši 62 milionů dolarů. Cílem je vyvinout počítač, který rozumí všem hlasům světa. Rozpoznávání řeči je velkou výzvou pro vývojáře a ostře sledovanou záhadou v mnoha odvětvích. Tato technologie má důsledky pro rozhraní člověk-stroj v oblastech, jako je robotika, autonomní vozidla a osobní počítače, z nichž všechny budou těžit z počítačů, které dokážou přesně interpretovat přirozený jazyk.
Rozpoznávání řeči je proto jakýmsi technologickým vstupním bodem, potřebou trhu, která může vést k vývoji technologií, které budou mít širokou rezonanci a nepředvídatelný dopad na způsob, jakým interagujeme se stroji.
Velkou součástí výzvy je model školení. Většina tréninkových dat musí být klasifikována ručně, což znamená, že přesnosti lze dosáhnout pouze s velmi malou skupinou mluvčích. Speechmatics používá jiný přístup ve svém úsilí o reprezentativnější rozpoznávání řeči.
Na základě datových sad použitých ve Stanfordské studii Racial Disparities in Speech Recognition zaznamenal Speechmatics celkovou přesnost 82,8 % pro afroamerické hlasy ve srovnání s Google (68,6 %) a Amazonka (68,6). Tato úroveň přesnosti se rovná 45% snížení chyb při rozpoznávání řeči nebo ekvivalentu tří slov v průměrné větě.
Motor je vybaven stovkami tisíc jednotlivých hlasů využívajících reprezentativní hlasová data, která nevyžaduje žádný lidský zásah. To pomohlo rozšířit její dosah mimo anglicky mluvící.
„Náš pokrok za posledních několik let vyvolal silný zájem investorů o naše financování ze série B,“ řekla Katy Wigdahl, generální ředitelka. „Tým Speechmatics je velmi ambiciózní.“
Motor v současné době obsahuje 34 jazyků, ale po celém světě se mluví více než 7 000 jazyky. Platforma však dosáhla působivého pokroku v oblasti interpunkce, čísel, měny a adres, které tradičně brzdí motory pro rozpoznávání hlasu.
To vše vyvolalo velký zájem o společnost se sídlem ve Spojeném království. Platformu využívají společnosti jako 3Play Media, Veritone, Deloitte UK a Vonage a také vládní agentury po celém světě. V souladu se svými globálními cíli má Speechmatics ústředí ve Velké Británii, ale má také pobočky v Bostonu (USA), Chennai (Indie) a Brně (Česká republika).

„Zlý zombie evangelista. Bacon maven. Alkoholový fanatik. Toužebný myslitel. Podnikatel.“
