hlasové povely

Odpovědět
aladin
Příspěvky: 338
Registrován: 12 kvě 2013, 06:43

hlasové povely

Příspěvek od aladin »

Ahoj,
nenarazili jste někdo na hlasové povely pro ovládání, které si můžu sám nadefinovat? Představa je taková, že něco řeknu na mikrofon a výstupem je ideálně textový řetězec. A nejlépe sestava není připojena k internetu.
fischertip.cz, Stavebnice.com, MerkurRobot.cz, KlubTechniku.cz
Uživatelský avatar
fulda
Příspěvky: 1374
Registrován: 04 led 2016, 17:18

Re: hlasové povely

Příspěvek od fulda »

Nevím, jestli rozumím otázce. Je to něco, co je mimo rozsah těchto modulů?
Voice Recognition Module kit
EasyVR 3 Plus Shield for Arduino
SPEAK RECOGNITION, VOICE RECOGNITION MODULE V3

je jich plný internet...
Za pravopisné chyby v této zprávě může moje učitelka češtiny.
Uživatelský avatar
cube
Příspěvky: 7
Registrován: 20 úno 2023, 16:30
Kontaktovat uživatele:

Re: hlasové povely

Příspěvek od cube »

Myslím že na mikrofon -> string tyhle modulky nebudou dostatečně velká ráže. Před nějakou dobou jsem narazil na Mozilla DeepSpeech, ale nemám s tím žádné osobní zkušenosti a navíc se taky Mozilla nedávno zbavovala nějakých projektů, tak je otázka jestli je to ještě podporované.
butan
Příspěvky: 114
Registrován: 02 dub 2019, 07:06

Re: hlasové povely

Příspěvek od butan »

Telefony Nokia před 20-ti léty měly funkci, že majitel mohl namluvit do paměti několik slov, a telefon je pak rozpoznal jako povely. Třeba to tehdy někdo zkoumal a na HakersDay opublikoval?
Lubor
Doplňuji, tohle ovládání fungovalo pouze na původního řečníka, jeho hlas.
Uživatelský avatar
JPLABS
Příspěvky: 25
Registrován: 13 čer 2023, 22:45
Kontaktovat uživatele:

Re: hlasové povely

Příspěvek od JPLABS »

aladin píše: 25 led 2023, 12:58 ...Představa je taková, že něco řeknu na mikrofon a výstupem je ideálně textový řetězec. ...
Tak tohle ještě hodně dlouho nebude. :D Leda v nějakém scifi na TV Nova. Už jen pouhá konverze text to speech (převod textu na mluvené slovo) je docela nářez. Zkuste si vyguglit a vyzkoušejte. Napíšete text přes web do nějakého cloudu, který běží na superpočítači. Ten vám vrátí mp3 formát a vy si ho můžete přehrát. V lokále na pentiu udělat text to speech je docela problém.
Činčinové na letišti v Pekingu a Shanghai prodávají překladače ze světových jazyků do mandarinské čínštiny. Ve skutečnosti to je trik. Umí to základní fráze, například napíšete v angličtině "where is subway station?" a strojek má předenahraný text v mandarinské čínštině, který vyskřehotá nebo napíše znaky na displej. Pochopitelně ten strojek nerozumí mluvenému anglickému slovu ...

Zkuste si představit třeba modul, který by měl přeložit mluvenou anglickou frázi, rozkaz pro robota: "take me cofee" do textu. Na první pohled triviální, jenže angličan v Británii tuto frázi vysloví úplně jinak než Ind v Indii nebo anglicky mluvící rodilý Australan. To jen uvádím způsob mluvy téhož jazka v různých částech světa. A pak tu jsou potíže, že každý člověk ještě mluví s jinou intonací, jiným důrazem, jinou rychlostí, jinou výškou tonů pro znělé a neznělé hlásky ... Takže suma sumárum, velký problém pro programátory. Zkuste si někdy nahrát váš hlas přes mikrofon a pak si jej pusťte na osciloskop.
Odpovědět