hlasové povely

aladin · Příspěvek od **aladin** » 25 led 2023, 12:58

Ahoj,
nenarazili jste někdo na hlasové povely pro ovládání, které si můžu sám nadefinovat? Představa je taková, že něco řeknu na mikrofon a výstupem je ideálně textový řetězec. A nejlépe sestava není připojena k internetu.

fulda · Příspěvek od **fulda** » 25 led 2023, 13:36

Nevím, jestli rozumím otázce. Je to něco, co je mimo rozsah těchto modulů?
Voice Recognition Module kit
EasyVR 3 Plus Shield for Arduino
SPEAK RECOGNITION, VOICE RECOGNITION MODULE V3

je jich plný internet...

cube · Příspěvek od **cube** » 20 úno 2023, 16:38

Myslím že na mikrofon -> string tyhle modulky nebudou dostatečně velká ráže. Před nějakou dobou jsem narazil na Mozilla DeepSpeech, ale nemám s tím žádné osobní zkušenosti a navíc se taky Mozilla nedávno zbavovala nějakých projektů, tak je otázka jestli je to ještě podporované.

butan · Příspěvek od **butan** » 20 dub 2023, 21:20

Telefony Nokia před 20-ti léty měly funkci, že majitel mohl namluvit do paměti několik slov, a telefon je pak rozpoznal jako povely. Třeba to tehdy někdo zkoumal a na HakersDay opublikoval?
Lubor
Doplňuji, tohle ovládání fungovalo pouze na původního řečníka, jeho hlas.

JPLABS · Příspěvek od **JPLABS** » 26 dub 2024, 22:36

aladin píše: ↑25 led 2023, 12:58 ...Představa je taková, že něco řeknu na mikrofon a výstupem je ideálně textový řetězec. ...

Tak tohle ještě hodně dlouho nebude.

Leda v nějakém scifi na TV Nova. Už jen pouhá konverze text to speech (převod textu na mluvené slovo) je docela nářez. Zkuste si vyguglit a vyzkoušejte. Napíšete text přes web do nějakého cloudu, který běží na superpočítači. Ten vám vrátí mp3 formát a vy si ho můžete přehrát. V lokále na pentiu udělat text to speech je docela problém.
Činčinové na letišti v Pekingu a Shanghai prodávají překladače ze světových jazyků do mandarinské čínštiny. Ve skutečnosti to je trik. Umí to základní fráze, například napíšete v angličtině "where is subway station?" a strojek má předenahraný text v mandarinské čínštině, který vyskřehotá nebo napíše znaky na displej. Pochopitelně ten strojek nerozumí mluvenému anglickému slovu ...

Zkuste si představit třeba modul, který by měl přeložit mluvenou anglickou frázi, rozkaz pro robota: "take me cofee" do textu. Na první pohled triviální, jenže angličan v Británii tuto frázi vysloví úplně jinak než Ind v Indii nebo anglicky mluvící rodilý Australan. To jen uvádím způsob mluvy téhož jazka v různých částech světa. A pak tu jsou potíže, že každý člověk ještě mluví s jinou intonací, jiným důrazem, jinou rychlostí, jinou výškou tonů pro znělé a neznělé hlásky ... Takže suma sumárum, velký problém pro programátory. Zkuste si někdy nahrát váš hlas přes mikrofon a pak si jej pusťte na osciloskop.

RoboDoupě.cz

hlasové povely

hlasové povely

Re: hlasové povely

Re: hlasové povely

Re: hlasové povely

Re: hlasové povely