Stap 3: De Software
Nu zult u moeten een paar softwarepakketten geïnstalleerd voordat we onze code kan worden uitgevoerd. Kopieer en plak de volgende opdracht in uw terminal om dit te doen:
sudo apt-get update && sudo apt-get install git python-gst0.10 gstreamer0.10-pocketsphinx
Je moet ook wat boilerplate code om alles uitgevoerd te krijgen - we hebben verstrekt het hier. na het navigeren naar de gewenste locatie voor de bestanden die moeten worden, installeren met dit commando:
git clone <a href="https://github.com/smartin015/MultiRoomSTT.git" rel="nofollow"> https://github.com/smartin015/MultiRoomSTT.git</a>
Tot slot, wisseling woninggids voor naar de MultiRoomSTT en het hoofdbestand uitvoeren:
python main.py
Het script zal alle van de audio-invoerapparaten die het kan vinden een lijst. Druk op enter, en een bos van setup tekst zal lopen door. Spreken in een van de microfoons die u hebt ingesteld, verschijnt een bos van lijnen van het volgende formaat:
(<translation id>) <audio id>: <transcription>
Dit zijn de resultaten van het gedeeltelijke transcriptie - de vertaling ID blijft hetzelfde totdat de transcriptie is voltooid, op welk punt u een lijn die begint zien zult met "###" om aan te geven een volledige transcriptie. De audio-ID geeft aan welk audioapparaat is worden getranscribeerd en de transcriptie geeft aan wat de Sphinx dacht dat het gehoord via de microfoon.
Als je hebt gemaakt deze ver, gefeliciteerd! Je hebt een werkende setup voor de spraak-naar-tekst van de multi-microfoon. Maar we zijn zeker dat u zou willen betere transcriptie nauwkeurigheid, en misschien een kijkje onder de motorkap op de python-script.
Hieronder leest u meer over beide!