voiceProject:使用VOSK进行语音识别和综合库的Python开发,创建了一些实用程序,例如NUXERA assist

  • Q2_181345
    了解作者
  • 69.4MB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-06-08 07:50
    上传日期
更改为英文版 语音项目 :speaker_high_volume: VoiceProject是交互式和沉浸式多媒体系统(SMII)主题项目的一个项目,选修了UPV的计算机工程专业四年级。 该项目旨在演示语音识别和合成库的不同用途 :speaker_high_volume: 。 您可以在此回购中找到什么? :rocket: 在此项目中,您可以找到由VOSK制作的名为的基本助手,该助手可以自动播放SNES的语音或带有语音的Eliza语音。 前提条件 :clipboard: 这些程序及其各自的安装脚本旨在在Ubuntu 20.04上运行 :laptop: 因此,不能保证在其他发行版或操作系统中的操作,我们邀请您进行拉取请求,为您的系统添加更改。 要获取所有代码,请在系统上运行以下命令: > git clone https://github.com/UzuRodri95/voiceProject 安装 :wrench: 以下是安装项目的步骤。 每个项目都有一个唯一的依赖项安装脚本: 执行步骤 »Nuxera,GNU /
内容介绍
# Nuxera, un asistente para GNU/Linux. ## Contenido �윋� En esta carpeta encontrar찼s, un archivo de [instalacion](https://github.com/UzuRodri95/voiceProject/blob/main/nuxera/installNuxera.sh) , un archivo con posibles [acciones](https://github.com/UzuRodri95/voiceProject/blob/main/nuxera/acciones.txt) para el asistente, un programa b찼sico del asistente llamado [asistente b찼sico](https://github.com/UzuRodri95/voiceProject/blob/main/nuxera/asistenteBasico.py) , un programa avanzando del [asistente sin text to speech](https://github.com/UzuRodri95/voiceProject/blob/main/nuxera/asistenteArchswtoTtS.py) y un [asistente completo](https://github.com/UzuRodri95/voiceProject/blob/main/nuxera/asistenteArchs.py) Tambi챕n encontrar찼s una carpeta *model* que contiene el modelo en castellano de [vosk](https://alphacephei.com/vosk/models), el asistente b찼sico necesitar찼 ser ejecutado en castellano pero las otras versiones no requieren de esa versi처n del modelo y pueden utilizar cualquier otro, diponible en la documentaci처n de [vosk](https://alphacephei.com/vosk/models). ## Instalaci처n �윍� A continuaci처n se indican los pasos para la instalaci처n de un proyecto. Cada proyecto cuenta con un script 첬nico de instalaci처n de dependencias: Pasos para su ejecuci처n ## 쨩Nuxera, un asistente b찼sico de voz para GNU/Linux. * Instalaci처n de dependencias ```Bash > chmod +x installNuxera.sh > sudo ./installNuxera.sh ``` * Una vez instaladas las dependencias, simplemente ejecuta con Python 3 el programa deseado: ```Bash > python3 asistenteArch.py ``` * Por 첬ltimo, asegurate de tener la carpeta *model* en el mismo directorio del programa, la puedes encontrar en la carpeta de cada proyecto o descargarla desde la documentaci처n de [vosk](https://alphacephei.com/vosk/models), puedes elegir el idioma que desees y descargar el modelo de ese idioma. ## Uso de Nuxera �윊� Como hemos visto en la secci처n anterior para ejecutar el programa hay que ejecutar la siguiente orden en el directorio del trabajo: ```Bash > python3 asistenteArch.py ``` Las versiones avanzadas cuentan con dos estados principales. La creaci처n de *acciones* y la ejecuci처n de estas. ### 쩔C처mo se crean las acciones? Las acciones se pueden crear de dos formas. El * Si no existe el fichero *acciones.txt* el programa al ser ejecutado normalmente crear찼 el fichero y ejecutar찼 el men첬 de creaci처n de acciones. El men첬 tiene las siguientes partes. 1) Acci처n que el asistente espera oir. Este campo es obligatorio, hay que escribir exactamente la acci처n que se quiere pronunciar, tildes inclu챠das. 2) Acci처n que se ejecutar찼 en Bash, esta acci처n tiene que ser valida en el sistema que se ejecuta. Este campo, por lo tanto, es obligatorio. 3) Contestaci처n del asistente, este campo es opcional, en el caso del asistente con text to speech ser찼 el que se lea y imprima por pantalla, y en caso sin text to speech ser찼 solamente impreso por pantalla. * La otra manera de entrar en la creaci처n de acciones es con la flag *-i* o *--instructions*, esta flag permite a챰adir acciones, manteniendo las anteriores, desplega el mismo men첬 que en el caso anterior. Una vez creadas las acciones el programa terminar찼 su ejecuci처n listo para ejecutarse y tener una ejecuci처n normal. ### Otras opciones Todas las versiones cuentan con la flag *-h* o *--help*, esta flag permite ver todas las opciones del programa, incluyendo las que otorga Vosk: ```Bash > python3 asistenteArchs.py -h usage: asistenteArchs.py [-h] [-l] [-f FILENAME] [-m MODEL_PATH] [-d DEVICE] [-r SAMPLERATE] [-i] optional arguments: -h, --help show this help message and exit -l, --list-devices show list of audio devices and exit -f FILENAME, --filename FILENAME audio file to store recording to -m MODEL_PATH, --model MODEL_PATH Path to the model -d DEVICE, --device DEVICE input device (numeric ID or substring) -r SAMPLERATE, --samplerate SAMPLERATE sampling rate -i, --instructions This flag is used to add instructions to the actions file ``` ## Construido con �윖좑툘 * [Vosk](https://alphacephei.com/vosk/) - La librer챠a de voz usada * [Python 3](https://docs.python.org/3/) - El lenguaje de programaci처n usado * [PyTTS](https://pypi.org/project/pyttsx3/) - Modelo de text to speech offline. * [gTTS](https://gtts.readthedocs.io/en/latest/) - Modelo de text to speech online. Para m찼s dudas leer el [Readme](https://github.com/UzuRodri95/voiceProject) principal.
评论
    相关推荐