alpacartaw:通过语音识别以多种语言生成实时字幕,并大声朗读它们。 (与obs和obs-Websocket

  • b2_720128
    了解作者
  • 11.3KB
    文件大小
  • zip
    文件格式
  • 0
    收藏次数
  • VIP专享
    资源类型
  • 0
    下载次数
  • 2022-06-09 09:41
    上传日期
亚太地区 通过语音识别以多种语言生成实时字幕,并大声朗读它们(使用obs和obs-Websocket) 从语音识别中实时翻译,并通过语音合成读出识别结果和翻译结果。 通过与OBS链接,语音识别的字符串和翻译的字符串显示在OBS上。 操作环境 谷歌浏览器 OBS + OBS-Websocket localhost.run(或其他隧道工具,例如ngrok) 如何使用localhost.run 在运行OBS的PC上打开命令提示符,然后执行以下操作: > ssh -R 80:localhost:(OBS-WebSocketで指定したポート番号) localhost.run 如果命令失败,请参阅。 如果看到“使用tls终止通过隧道传输xxxxxx.localhost.run”,则说明操作已完成。 要从ALPACARTAW连接,请为IPAddr指定xxxxxx.localhost.run,
alpacartaw-master.zip
  • alpacartaw-master
  • silentbreaker.js
    952B
  • index.js
    8.8KB
  • translate.js
    808B
  • README.md
    6.5KB
  • listen.js
    1.5KB
  • index.html
    6.9KB
  • obs.js
    3.8KB
  • index.css
    968B
  • CNAME
    23B
内容介绍
# ALPACA-RTAW generAtes reaL-time subtitles in multiPle lAnguages ​​from voiCe recognition And Reads Them Aloud. (with obs and obs-Websocket 音声認識からリアルタイムで翻訳し、認識結果と翻訳結果を音声合成で読み上げる。 OBS連携することで、音声認識した文字列と翻訳した文字列をOBS上に表示する。 # 動作環境 - Google Chrome - OBS + OBS-Websocket - localhost.run (またはngrokなど他のstunnelツール) ## localhost.run の使い方 OBSの動いてるPC上でコマンドプロンプトを開いて以下を実行する。 ```shell > ssh -R 80:localhost:(OBS-WebSocketで指定したポート番号) localhost.run ``` コマンドに失敗する場合は[FAQ](http://localhost.run/docs/faq)を見ること。 「xxxxxx.localhost.run tunneled with tls termination」と出れば完了。 ALPACARTAWから繋ぐには、IPAddrにxxxxxx.localhost.run、Portに443を指定する。 # SpeechRecognition ## Recognize continuity 音声認識が行われるたびに、継続的に結果を返すのか、あるいは1つの結果のみ返すのかを制御する。(ON:する / OFF:しない) デフォルト:する ## Recognize lang 音声認識する言語を設定する。 デフォルト:ja_JP ## Start 音声認識を開始する。 # Speech translate settings ## GAS deploy key 翻訳機能を持つgoogle apps scriptのデプロイキーを設定する。 デフォルト:アルパカさんの 落ちてる場合は自分で用意すること。 ``` js // サンプル function doGet(e) { var p = e.parameter; var translatedText = LanguageApp.translate(p.text, p.source, p.target); return ContentService.createTextOutput(e.parameter.callback + '({"translated" : "' + translatedText + '"});').setMimeType(ContentService.MimeType.JAVASCRIPT); } ``` ## Native lang 母国語を設定する。 デフォルト:ja ## Foreign lang 翻訳対象の言語を設定する。 デフォルト:en ## Test 翻訳をテスト実行する。 テスト文字列は日本語なので、NativeLangには"ja"を設定しておくこと。 # Speech voice settings ## Native voice 母国語の音声を設定する。 デフォルト:取得可能な音声一覧の先頭 ## Volume 母国語の音声の音量を設定する。 デフォルト:1 ## Pitch 母国語の音声の音程を設定する。 デフォルト:1 ## Rate 母国語の音声の速度を設定する。 デフォルト:1 ## Test 母国語で音声合成をテスト実行する。 ## Foreign voice 翻訳対象の言語の音声を設定する。 デフォルト:取得可能な音声一覧の先頭 ## Volume 翻訳対象の言語の音声の音量を設定する。 デフォルト:1 ## Pitch 翻訳対象の言語の音声の音程を設定する。 デフォルト:1 ## Rate 翻訳対象の言語の音声の速度を設定する。 デフォルト:1 ## Test 翻訳対象の言語で音声合成をテスト実行する。 # OBS connection settings [OBS](https://obsproject.com/ja)と[OBS-Websocket](https://github.com/Palakis/obs-websocket)の設定をしておくこと。 ## 動作確認環境 OBS:26.1.1 OBS-Websocket:4.9.0 ## IPAddr OBSがインストールされているPCのIPv4アドレスを設定する。 デフォルト:localhost ## Port OBS-Websocketで設定したポート番号を指定する。 デフォルト:4444 ## Password OBS-Websocketで設定したパスワードを指定する。 ## Connect OBSに接続する。状態はボタン右に表示される。 - OPEN OBSとの接続を開始した。 - CONNECTED OBSとの接続が完了した。 - ERROR OBSとの接続に失敗した。 # OBS TextGDIPlus settings ## Native source 母国語表示用のOBSのテキストソース名を設定する。 デフォルト:native ## Foreign source 翻訳対象の言語のOBSのテキストソース名を設定する。 デフォルト:foreign ## Silent breaker source 該当機能用のOBSのテキストソース名を設定する。 デフォルト:silent ## Timeout OBSのテキストソースに表示された字幕が消えるまでの時間(ミリ秒)。 デフォルト:未設定 - 未設定、数値として評価できない場合は消えない - 1000ms未満の場合は5000msになる ## Use interimResults Windowsのみ 音声認識の途中経過を取得するか?(ON:する / OFF:しない) デフォルト:OFF この機能をONにした場合、以下の処理が発生する。 - OBSに途中経過を送信する。 - 「Native source」で指定したテキストソースに「rtawfilter」という名前のフィルターがかかっている場合、それを以下のように制御する。 -> 途中経過の場合はフィルターをON -> 確定した場合はフィルターをOFF 例えば、予め色補正フィルター(不透明度50など)を付けておくことで途中経過は半透明、確定したらフィルターが外れて不透明になる。といったことができる。 # Silent breaker settings SilentBreaker機能は、無言状態を検知すると起動し、任意の文字列をOBSに送出、読み上げる。 ## Use silent breaker 該当機能を使用するか?(ON:する / OFF:しない) デフォルト:OFF ## Timer 無言状態と判断するまでの時間(ミリ秒) デフォルト:なし ## Text/URL 該当機能で使用する任意の文字列。 httpから始まる場合はURLと判断し、該当URLからの応答結果(テキスト)を使用する。 (XMLやJSONなどのフォーマット解析には対応していない) デフォルト:なし ## Voice 該当機能の言語の音声を設定する。 デフォルト:取得可能な音声一覧の先頭 ## Volume 該当機能の言語の音声の音量を設定する。 デフォルト:1 ## Pitch 該当機能の言語の音声の音程を設定する。 デフォルト:1 ## Rate 該当機能の言語の音声の速度を設定する。 デフォルト:1 ## Test 該当機能の言語で音声合成をテスト実行する。 # 特記 - 各項目はパスワード以外クライアントPCに保存し、パスワードのみ画面を閉じると削除する。
评论
    相关推荐
    • MarchMadnessTVControl:一个针对ipad的PVR Kodi控制器,适用于March Madness。 使用w
      使用bootstrap和websocket来控制4个单独的Kodi实例,并且格式化后可以在iPad上使用。 设置 克隆代码并与网络服务器(即nginx)一起使用 在index.html上脚本的开头设置变量(Kodi IP地址,PVR通道和颜色) 特征 独立...
    • sgcWebSockets4源码版,支持D7~XE10.3.2
      sgcWebSockets4.1.0源码版,包含Intraweb 15.0.18安装包,支持D7~XE10.3.2
    • OctoControl-iOS:iOS应用程序,用于使用OctoPrint控制3D打印机
      八度控制 一个iOS应用程序,用于控制由OctoPrint驱动的3D打印机 ... -摄像头监控-iPad UI-声音控制-STL上传-支持多台打印机-今日查看小部件的打印状态-打印状态通知 信用 用于Websockets的 相容性 iOS 8以上
    • StackExchange开源WebSocket类库NetGain.zip
      NetGain是Stack Overflow(StackExchange)开源的一个高性能的websocket服务端类库。 它只有一个dll:StackExchange.NetGain.dll。 Stack Overflow使用 websocket 向用户推送实时的更新内容,比如顶部栏中的通知、...
    • newgcWebSockets 4.1.0.Full.Source稳定版
      indy卸载安装出了点问题,自己重新下了个indy10解决了。控件在D7 上已安装成功,放心使用。 负载平衡,MQTT协议支持,修正大量Bug,最新稳定版,Delphi7/XE6/XE7/XE8
    • svl-panel-server
      此时,该服务器仅用于为第一代iPad提供支持,而第一代iPad无法直接通过Websocket与JMRI通信。 注意:这些面板只能在。 您可以用自己的用户面板替换userPanels中的文件,以控制自己的布局(以docs目录中描述的格式...
    • relic-recovery:FTC团队#8367 ACME Robotics在2017-2018赛季使用的代码
      com.acmerobotics.dashboard —基于Websocket的仪表板的后端。 它提供遥测功能以及有关机器人姿势和当前路径的信息,以进行可视化。 此外,它使用反射来简化可在OpMode运行时设置的配置变量。 可以在找到更多信息。 ...
    • newgcWebSockets 4.1.0.Full.Source稳定版
      负载平衡,MQTT协议支持,修正大量Bug,最新稳定版,Delphi7/XE6/XE7/XE8
    • cosmic-shapes:简单的canvas cordova应用程序可实现几何可视化
      宇宙形状 简单的canvas cordova应用程序可实现几何可视化 设置 ... 建立websocket连接 绑定事件监听器 在画布上绘画开始录制 在停止队列中,MediaStream和最终状态的图像 运行队列解析并取消套接字
    • SIM800C_MQTT.rar
      使用SIM800C模块,使用MQTT协议,连接中国移动onenet平台,能实现数据的订阅、发布、存储等