1 Star 0 Fork 46

K.L.Zous / SpeechToText

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.md 2.93 KB
一键复制 编辑 原始数据 按行查看 历史
YZD 提交于 2021-08-20 18:52 . docs: doc

websocket 实时 语音转文字 应用

该项目为语音转文字项目,识别率达80到90,该项目完全开源,且支持离线部署。

项目内容包括:

  • 语音、文本、视频实时通讯

  • 基于(开源)AI柠檬的实时语音转文本

  • 基于讯飞的实时语音转文本

  • 基于vosk的实时语音识别

AI柠檬-部署、启动说明

  • idea配置tomcat启动
  • 默认端口:8080
  • 录音访问地址:http://localhost:8080/ws/luyin3.html
  • 实时语音撰写时,将在项目路径存储音频文件
  • 控制台实时输出转写结果
  • 页面实时展示转写结果
  • 实时调用ARST语音转写服务器
  • javas实现

vosk-部署、启动说明

采用 python实现基于vosk 的实时语音识别, Java实现音频转写存在内存泄漏问题,暂未解决
vosk 安装: python -m pip install -U vosk
vosk 模型下载: https://alphacephei.com/vosk/models
需下载响应的训练模型,加压到位置src/main/resources/model

  • 实时转写后端代码位置

  • 实时转写前端代码位置

    引入的js文件已做修改,必须使用该项目内的js

  • 麦克风转写代码(测试)位置

  • wav文件转写代码位置

  • 文件上传并转写代码位置

  • flask文件上传demo代码位置

转写说明

参考网址

Java
1
https://gitee.com/hellozous/speechToText.git
git@gitee.com:hellozous/speechToText.git
hellozous
speechToText
SpeechToText
master

搜索帮助

53164aa7 5694891 3bd8fe86 5694891