同步操作将从 千里码工作室/SpeechToText 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
该项目为语音转文字项目,识别率达80到90,该项目完全开源,且支持离线部署。
项目内容包括:
语音、文本、视频实时通讯
基于(开源)AI柠檬的实时语音转文本
基于讯飞的实时语音转文本
基于vosk的实时语音识别
采用 python实现基于vosk 的实时语音识别, Java实现音频转写存在内存泄漏问题,暂未解决
vosk 安装: python -m pip install -U vosk
vosk 模型下载: https://alphacephei.com/vosk/models
需下载响应的训练模型,加压到位置src/main/resources/model
实时转写后端代码位置
实时转写前端代码位置
引入的js文件已做修改,必须使用该项目内的js
麦克风转写代码(测试)位置
wav文件转写代码位置
文件上传并转写代码位置
flask文件上传demo代码位置
可根据需要修改websoket连接地址和音频流发送频率
AI柠檬实现实时接收音频流并撰写
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。