Chris Ice Asked: 2010-12-02 11:47:08 +0800 CST2010-12-02 11:47:08 +0800 CST 2010-12-02 11:47:08 +0800 CST Dragon NaturallySpeaking的替代品? 772 该程序是否有 Ubuntu 替代方案? software-recommendation alternative speech-recognition 7 个回答 Voted Stefano Palazzo 2010-12-02T12:23:08+08:002010-12-02T12:23:08+08:00 维基百科上有一篇专门讨论这个问题的文章。 不幸的是,目前似乎没有一种解决方案可以运行得足够好,但有大量正在进行的项目。 您可能想翻阅解决方案列表,看看是否有任何适合您的需求。 鸭嘴兽: 总有可能使用WINE运行 Dragon Naturally Speech 。Platypus 项目正在创建将Dragon 的输出重定向到任何 Linux / X 应用程序的软件,而且它们已经走得很远了。 你绝对应该看看这个。 WinEunuuchs2Unix 2018-12-24T11:49:39+08:002018-12-24T11:49:39+08:00 如需更新答案,请参阅 2018 年 3 月的一篇文章:最佳免费 Linux 语音识别工具 - 开源软件。 本文重点介绍适用于 Linux 的最佳开源语音识别软件。请注意,某些软件处于早期开发状态,因此尚未准备好广泛采用。 在检查我们的建议之前,Jasper 值得特别提及。它是一个优秀的开源平台,用于开发始终在线的语音控制应用程序。您可能想知道为什么 HTK 没有出现在下面。当然,HTK 是一个流行的语音识别工具包。但是 HTK 没有资格在推荐的解决方案中出现。不是因为它的版权归微软所有,而仅仅是因为它是专有软件。 让我们探索手头的 6 种免费语音识别工具。对于每个标题,我们都编制了自己的门户页面,其中包含完整的描述和对其功能的深入分析。 开源语音识别工具 Mozilla DeepSpeech:百度 DeepSpeech 架构的 TensorFlow 实现(网站/来源)。 Kaldi:为语音识别研究人员设计的 C++ 工具包(网站/来源)。 CMUSphinx:用于移动和服务器应用程序的语音识别系统(网站/来源)。 deepspeech.pytorch:使用百度 Warp-CTC 实现 DeepSpeech2(网站/来源)。 Julius:两遍大词汇量连续语音识别引擎(网站/来源)。 Simon:灵活的语音识别软件。 Lincity 2011-04-27T07:58:57+08:002011-04-27T07:58:57+08:00 您可以从 ppa 安装 Chromium 11 版本ppa:chromium-daily/stable(如何添加 PPA)并将 --enable-speech-input 添加到启动器的末尾。 现在访问这个网站,哇!使用 html5 在 ubuntu 上进行语音转文本。 我在这里读到,如果你说慢一点,它会更准确。 dotancohen 2014-08-22T01:42:09+08:002014-08-22T01:42:09+08:00 言论自由-vr 是一个不错的开源语音转文本引擎。这里是源代码(在 Google Code 上) 请注意,它需要一些配置,这比 Dragon Naturally speak 的配置要少。 Anil Shanbhag 2013-09-05T07:56:47+08:002013-09-05T07:56:47+08:00 口授 为了扩展 Alaukik 的答案,有一些基于 Chrome 语音识别功能构建的应用程序。 我个人使用Dictanote(它与 Dragon 非常相似)。这是chrome 应用程序的链接。 John 2020-01-06T04:50:23+08:002020-01-06T04:50:23+08:00 试试Mozilla DeepSpeech一种用于自动转录的开源工具。但是您需要训练该工具或下载 Mozilla 的预训练模型。对于非常清晰的录音,准确率是比较好的。但对于我的项目,这仍然不够,因为录音有很多背景噪音,质量不好,我改用了Transcribear,它是基于网络的编辑器,可以自动转录,但你需要在线连接将录音上传到 Transcribear 服务器。 joseph_morris 2020-07-09T19:02:55+08:002020-07-09T19:02:55+08:00 如果您能够容忍 Google,那么 Chrome 中的 Google Docs 中有 Google Voice 输入功能。打开一个空白的谷歌文档,做工具->语音输入,点击麦克风然后说话。在 2020 年,它似乎比我上次在 2018 年左右尝试时要好,基于快速的单段测试,错误率似乎与 Dragon 差不多。不幸的是,较少的定制,不能教它不知道的单词的定制发音。这是文档。还有“语音输入中的语音”Chrome 插件,可在所有网络输入框中提供语音到文本。
维基百科上有一篇专门讨论这个问题的文章。
不幸的是,目前似乎没有一种解决方案可以运行得足够好,但有大量正在进行的项目。
您可能想翻阅解决方案列表,看看是否有任何适合您的需求。
鸭嘴兽:
总有可能使用WINE运行 Dragon Naturally Speech 。Platypus 项目正在创建将Dragon 的输出重定向到任何 Linux / X 应用程序的软件,而且它们已经走得很远了。
你绝对应该看看这个。
如需更新答案,请参阅 2018 年 3 月的一篇文章:最佳免费 Linux 语音识别工具 - 开源软件。
开源语音识别工具
您可以从 ppa 安装 Chromium 11 版本
ppa:chromium-daily/stable
(如何添加 PPA)并将 --enable-speech-input 添加到启动器的末尾。现在访问这个网站,哇!使用 html5 在 ubuntu 上进行语音转文本。
我在这里读到,如果你说慢一点,它会更准确。
言论自由-vr
是一个不错的开源语音转文本引擎。这里是源代码(在 Google Code 上)
请注意,它需要一些配置,这比 Dragon Naturally speak 的配置要少。
口授
为了扩展 Alaukik 的答案,有一些基于 Chrome 语音识别功能构建的应用程序。
我个人使用Dictanote(它与 Dragon 非常相似)。这是chrome 应用程序的链接。
试试Mozilla DeepSpeech一种用于自动转录的开源工具。但是您需要训练该工具或下载 Mozilla 的预训练模型。对于非常清晰的录音,准确率是比较好的。但对于我的项目,这仍然不够,因为录音有很多背景噪音,质量不好,我改用了Transcribear,它是基于网络的编辑器,可以自动转录,但你需要在线连接将录音上传到 Transcribear 服务器。
如果您能够容忍 Google,那么 Chrome 中的 Google Docs 中有 Google Voice 输入功能。打开一个空白的谷歌文档,做工具->语音输入,点击麦克风然后说话。在 2020 年,它似乎比我上次在 2018 年左右尝试时要好,基于快速的单段测试,错误率似乎与 Dragon 差不多。不幸的是,较少的定制,不能教它不知道的单词的定制发音。这是文档。还有“语音输入中的语音”Chrome 插件,可在所有网络输入框中提供语音到文本。