Microsoft 自定义语音服务 (CRIS)

用户3882060

我正在使用 CRIS 进行 POC,我们正在构建一个语音机器人,并希望针对动态条件和实时场景训练我们的机器人。

正如在 CRIS 中提到的,我们可以通过构建自定义声学模型来克服背景噪音障碍,我也想达到同样的目的。

我基于大约 4.5 小时的长度构建了 2 个自定义语音模型。第一个模型基于没有背景噪音的干净音频文件。第二个模型基于相同的音频文件,其中叠加了噪声。

上下文中的语言是简单的英语,没有特定的词汇。

两个模型的数据集相同,唯一的区别是在第二个模型的数据集中,所有文件都叠加了静态背景噪声。

我根据叠加有噪音的音频文件进行了准确性测试,但结果很奇怪。第二个模型给了我 93% 的 WER,第一个模型给了我 100% 的 WER,这对我来说真的很奇怪,因为第一个模型是针对背景噪声而不是第一个模型进行训练的,理论上第二个模型应该比第一个模型给出更少的 WER .

由于我无法在 CRIS 中看到幕后发生的事情,我想知道 CRIS 是否在背景噪音的情况下给出了有效的结果,或者它真的有效,如果是,那么我在尝试多次相同的结果时做错了什么。

信息系统

首先,93% 的 WER 非常高,只有在听音频时你几乎听不懂它才会发生。

我的理解是您创建了 3 个数据集:

  • training_1:4.5 小时的干净音频
  • training_2:4.5 小时嘈杂的音频
  • test_1:几分钟嘈杂的音频

我假设 training_2 和 test_1 中的噪声相似。注意:您不能在 training_2 中添加人工噪声并在 test_1 中使用真实噪声。训练数据必须代表测试数据。

如果我做对了,当您使用通过 training_1 训练的模型解码 test_1 中的音频时,您会得到 93% 的 WER。当您使用通过 training_2 训练的模型解码 test_1 时,您会得到 100% 的 WER。如果您使用我们的基线模型(Microsoft 对话模型)解码 test_1,您会得到什么结果?您可以简单地创建一个新的准确度测试来获得这个值。

如果您想分享更多详细信息和数据,请联系我们(链接位于https://cris.ai/底部)。我们可以仔细看看出了什么问题。

感谢您对自定义语音服务的关注。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Microsoft自定义语音服务可以一个接一个地接受音频文件和转录

来自分类Dev

Microsoft Graph 自定义用户属性

来自分类Dev

向Azure移动服务用户(Google,Twitter,Facebook,Microsoft)添加自定义角色

来自分类Dev

Microsoft认知语音服务-Android

来自分类Dev

Microsoft Azure移动服务Javascript自定义API执行数据库存储过程权限问题

来自分类Dev

Microsoft 认知服务:必应语音识别 XAML

来自分类Dev

使用 Microsoft Graph API 添加自定义标头并检索自定义标头

来自分类Dev

Microsoft.AspNet.Identity-自定义POCO类

来自分类Dev

自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

来自分类Dev

Microsoft Dynamics CRM 2011中的审核自定义

来自分类Dev

Microsoft Word中的内联自定义样式

来自分类Dev

Microsoft Chatbot的自定义聊天界面

来自分类Dev

自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

来自分类Dev

Microsoft Edge不会打开自定义ftp链接

来自分类Dev

在Microsoft Excel工作表中进行自定义查找

来自分类Dev

通过 Microsoft Graph 读取 Office 文档的自定义设置

来自分类Dev

由自定义代码定义/定义的Microsoft Visual Studio对象中的Javascript Intellisense

来自分类Dev

Android Wear自定义语音操作

来自分类Dev

自定义Python gTTS语音

来自分类Dev

是否可以在Google Glass上使用Android语音识别(作为自定义服务)?

来自分类Dev

我可以在Alexa语音服务中动态创建自定义插槽类型吗?

来自分类Dev

我可以在Alexa语音服务中动态创建自定义插槽类型吗?

来自分类Dev

在 Microsoft Azure 语音服务中获取客户端密钥

来自分类Dev

我可以使用Microsoft Band的SDK添加自定义按钮吗?

来自分类Dev

自定义按钮未显示在Microsoft Office Outlook Client 2010中

来自分类Dev

与Microsoft.AspNet.Identity的自定义成员身份-CreateLocalUser失败

来自分类Dev

如何为新的Microsoft.Asp.NET身份(MVC5)设置自定义架构

来自分类Dev

Microsoft.Owin.Security.OpenIdConnect和AzureAD v 2.0终结点的自定义参数

来自分类Dev

如何自定义Microsoft cmdline编译器cl的.exe文件名?

Related 相关文章

  1. 1

    Microsoft自定义语音服务可以一个接一个地接受音频文件和转录

  2. 2

    Microsoft Graph 自定义用户属性

  3. 3

    向Azure移动服务用户(Google,Twitter,Facebook,Microsoft)添加自定义角色

  4. 4

    Microsoft认知语音服务-Android

  5. 5

    Microsoft Azure移动服务Javascript自定义API执行数据库存储过程权限问题

  6. 6

    Microsoft 认知服务:必应语音识别 XAML

  7. 7

    使用 Microsoft Graph API 添加自定义标头并检索自定义标头

  8. 8

    Microsoft.AspNet.Identity-自定义POCO类

  9. 9

    自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

  10. 10

    Microsoft Dynamics CRM 2011中的审核自定义

  11. 11

    Microsoft Word中的内联自定义样式

  12. 12

    Microsoft Chatbot的自定义聊天界面

  13. 13

    自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

  14. 14

    Microsoft Edge不会打开自定义ftp链接

  15. 15

    在Microsoft Excel工作表中进行自定义查找

  16. 16

    通过 Microsoft Graph 读取 Office 文档的自定义设置

  17. 17

    由自定义代码定义/定义的Microsoft Visual Studio对象中的Javascript Intellisense

  18. 18

    Android Wear自定义语音操作

  19. 19

    自定义Python gTTS语音

  20. 20

    是否可以在Google Glass上使用Android语音识别(作为自定义服务)?

  21. 21

    我可以在Alexa语音服务中动态创建自定义插槽类型吗?

  22. 22

    我可以在Alexa语音服务中动态创建自定义插槽类型吗?

  23. 23

    在 Microsoft Azure 语音服务中获取客户端密钥

  24. 24

    我可以使用Microsoft Band的SDK添加自定义按钮吗?

  25. 25

    自定义按钮未显示在Microsoft Office Outlook Client 2010中

  26. 26

    与Microsoft.AspNet.Identity的自定义成员身份-CreateLocalUser失败

  27. 27

    如何为新的Microsoft.Asp.NET身份(MVC5)设置自定义架构

  28. 28

    Microsoft.Owin.Security.OpenIdConnect和AzureAD v 2.0终结点的自定义参数

  29. 29

    如何自定义Microsoft cmdline编译器cl的.exe文件名?

热门标签

归档