Microsoft 自定义语音服务 (CRIS)

debugcn 发表于 Dev

用户3882060

我正在使用 CRIS 进行 POC，我们正在构建一个语音机器人，并希望针对动态条件和实时场景训练我们的机器人。

正如在 CRIS 中提到的，我们可以通过构建自定义声学模型来克服背景噪音障碍，我也想达到同样的目的。

我基于大约 4.5 小时的长度构建了 2 个自定义语音模型。第一个模型基于没有背景噪音的干净音频文件。第二个模型基于相同的音频文件，其中叠加了噪声。

上下文中的语言是简单的英语，没有特定的词汇。

两个模型的数据集相同，唯一的区别是在第二个模型的数据集中，所有文件都叠加了静态背景噪声。

我根据叠加有噪音的音频文件进行了准确性测试，但结果很奇怪。第二个模型给了我 93% 的 WER，第一个模型给了我 100% 的 WER，这对我来说真的很奇怪，因为第一个模型是针对背景噪声而不是第一个模型进行训练的，理论上第二个模型应该比第一个模型给出更少的 WER .

由于我无法在 CRIS 中看到幕后发生的事情，我想知道 CRIS 是否在背景噪音的情况下给出了有效的结果，或者它真的有效，如果是，那么我在尝试多次相同的结果时做错了什么。

信息系统

首先，93% 的 WER 非常高，只有在听音频时你几乎听不懂它才会发生。

我的理解是您创建了 3 个数据集：

training_1：4.5 小时的干净音频
training_2：4.5 小时嘈杂的音频
test_1：几分钟嘈杂的音频

我假设 training_2 和 test_1 中的噪声相似。注意：您不能在 training_2 中添加人工噪声并在 test_1 中使用真实噪声。训练数据必须代表测试数据。

如果我做对了，当您使用通过 training_1 训练的模型解码 test_1 中的音频时，您会得到 93% 的 WER。当您使用通过 training_2 训练的模型解码 test_1 时，您会得到 100% 的 WER。如果您使用我们的基线模型（Microsoft 对话模型）解码 test_1，您会得到什么结果？您可以简单地创建一个新的准确度测试来获得这个值。

如果您想分享更多详细信息和数据，请联系我们（链接位于https://cris.ai/底部）。我们可以仔细看看出了什么问题。

感谢您对自定义语音服务的关注。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-17

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

Microsoft 自定义语音服务 (CRIS)

Microsoft 自定义语音服务 (CRIS)

Microsoft自定义语音服务可以一个接一个地接受音频文件和转录

Microsoft Graph 自定义用户属性

向Azure移动服务用户（Google，Twitter，Facebook，Microsoft）添加自定义角色

Microsoft认知语音服务-Android

Microsoft Azure移动服务Javascript自定义API执行数据库存储过程权限问题

Microsoft 认知服务：必应语音识别 XAML

使用 Microsoft Graph API 添加自定义标头并检索自定义标头

Microsoft.AspNet.Identity-自定义POCO类

自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

Microsoft Dynamics CRM 2011中的审核自定义

Microsoft Word中的内联自定义样式

Microsoft Chatbot的自定义聊天界面

自定义Microsoft.AspNet.Identity.EntityFramework.UserStore <TUser>

Microsoft Edge不会打开自定义ftp链接

在Microsoft Excel工作表中进行自定义查找

通过 Microsoft Graph 读取 Office 文档的自定义设置

由自定义代码定义/定义的Microsoft Visual Studio对象中的Javascript Intellisense

Android Wear自定义语音操作

自定义Python gTTS语音

是否可以在Google Glass上使用Android语音识别（作为自定义服务）？

我可以在Alexa语音服务中动态创建自定义插槽类型吗？

我可以在Alexa语音服务中动态创建自定义插槽类型吗？

在 Microsoft Azure 语音服务中获取客户端密钥

我可以使用Microsoft Band的SDK添加自定义按钮吗？

自定义按钮未显示在Microsoft Office Outlook Client 2010中

与Microsoft.AspNet.Identity的自定义成员身份-CreateLocalUser失败

如何为新的Microsoft.Asp.NET身份（MVC5）设置自定义架构

Microsoft.Owin.Security.OpenIdConnect和AzureAD v 2.0终结点的自定义参数

如何自定义Microsoft cmdline编译器cl的.exe文件名？