博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AWS研究人员找到改善Alexa语音和声音辨识
阅读量:6993 次
发布时间:2019-06-27

本文共 565 字,大约阅读时间需要 1 分钟。

AWS发表改善Alexa语音和声音辨识的两篇论文,皆是透过机器学习技术,来处理Alexa语音识别的问题。AWS第一个介绍的方法,是针对Alexa接收到来自电子媒体的干扰问题,像是电视或是收音机的声音,AWS团队开发出一套能够更好地辨识媒体音频的方法,且能够长时间持续检查音频,帮助Alexa过滤掉非用户语音的背景声音讯号。

AWS研究人员找到改善Alexa语音和声音辨识
另一个方法则是利用外部数据集,透过半监督式学习法,来训练出语音事件侦测模型,半监督式学习法是采用小型已标注的训练数据集,来对照到大型未标注的数据集,尤其是,AWS团队是用Tri-training的模式,也就是用三种不同的模型来训练同一个任务,但是使用些微不同的数据集,再用最终输出的结果,来校正半监督式学习常见的问题,因此,模型的错误最终会变改正。AWS的媒体侦测系统是建立在对声音特征的观察,不管电子媒体声音的内容,系统能够辨识出所有常见的媒体声音,AWS的网络模型设计就是试图要从特定的训练样本中萃取出声音特征,首先,先透过卷积式神经网络(CNN)作为特征萃取器,接着,就像许多在口语理解领域的机器学习模型,AWS也是用递归神经网络(RNN),该网络能够有序地进程列输入,而每一层网络的输出都会影响着下一层的输入。

转载于:https://blog.51cto.com/13373212/2383356

你可能感兴趣的文章
“两只小熊队”Alpha版本展示博客
查看>>
创建django的不同环境
查看>>
Top 10 command-line commands for managing Windows 7 desktops
查看>>
CentOS5.4安装samba服务
查看>>
学习笔记之简单工厂设计模式
查看>>
Spring+SpringMVC+MyBatis+Maven框架整合
查看>>
MFC读写文件
查看>>
linux优化
查看>>
手动制作mini linux详细步骤—之一
查看>>
kali密码离线破解
查看>>
Bootstrap优秀模板-Unify.2.6.2
查看>>
poj 3122 Pie (二分)
查看>>
在面试中如何展示虚拟机和内存调优技能
查看>>
C++命名空间学习笔记
查看>>
购物商城Web开发第五天
查看>>
剑指Offer第36题—Java版
查看>>
txt 简单操作
查看>>
jquery $(document).ready() 与window.onload的区别
查看>>
解决Android中,禁止ScrollView内的控件改变之后自动滚动
查看>>
Windows Phone 使用FlurrySdk
查看>>