孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故

频道:国际新闻 日期: 浏览:294

PConline资讯】谷歌AI的研讨人员正在把计算机视觉应用于频谱图,开发出了新的数据增强技能SpecAugment,能在不需求引进额定数据的情况下,使语音辨认体系功用到达最优。

4月24日音讯,据外媒报导,GoogleAI的研讨人员正在把计算机视觉应用于频谱图。SpecAugme清明上河图歌词nt能够在不改编基仪征础言语模型的情况下使语音辨认体系的功用到达最优。

研讨人员表明,SpecAugment办法不需求额定的数据,便可有用处理模型的过拟合问题,极大的减少了计算成本。

该效果详见4月18日宣布在预印本论文提交渠道arXiv的论文,论文名为《SpecAugmen孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故t:一种用于主动语音辨认的简略数据增强办法》(SpecAugment:ASimpleDataAugmentationMethodforAutomaticSpeechRecognition)。

一、新数据增强技能剑指过拟合问题

五行健康操免费下载

SpecAugment是谷歌AI研讨人员新开发的一种数据增强的技能,这种技能不同与传统的数据增强技能,在语音辨认方面,是对声波图直接进行增强,孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故而是另辟蹊径,对转化后的声波图——频谱图进行增强。

这种数据增强的技能,能更高效地处理主动语音辨认(ASR)体系模型呈现的过拟合问题。

过拟合是指,跟着练习次数增多模型会渐渐一寸相片的尺度是多少找出数据的形式,金海心近况能在尽可能多钓鱼岛地拟合数据点的家训一起反映数据趋势,假如持续练习,那模型就会进一炸鸡翅步发掘练习数据中的细节和噪声,为了拟合一切数据点“不择手法”。结果是,模型会对已知数据预测得很好,而对未知数据预测的很差。

一般人们选用增大数据量和测验样本集的办法来处理过拟合的问题,但这会添加计算成本。

而SpecAu蓝天航空公司gment无需引进额定的数据,经过直接对频谱图数据进行增强,来处理过拟合问题,然后提高语音辨认准确率。

二、SpecAugment使单词错生脉饮误率降至2.6%,

在传统的ASR中,音频波在被作为网络的练习数据之前一般被编码为可视图,例如频丧尸国度谱图。练习数据的增强一般会应用于声波图,然后增强后的声波图会转换为频谱图,这样一来,每次增强之后,都会生成新的频谱图。

而在SpecAugment增强的是频谱图自身而不是波形数据。因为增强功用直接应用于网络的输入特征,因而能够在练习期间在线运转,而不会孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故明显影响练习速度。

SpecAugment对频孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故谱图的修正方孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故式包含:沿时刻方向歪曲频谱图、屏蔽某一些接连的频率段的信号、以及及时屏蔽某一时刻段的发音。

为了测验SpecAugment,研讨人员将SpecAugment应用于Listen、Attend和Spell网络进行重名查询体系语音辨认,在衡量语音辨认技能的孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故干流开源数据集LibriSpeech960h得到的单词错误率(WER,衡量语音辨认技能水平的中心目标)是2.6%,在Switchboard300h语音辨认基准测验中得到的单词错误率为6.8%。

三、传统数据增强办法计算成本高

ASR体系能将语音翻译成文本,它应用于许多现代设备和产品中,比方Googletf卡的Alexa智能语音帮手、Android智能手机发短信和电子邮件时用到的Gboard虚拟键盘效劳、GoogleHome以及YouTube。

在开发基美国连体姐妹于深度学习的ASR体系方面仍存在许多重要应战。其中之一是ASR模型会呈现上文所说到的过拟合问题。

在语书剑盛唐音辨认方面,传统的数据增旱魃强一般用于声波图上,经过加快或减慢的手法让声波图变形,或许添加背景噪声。这种办法会让单数据的多个增强版别在练习内行进程中被反应到网络中,迫使网络学习相关特征,确实会协助网络变得更优。

但是,传统的增强音频输入的办法添加了额定的计算成本,而且有时需求额定的数据。

结语:新数据增强法提高语音辨认准确率

谷歌AI研讨人员DanielS.Park和研讨科学家WilliamChan(这两人也是论文作者)在博文中表明:尽管网络依然能够经过不断引进言语孕周计算器,单词错误率低至2.6%!谷歌新音频数据增强办法!,人情世故模型到达更优,但他们的研讨效果振奋人心的一点在于,在没有言语模型的协助下,SpecAugment练习的模型逾越了从前一切的办法。

谷歌SpecAugment这种新的语音数据增强技能将大幅提高语音辨认的准确率。假如这项技能能够被广泛应用,信任智能语音帮手将会更聪明。

谜语大全及答案
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
烽火1860
热门
最新
推荐
标签