逊克| 鄂托克前旗| 阜新市| 洱源| 雷波| 伊通| 惠东| 洪洞| 德昌| 阿拉善左旗| 德昌| 瑞昌| 克什克腾旗| 闵行| 平舆| 南部| 无极| 晴隆| 海兴| 德化| 陆河| 漳县| 荆州| 囊谦| 巴南| 带岭| 津南| 晴隆| 屏东| 江永| 十堰| 德令哈| 元氏| 阜新市| 吴忠| 巫山| 秀山| 天镇| 海阳| 休宁| 科尔沁左翼后旗| 广西| 康马| 通化县| 项城| 台前| 通山| 太康| 林西| 本溪满族自治县| 太康| 峰峰矿| 崇信| 易门| 博爱| 肇庆| 澄迈| 西吉| 开封县| 三台| 鄂州| 马尔康| 揭东| 淮滨| 金平| 红安| 博罗| 屯昌| 畹町| 冷水江| 临汾| 五营| 务川| 双江| 唐县| 兴仁| 新田| 平江| 开阳| 西畴| 富锦| 宁国| 武山| 满城| 南安| 鲁甸| 苍溪| 三台| 利津| 鹰手营子矿区| 赤峰| 黄岛| 集安| 翁牛特旗| 湖州| 东川| 永兴| 佳木斯| 利津| 印台| 丁青| 蒲江| 汶上| 息县| 望谟| 台江| 浦口| 湟源| 洱源| 珠穆朗玛峰| 南浔| 尉氏| 东港| 吉林| 法库| 黄岛| 东西湖| 集安| 广东| 钦州| 汉南| 咸阳| 海门| 拜城| 昆山| 灵台| 合水| 八一镇| 霍邱| 睢县| 福清| 盘县| 西和| 鄂托克前旗| 鸡东| 科尔沁左翼后旗| 眉县| 黑河| 泽普| 西峡| 海盐| 修水| 东营| 衡山| 临安| 大洼| 鹤岗| 扎兰屯| 科尔沁左翼中旗| 宁国| 崇州| 锦州| 巴南| 九江县| 房县| 和龙| 建水| 洪泽| 大通| 盈江| 治多| 青浦| 分宜| 偃师| 临高| 芜湖市| 大荔| 辛集| 台州| 冷水江| 南城| 当涂| 上犹| 札达| 甘南| 寿县| 吴忠| 徐闻| 尼木| 行唐| 毕节| 芦山| 郴州| 盐池| 景德镇| 包头| 相城| 温泉| 章丘| 顺德| 卢龙| 大同市| 太谷| 渭南| 正宁| 米泉| 铁岭县| 安顺| 成武| 东乌珠穆沁旗| 石屏| 会宁| 宜良| 青河| 扎鲁特旗| 乌达| 北仑| 岫岩| 阿克陶| 当涂| 余干| 清河| 东港| 曲松| 永寿| 津市| 龙胜| 陇川| 吉隆| 和政| 浙江| 吴堡| 辽源| 滨州| 井研| 清徐| 新晃| 台州| 土默特左旗| 南郑| 林芝镇| 绍兴市| 神农架林区| 门头沟| 美姑| 白朗| 嘉义县| 新会| 兴义| 阳曲| 腾冲| 黄埔| 敖汉旗| 山阳| 昌都| 滦南| 岗巴| 清原| 文安| 宣城| 台中县| 桑日| 溧水| 九寨沟| 环县| 万州| 休宁| 恩平| 定州| 惠农| 固原| 澄城| 盘锦| 象州|
|
|
51CTO旗下网站
|
|
移动端

谷歌开源AI能区分声音 准确率达92%

据 VentureBeat 报道,Google 人工智能研究部门在语音识别方面取得了新的进展,能从嘈杂的环境中分辨声音,准确率高达 92%。

作者:佚名来源:网易科技|2018-11-16 10:01

据 VentureBeat 报道,Google 人工智能研究部门在语音识别方面取得了新的进展,能从嘈杂的环境中分辨声音,准确率高达 92%。Google 人工智能研究部门在一篇名为《Fully Super vised Speaker Diarization》的论文中描述了这一新的 AI 系统,称它“能以一种更有效的方式识别声音”。

这套强大的 AI 系统涉及到 Speaker diarization 任务,需要标注出“谁”从“什么时候”到“什么时候”在说话,将语音样本分割成独特的、同构片段的过程。还能将新的演讲者发音与它以前从未遇到过的语音片段关联起来。

其核心算法已经开源可用。它实现了一个在线二值化错误率(DER),在NIST SRE 2000 CALLHOME基准上是7.6%,这对于实时应用来说已经足够低了,而谷歌之前使用的方法DER为8.8%。

谷歌研究人员的新方法是通过递归神经网络(RNN)模拟演讲者的嵌入(如词汇和短语的数学表示),递归神经网络是一种机器学习模型,它可以利用内部状态来处理输入序列。每个演讲者都从自己的RNN实例开始,该实例不断更新给定新嵌入的RNN状态,使系统能够学习发言者共享的高级知识。

研究人员在论文中写道:“由于该系统的所有组件都可以在监督环境下学习,所以在有高质量时间标记演讲者标签训练数据的情况下,它比无监督系统更受青睐。我们的系统受到全面监督,能够从带有时间戳的演讲者标签例子中学习。”

在未来的工作中,研究团队计划改进模型,使其能够集成上下文信息来执行脱机解码,他们希望这将进一步减少DER。研究人员还希望能够直接对声学特征进行建模,这样整个Speaker diarization系统就可以进行端到端训练。

【编辑推荐】

  1. 微软可能是全球最大的开源贡献者, 但开发者似乎并不买账
  2. 阿里巴巴又一开源项目被列入 CNCF 云原生全景图
  3. Facebook 开源 FBGEMM,服务器端推理优化库
  4. 谷歌终于要改进Android分享菜单了:将更快更好用
  5. Go 语言开源发布 9 周年!社区贡献指数创新高
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

实时UML与Rational Rose RealTime建模案例剖析

本书将实时系统、实时统一建模语言、实时系统的统一开发过程和Rational Rose RealTime建模环境有机地结合起来,以案例为基础,系统地介绍了...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊
林浦水闸 洒渔乡 福建路福建花园 西八犋牛村 东郭峪村
三表 八角庙 刘面铺 印刷术 华元村
乌兰察布盟 丁家堡 三合口乡 富源 开元中路虚拟居委会
岩脚乡 河圳 铁山 长寿桥 孟菲斯
克隆侠蜘蛛池 http://www.kelongchi.com/