口音成语音识别发展最大公敌,新解决方案正在开发中
语音对于人机交互的重要性毋庸置疑,无论是国内外企业,都在语音识别的速度、准确度以及多语种方面持续创新,但是当机器面对那些有口音的人来说,似乎就没有那么灵敏了:不仅注意力会不集中,反应迟钝,甚至还会成为一个独立的个体,不予任何回应。
语音对于人机交互的重要性毋庸置疑,无论是国内外企业,都在语音识别的速度、准确度以及多语种方面持续创新,但是当机器面对那些有口音的人来说,似乎就没有那么灵敏了:不仅注意力会不集中,反应迟钝,甚至还会成为一个独立的个体,不予任何回应。
羿阁 发自 凹非寺量子位 | 公众号 QbitAI逼近人类水平的语音识别系统来了?没错,OpenAI新开源了一个名为「Whisper」的新语音识别系统,据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性!不仅如此,对于不同口音、专业术语的识别效果也是杠杠的!一经发布就在推特上收获4800+点赞,
在市值冲破万亿大关之际,苹果并没有被胜利冲昏头脑,而是迅速开始在未来产业上布局。领英上的搜索结果显示,苹果创办的健康诊所AC wellness正急招逾40人,以给湾区员工提供上门医疗服务。 AC Wellness是苹果的一个独立子公司,不过服务对象仍主要是苹果总部所在地圣克拉拉县的员工。今年2
本文介绍了 Seed-ASR 技术亮点 —— 高精度识别、大容量模型、支持多种语言、上下文感知、分阶段训练方法。相关同学还分享了立项动机、研发历程及总结思考,展望了大模型 Scaling Laws 对 ASR 技术的推动和影响。
让机器“听懂”人类语言,是“语音识别”技术自诞生起,就一直致力的目标。自20世纪中叶以来,经过近70年的发展,特别是随着深度学习技术的引入,自动语音识别已取得突破性进展——在标准口音、常见词汇、安静环境的应用场景下,机器已然具备接近人类的“听觉”能力。