在终端设备上实现语音识别:ARM开源了TensorFlow预训练模型
林鳞 编译整理 量子位 出品 | 公众号 QbitAI关键词识别(Keyword Spotting,KWS)是语音识别领域的一个子领域,在用户在智能设备上进行语音交互时起到重要作用。 △ 关键词识别pipeline近日,ARM和斯坦福大学合作开源了预训练TensorFlow模型和它们的语音关键词识别代码,并将结果发表在论文 Hello Edge: Keyword Spotting on Microcontrollers 中。这个开源库包含了TensorFlow模型和在论文中用到的训练脚本。在论文中,研究人员还展示了不同的神经网络架构,包含DNN、CNN、Basic LSTM、LSTM、GRU、CRNN和DS-CNN,并将这些架构加入到预训练模型中。预训练模型地址:https://github.com/ARM-software/ML-KWS-for-MCU/tree/master/Pretrained_models论文摘要在研究中,研究人员评估了神经网络架构,并且在资源受限的微控制器上运行KWS。他们训练了多种神经网络架构变体,并比较变体之间的准确性和存储/计算需求。
△ 神经网络模型的准确性研究人员发现,在不损失精确度的情况下,在存储了计算资源受限的微控制器上优化这些神经网络架构可行。
之后,研究人员还进一步探索了DS-CNN架构,并且和其他神经网络架构进行了对比。结果证明,DS-CNN架构的准确性最高,为95.4%,比超参数相似的DNN模型精确度约高10%。
△ 超参数搜索中的最佳神经网络相关资料论文下载地址:/uploads/pic/20230919/ML-KWS-for-MCU—.pdf 完 —活动报名加入社群



相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。
热门文章
