DeepMind验证卷积神经网络在大规模数据集上可媲美视觉变换器

首页 > AI资讯 > 行业动态 > DeepMind验证卷积神经网络在大规模数据集上可媲美视觉变换器

DeepMind验证卷积神经网络在大规模数据集上可媲美视觉变换器

新火种 2023-11-02

核心要点:

1. 最近的研究表明，卷积神经网络（ConvNets）在大规模数据集上可以与视觉变换器(Vision Transformers)媲美，挑战了以往认为视觉变换器在这方面具有卓越性能的观点。

2. 研究团队使用NFNet模型在巨大的JFT-4B数据集上进行了训练，发现随着计算资源的增加，ConvNets的性能可以与视觉变换器相匹敌，达到了令人印象深刻的ImageNet Top-1准确度。

3. 该研究突出了计算资源和可用于训练的数据量是影响模型性能的主要因素，以及ConvNets，特别是NFNet架构，具备在以往认为是视觉变换器领域的规模上竞争的能力。

站长之家10月27日消息:最新研究表明，卷积神经网络（ConvNets）在大规模数据集上能够与视觉变换器(Vision Transformers)媲美，挑战了以往认为视觉变换器在这方面具有卓越性能的观点。在计算机视觉领域，ConvNets一直以来都是在各种基准测试中取得卓越性能的标准。然而，近年来，视觉变换器逐渐崭露头角，逐渐超越了ConvNets。有许多专家认为ConvNets在小到中等规模数据集上表现出色，但在面对大规模数据集时，视觉变换器占据了优势。

论文地址:https://arxiv.org/pdf/2310.16764.pdf

一项由Google DeepMind的研究团队进行的新研究挑战了视觉变换器在规模上具有卓越扩展能力的普遍观点。该团队对一种纯粹的ConvNet架构进行了全面评估，这种架构被称为NFNet模型，该模型在大规模数据集上进行了预训练。研究结果显示，ConvNets在大规模数据集上确实可以与视觉变换器相匹敌。

研究团队在巨大的JFT-4B数据集上训练了各种深度和宽度不同的NFNet模型。这个数据集包含大约40亿张图像，涵盖了3万个类别。在对预训练的NFNet模型进行50个时代的微调后，ImageNet Top-1误差在与预训练时使用的计算资源的直接相关性下持续改善。最大的模型，被称为F7+，在可比较的计算预算下达到了与预训练的视觉变换器报告的性能相当的ImageNet Top-1准确度，达到了惊人的90.3%。

为了更清楚地了解验证损失与预训练计算之间的关系，研究团队绘制了每个模型所需计算预算结束时的验证损失。这个练习揭示了一个明显的线性趋势，与支配验证损失和预训练计算的对数缩放定律一致。随着计算资源的增加，最佳模型大小和训练时期的预算也随之增加。此外，人们还注意到，调整ConvNets的一个可靠经验法则是按比例调整模型大小和训练时期的数量。

有趣的是，研究人员还调查了NFNet系列的三种不同模型（F0、F3、F7+）在一系列时期预算下的最佳学习率。他们的研究结果表明，当受到较小的时期预算限制时，所有这些模型都表现出相似的最佳学习率(约为1.6)。然而，随着时期预算的增加，最佳学习率减小，较大的模型经历了更快的下降。

总的来说，这项研究强调了在计算机视觉领域，合理设计的模型性能的主要因素是计算资源和可用于训练的数据量。从这项工作中可以明显看出，ConvNets，特别是NFNet架构，具备在以往认为是视觉变换器领域的规模上竞争的能力。这些结果突显了同时扩展计算和数据资源的重要性，为计算机视觉研究的未来带来了新的启示。

Tags:

神经网络卷积神经网络

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

DeepMind验证卷积神经网络在大规模数据集上可媲美视觉变换器

新加坡国立大学赖载兴教授专访：用混沌边缘改善神经网络，与上帝掷骰子|IJAIRR

上海专家开发超快速的卷积光学神经网络，助力人工智能成像

全新神经网络架构KAN一夜爆火！200参数顶30万，MIT华人一作，轻松复现Nature封面AI数学研究

神经网络概念活跃泰尔股份直线涨停

用扩散模型生成神经网络？NUS尤洋团队：这不是开玩笑

热门文章

Manus神话破碎？邀请码炒至数万元，转头被MetaGPT成员3小时复刻

全国首例保护AI模型结构判决！抖音诉B612侵害著作权获赔160万

清华学霸、OpenAI姚顺雨：AI下半场开战，评估将比训练重要

1元起京东举办全国首场人形机器人拍卖：含马拉松第2名小孩哥

腾讯开启史上最大就业计划，三年新增28000校招岗位，今年六成面向技术人才

华为：迈向下一代光网络AION，共创AI时代新增长

全球首创！阿里巴巴AI攻克“癌症之王”早筛难题获FDA最高级别认证

豆包灰测接入抖音，腾讯元宝就霸王条款道歉|蓝媒GPT

AI爆火MWC！AIOS席卷手机PC，国王点赞荣耀华为，中国企业霸场