ICML获奖者陆昱成:去中心化机器学习的理论极限在哪里?

作者:琰琰
如何高效训练大规模数据,一直是机器学习系统面临的重要挑战。当下互联网时代,数十亿用户每天生产着百亿级规模的数据。作为AI炼丹的底层燃料,这些海量数据至关重要。然而,由于训练数据和模型规模的增大,机器之间的通信成本越高,机器学习系统经常会出现高延迟、低负载的现象。2004年,谷歌首次提出并行算法 Mapreduce,通过将大规模数据分发给网络上的每个节点,实现了1TB以上的运算量。之后,AI科学家李沐又提出异步可扩展的Parameter Server算法,基本上解决了大规模数据的分布式训练问题。然而,近年来以 BERT 为代表预训练模型,其体积规模不断突破极限。动辄上百万、甚至上亿级参数量的超大模型,让传统分布式机器学习系统越来越难以高效运转。基于此,业内普遍认为,去中心化(Decentralized )的分布式训练方法将成为下一个“最优解”。陆昱成向AI科技评论表示,随着机器学习的应用越来越多样化,中心化分布式系统的局限性也会越来越明显,比如“中心节点负载过大”,“容错性差”,“数据安全”等问题。如果设计好节点之间的协议,去中心化算法将有助于大幅提升系统的鲁棒性。陆昱成是康奈尔大学计算机系在读博士,主要研究大规模机器学习系统,侧重于随机和并行算法。近日,他发表的一篇名为《Optimal Complexity in Decentralized Training》的研究论文获得了ICML 2021杰出论文荣誉提名奖。在这篇论文中,他主要研究了去中心化算法的理论极限,通过对D-PSGD(罗切斯特大学Ji Liu团队提出)和SGP(Facebook AI Lab提出)等经典算法的系统性分析,推导出了随机非凸环境下迭代复杂度的最优下界,并进一步提出DeTAG算法证明了该理论下界是可实现的。ICML组委会一致认为,这项研究成果推动了分布式机器学习系统在理论层面的发展。1
去中心化:机器学习系统的最优解

2
理论下界:迭代复杂度的极限



3
ICML获奖者
陆昱成是康奈尔大学计算机科学系三年级博士生,师从 Chris De Sa.教授。主要研究如何优化分布式机器学习系统,集中于系统性能,通信压缩、去中心化、采样算法等方向。雷锋网雷锋网雷锋网
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。