首页 > 分布式

分布式

  • Menger:大规模分布式强化学习架构

    翻译:雷锋字幕组(季一帆)在过去的十年中,强化学习(RL)成为机器学习中最受瞩目的研究领域之一,应用RL能够很好地解决芯片放置和资源管理等复杂的问题,以及Go/Dota 2/hide-and-seek等有挑战性的游戏。简单来说,RL基础架构就是数据采集和训练的循环,Actor根据环境收集样本数据,然

  • 人工智能模型的分布式训练技术

    . 算力荒:大模型绕不开的大难题自从ChatGPT引爆大模型发展热潮,众多科技企业前赴后继,纷纷投入大模型研发中。然而,这波创业浪潮中鲜有小微初创企业的身影,甚至一些堪称“准独角兽”规模的企业,也只集中在大模型的下游应用创新或微调中,不具备独立的大模型创新能力。

  • 字节跳动开源分布式训练框架BytePS,支持PyTorch、TensorFlow等

    机器之心报道参与:戴一鸣、思源最近,字节跳动发布了一款通用高性能分布式训练框架 BytePS,该框架支持TensorFlow、Keras、PyTorch 和 MXNet,并且可以在 TCP 或 RDMA 网络上运行。根据该项目的 GitHub 页面,BytePS显著优于目前的开源分布式训练框架。例如

  • PPTV创始人姚欣AI再创业,“分布式推理”终于有人做了

    这个月,PPTV创始人姚欣再次站到了聚光灯下,组织了一场分布式云计算论坛,向外界揭开了他的新篇章。姚欣的第二次创业,瞄准了云服务,要打造 AI 时代的基础设施。但姿势独特:公司没有自建IDC和购买GPU,而是通过独特的方式成为了全国最多节点的云服务商。成立六年来,PPIO派欧云已获三轮共4亿元的融资

  • PyTorch1.7发布,支持CUDA11、Windows分布式训练

    机器之心报道参与:魔王、小舟昨日,PyTorch 团队发布 PyTorch 1.7 版本。该版本增添了很多新特性,如支持 CUDA 11、Windows 分布式训练、增加了支持快速傅里叶变换(FFT)的新型 API 等。PyTorch 1.7 版本包含很多新的 API,如支持 NumPy 兼容的 F

  • 石头科技实控人承诺未来3个月不减持百奥泰拟签署分布式屋顶光伏电站能源管理协议

    《科创板日报》9月15日讯 今日科创板晚报主要内容有:上海:扎实推进智能机器人产业发展 加大产业链“链主”企业引进和培育力度;深圳:支持老旧汽车更新消费 给予最高10000元补贴 加快建设“超充之城”; 北京市人工智能算法交易服务中心揭牌等。【热点聚焦】简讯:证监会:正在研究制定资本市场服务高水平科

  • 浪潮信息发布自动驾驶分布式计算框架AutoDRRT2.0

    财联社9月21日电,财联社记者从浪潮信息边缘计算合作伙伴大会获悉,面向当前边缘AI落地最快的自动驾驶场景,浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0,针对BEV+Transformer的大模型车端落地的挑战,在计算组件的分布式、高容错及低延时三个核心特点进行技术革新,并实现计算方面,

  • 分布式入门,怎样用PyTorch实现多GPU分布式训练

    这篇文章旨在阐述训练大规模深度学习模型时的分布式计算思想。具体来讲,本文首先介绍了分布式计算的基本概念,以及分布式计算如何用于深度学习。然后,列举了配置处理分布式应用的环境的标准需求(硬件和软件)。最后,为了提供亲身实践的经验,本文从理论角度和实现的角度演示了一个用于训练深度学习模型的分布式算法(同