微软、OpenAI用上“数据永动机”合成数据是蜜糖还是砒霜?
《科创板日报》7月22日讯(编辑 郑远方)AI大模型对数据的庞大需求之下,AI公司们正在摸索一条获取数据的“新路”——从零开始自己“造”数据。微软、OpenAI、Cohere等公司已经开始测试使用合成数据来训练AI模型。Cohere首席执行官Aiden Gomez表示,合成数据可以适用于很多训练场景
《科创板日报》7月22日讯(编辑 郑远方)AI大模型对数据的庞大需求之下,AI公司们正在摸索一条获取数据的“新路”——从零开始自己“造”数据。微软、OpenAI、Cohere等公司已经开始测试使用合成数据来训练AI模型。Cohere首席执行官Aiden Gomez表示,合成数据可以适用于很多训练场景
之前的合成数据大多用于AI大模型训练,这一次,英伟达为机器人训练建起了“数据粮仓”——机器人技术发展步调远远落后于其他AI领域的关键原因之一,便是缺乏数据。只需200个人类演示源数据,这一系统就能直接生成50000个训练数据。AI对数据的庞大需求之下,数据资源几近枯竭,因此各家公司已开始摸索一条获取