首页 > AI资讯 > 最新资讯 > 有中国特色的大模型要来啦!

有中国特色的大模型要来啦!

新火种    2023-10-28

1、“码农大模型”要来了。

各家大厂都觉得,“辅助程序员写代码的大模型”这事儿有搞头。他们纷纷把 Github 整个“拖库”下来喂给大模型。

腾讯的混元大模型也学会了写代码,老师傅现场展示让 AI 写了个抽奖程序、贪吃蛇游戏、

不久的将来,也许很多腾讯的代码都是 AI 生成的了。

(只是不知道用 Github 上的语料来训练罪过有多大,要不要人均罚款100w。)

2、大模型领域可能会出现“3Q大战 2.0”。

目前大模型的训练和推理成本还有点高,现有商业模式愣是使用这么高成本的技术还有点儿“胆秃”。

没准儿等成本再降一降,行业里会冲出来一个混不吝的黑马,搞个“免费大模型服务”,里面各种引流插广告,用“三级火箭”来搅浑大模型的水,就像当年360在杀毒领域“大闹天宫”一样。

当然,沧海桑田,大佬们都老了,未来这个搅浑水的人不一定是360,跟他打架的也不一定是腾讯了。

但老骥伏枥也未可知。

3、大模型必须从“拿着计算器的白痴”变成“爱因斯坦”。

过去的大模型就是数学白痴,超过3就算不对了。遇到数学问题,只能外挂一个严谨的“计算器”。但这样不仅像个尿袋一样不美观,还有很大的局限,没有泛化能力,也没有创造力。

腾讯的老师傅决定逼大模型一把,让它“硬学”数学,不仅给他看各种数学教材,还教他用“因为所以”这样的“渐进思维链”来进行一步步思考,甚至还鼓励它“一题多解”,学出更好的解题思路。

这样学出来的数学,虽然在极难的问题里还可能犯错误,但创造性大幅提高。爱因斯坦还经常算错数呢,但他可比计算器伟大多了。

4、大模型要想普惠,最终还得靠“产品能力”。

现在很多大厂卷大模型都快卷死了,但是普通人几乎没感觉。这是因为大模型还没出现杀手级应用。

中国产品能力最能打的大厂就是腾讯。腾讯老师傅说他们正在把大模型塞进腾讯游戏,做游戏助手、NPC对话和剧本生成;塞进腾讯文档,帮你改文章;塞进企业

但我觉得这些用法还不够打动普通人。普通人需要那种一看到就会喊“我他喵的就缺这个”的应用场景。

即便如此,我还是对腾讯抱有希望,没准有一个如当年“

5、未来“狗式模型”可能会比“人式模型”多。

人的神经元有800亿,狗有22亿。假设千亿参数大模型对标人的话,那百亿以下参数的大模型就对标狗。

别小看汪星人,狗的智力是相当能打的,它虽然不会说话,但是卖萌卖得好极了。而且它用人三十六分之一的神经元就做到了这么好。

同理,未来大模型的发展方向之一就是训练“小大模型”,千万个“小大模型”在特定的场域发挥作用,就像很多人家里都养狗一样。

腾讯老师傅说,模型好坏不止看参数大小,还要看训练时吞吐的 Token 量。换句话说,同样是训狗,有人训出来是边牧,有人训出来是哈士奇。

他们要训边牧。

6、“想象场景生成”是未来“文生图”的重要战场。

用过 MidJourney 的人都知道,AI 对日常存在的图像生成比较好,例如“一个老奶奶织毛衣”;但是对日常不存在的东西生成比较差,例如“一个老鼠织毛衣”。

但问题是,很多人(比如我)恰恰是因为这些想象中的场景找不到现成的图片,才需要求助于 AI 生成。所以如果能很好地生成想象中的场景,“文生图”的用武之地会大大扩展。

腾讯的老师傅就在“混元大模型”上优化了这种能力,比如,他们让混元生成一个“一个靶子在苹果上”的场景,AI 就生成得非常好。

7、我们需要“有中国特色的文生图”。

之前大家对国产大模型的吐槽主要有两点:1、“鼠标、总线、蚂蚁上树”之类中国人都懂的词汇,它不理解;2、生成出来的图片里都是外国人的脸和外国环境。

据此有人说国产大模型是套壳的,这也不对。本质上是因为互联网上的高质量语料很多都是英文的,训练过程中难免会混入英文的世界观。

不过,腾讯老师傅决心做出“有中国特色的文生图”。

首先,他们使用了专门的解码器,把“中文-英文-图片”三者做了精细对应,挑出很多中英文有歧义的场景做特训,避免“蚂蚁上树”的图里真的出现蚂蚁。。。

其次,他们还针对中国人的审美调整训练数据,生成出来的妹子都是中国人的菜,生成出来的风景色调也是中国人喜欢的亮色。

总之,他们在“语义、细节、构图”上都做了一套“数据飞轮”,把大模型的迭代周期从俩礼拜缩短到三天,按照这样的迭代速度,估计很快就能做出适合中国人口味的“菜”。

但我觉得,这个过程里,怎么避免把中国文化的“糟粕”也一并带入进去,其实是个挺大的挑战。

8、腾讯老师傅展示他们的“混元大模型”时,输入提示词非常客气,每句话前面都不忘加上个“请”。

可见他们已经明白自己做的 AI 有多强大了,对它客气点。。。总没坏处。。。

以上就是今天我从腾讯混元大模型的老师傅那里得到的最新消息和一些启发,分享给大家~

混元大模型相比几个月前的进步

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。