网友缝合Llama3120B意外能打！轻松击败GPT2-chatbot和GPT-4 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > 网友缝合Llama3120B意外能打！轻松击败GPT2-chatbot和GPT-4

网友缝合Llama3120B意外能打！轻松击败GPT2-chatbot和GPT-4

新火种 2024-05-14

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！

最近这样一个号称是「Llama3-120b」的神秘大模型火了起来，原因在于它表现太出色了——

轻松击败GPT-4、gpt2-chatbot那种。

比如，面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。

GPT-4冷酷而决绝：No；

但Llama3-120b就不一样了，“只有当我们质疑量子力学的哥本哈根解释时，让我来解释一下……”

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

还有就是让LIama3-120B解释笑话，并同两个gpt2-chatbot比较：im-a-good-gpt2-chatbot；im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

（昨天我偶然路过贝叶斯墓，但我是频率学派，懒得拍照。）

首先，他们三个都判断出这是关于两种统计学派的笑话，以及两个学派是相对对立的情况：Frequentist频率学派只关注从抽样/实验的结果中提取信息，Bayesian贝叶斯学派还会设置一个主观的先验信息。

但两个gpt2-chatbot给出进一步解释是，正是因为频率学派并不认同对贝叶斯理论，所以对贝叶斯墓不感兴趣，更不会以他为荣而拍照。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

而LIama3-120B精准指出笑点在“ i didn’t bother taking a photo”，并给出了更深一层的解释。

因为作为频率学派，会认为碰到贝叶斯墓的概率几乎为零。这样的小概率事件也不值得去拍照或者干一些有意义的事情。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

哦莫，说的好有道理……

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

另外题外话，它的回答格式十分工整，让人看了赏心悦目。

除此之外，网友发现它还能创造出谷歌搜到0结果的新单词。

以及直接回答含糊的问题，不用交代背景，这不比ChatGPT好多了。

（没有说ChatGPT不好的意思）

有评测过后的网友感叹：它太聪明了，我不会再摆弄它了。因为它有自己的想法。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

这真的是我用过最聪明的大模型了。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

有网友找了半天也找不到官方来源……

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

与此同时，更多版本也开始出现了，比如170B、225B…嗯，一版更比一版强。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

Llama 3 120B竟意外能打

这两天，社交网络上出现了各种关于Llama3 120B玩法。

比如推导解释一些理论，Omega假设。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

有创造一些新单词，比如prefaceate、driftift等

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

并且给它一个完整的解释和定义。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

甚至还有人整了个评测，去评估这个来路不明的大模型。结果在创意写作测试中成绩还不错，排名第6，超过GPT-4、Claude3-Haiku等模型。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

既然如此，这个非官方的大模型Llama3 120B又是怎么来的呢？

据作者介绍，它是用MergeKit制作，将Meta官方LIama3 70B模型合并（Self-Merge）

MergeKit咋是专门用来合并预训练模型的工具包，合并可以完全在 CPU 上运行，也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4 △支持的合并算法

作者Maxime Labonne是一位资深机器学习专家，目前在一家通用大模型创业公司LiquidAI工作。

他博士毕业于巴黎理工学院，他在2019年开始研究大语言模型和图神经网络，并将他们应用到不同环境中，比如研发、工业、金融等，撰写过书籍《Hands-On Graph Neural Networks using Python》。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

他也是开发者社区的活跃开发者，在HuggingFace上发布过各种LLM，例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具，例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的关于大模型课程，收获29.5K Star。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

不过对于这个「缝合」大模型的使用，作者建议可以用来创意写作。

在多方评估中可以看到，它有时候会出现神经混乱，但写作风格不错。另外有时候还会出现拼写错误，并且非常喜欢大写字母。

而且由于觉得这个版本的推理能力比较差，于是作者再做了个225B的。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

网友：看完更期待官方400B了

有网友猜测为什么LIama3-120B能这么强。

一方面，LIama3-70B自己确实很强，刚发布时就迅速跃居排行榜榜首。HuggingFace上显示，上个月下载次数就超过了27万次。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

lmsysorg就深入分析了LIama3的实力，简单来说，LIama3在开放式写作和创意问题上击败了顶尖模型，但在封闭式数学和编码问题上就稍弱一点。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

不过随着提示词变得更加复杂，LIama3的能力也就下降得很明显。

以及在输出内容上面，LIama3的输出比其他模型更友好，也更具对话性。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

除此之外，也有网友分析这与模型深度有关。

事实上与LIama3-70B唯一的区别是额外的Layer，甚至是复制的，没有新的训练数据。。

这意味着，120B大模型的智能水平是从模型的深度产生的。“这不仅仅是训练数据的函数，它是数据和深度的结合”。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

有网友尝试本地部署，Ollama上已经支持下载。网友表示：它使用48 GB VRAM + 38 GB 系统 RAM。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

啊这……走了走了。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

有提供GGUF形式的LMStudioAI，也很直接地说：不适合内存不足的人。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

原作者也很逗趣地表示：是时候跟你的RAM做告别了。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

但不管怎么说，已经在期待更多官方型号了。

比如，400B那种。

网友缝合Llama3 120B意外能打！轻松击败GPT2-chatbot和GPT-4

Tags:

意外轻松

相关推荐

Qwen2.5登全球开源王座！72B击败LIama3405B，轻松胜过GPT-4o-mini

2024-09-20

让Karpathy倍感意外的研究：人类大脑已被塑料污染

2024-08-28

Intel发布全新AI应用AIPlayground：下代Xe2GPU核显轻松加速

2024-06-13

12个国产大模型大战高考数学，意外炸出个大bug

2024-06-11

网友缝合Llama3120B竟意外能打，轻松击败GPT2-chatbot和GPT-4

2024-05-15

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

全国人大代表刘庆峰：建议完善AI失业保障

全球首次！人形机器人将与人类一起跑“半马”

2025-04-16 11:27

政协委员甄子丹：人工智能对电影行业既是冲击也是鼓励

2025-04-17 11:27

全国人大代表刘庆峰：发展AI新岗位，试点“AI失业保障专项保险”

2025-04-16 11:29

工学博士娄勤俭：我对人工智能有偏爱

2025-04-15 11:20

平稳开局！今年一季度我国货物贸易进出口10.3万亿元，增长1.3%

2025-04-16 13:26

人工智能概念股午后拉升，科创人工智能相关ETF涨近4%

2025-04-15 11:19

撬动千亿资本杭州加快建设人工智能产业高地

2025-04-16 08:27

恒生电子董事长刘曙峰：AI平权时代，“智能体”成为金融大模型战略性赛道

2025-04-16 13:23

「开源版GPT-4o」来了！这个17B国产模型生图效果比肩4o，还可商用

2025-04-16 15:34