开源大模型代码短板补上了!新羊驼Python赛过ChatGPT,10万上下文免费可商用
Llama2系列又上新,这回是Meta官方出品的开源编程大模型Code Llama。模型一发布,官方直接给贴了个“最强”标签,还强调了一把“免费可商用”。
Llama2系列又上新,这回是Meta官方出品的开源编程大模型Code Llama。模型一发布,官方直接给贴了个“最强”标签,还强调了一把“免费可商用”。
无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。有了这项技术,大模型(LargeLM)就能摇身一变,成为LongLM。
OpenAI出手再次惊艳世界,谷歌果然坐不住了。GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场:同样能听会看还有嘴,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为Project Astra的AI助手甚至能直接
11月16日,百川智能与鹏城实验室宣布携手探索大模型训练和应用,双方展示了合作研发的基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”,该模型基于“鹏城云脑”国产算力平台训练,未来可升级至192K,是基于国产算力训练的最长上下文窗口。
3月,国内外模型公司动作频频。国产大模型独角兽“五小虎”之一零一万物也有诸多新动作。
ChatGPT的“PPlus版”终于来了!就在一众竞品争相推出企业版之际,OpenAI官方的ChatGPT企业版也来了,附带8大功能。最引人瞩目的,当属GPT-4不限量使用,而且生成速度是Plus版本的2倍。
Stability AI开年第一个大模型来了!名为Stable Code 3B,参数27亿,专为写代码而生。Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token。且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行。
无情戳穿“长上下文”大模型的虚标现象——英伟达新研究发现,包括GPT-4在内的10个大模型,生成达到128k甚至1M上下文长度的都有。但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。新基准名为RULER,包含检索、多跳追踪、聚合、问答四大类共13项任务。RULER定义了“有效
OpenAI开发者大会后不久,它的最强竞对Claude也宣布推出了重磅更新。更新后的Claude 2.1,上下文长度直接翻番到20万,重新超过了GPT-4。根据官方通告,Claude 2.1版本的API已经上线,网页版本也已经完成升级。那么,这次更新具体都有哪些内容呢?
“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”随着新晋大语言模型们的上下文窗口(Context Window)变得越发得长,业界人士针对“RAG终将消亡”观点的讨论也是愈演愈烈。