首页 > AI资讯 > 行业动态 > 百川智能发布Baichuan2-192K大模型可处理约35万个汉字

百川智能发布Baichuan2-192K大模型可处理约35万个汉字

新火种    2023-11-03

站长之家10月30日 消息:百川智能发布了 Baichuan2-192K 大模型,具有全球最长的上下文窗口长度,能够处理约35万个汉字。

与目前最优秀的大模型 Claude2相比,Baichuan2-192K 的上下文窗口长度超过了4.4倍,超过了 GPT-4的14倍。

百川大模型,百川智能

Baichuan2-192K 在长窗口文本生成、理解、问答、摘要等方面表现出色,并在10项长文本评测中取得了7项 SOTA 成绩。

据悉,Baichuan2-192K 通过算法和工程的优化,实现了窗口长度和模型性能的平衡,采用动态采样的位置编码优化和4D 并行的分布式方案。

目前,Baichuan2-192K 已经开始内测,已与法律、媒体、金融等行业的核心合作伙伴合作,将于不久后全面开放。Baichuan2-192K 能够应用于长篇文档关键信息提取与分析、长文档摘要、审核、编写、复杂编程辅助等场景,并为多模态输入和迁移学习提供支持。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。