首页 > AI资讯 > 行业动态 > StabilityAI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

StabilityAI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

新火种    2024-01-18

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token。

且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行。

性能方面,Stable Code 3B规模比CodeLLaMA 7B小60%,但性能却大差不差。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补(FIM)等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token。

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

支持以下18种编程语言:

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7B,Stable Code 3B的性能也差不多能与其打个平手,在Python、CPP语言上甚至略胜一筹。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

在类似大小的模型中,Stable Code 3B表现突出。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为“没有太多新东西”、“没有那么好”。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

此外,它仅支持英语和编程语言,也是让大家有些许失望。

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

对此,你怎么看?

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。