沪研大模型捷报频传阶跃星辰自研推理模型StepR-mini今上线

首页 > AI资讯 > 最新资讯 > 沪研大模型捷报频传阶跃星辰自研推理模型StepR-mini今上线

沪研大模型捷报频传阶跃星辰自研推理模型StepR-mini今上线

上观新闻 2025-01-17

　　这几天，沪研沪产大模型捷报频传。继15日上海人工智能实验室对“书生”大模型进行重要版本升级，MiniMax发布并开源新一代01系列模型后，阶跃星辰自研推理模型Step Reasoner mini（简称“Step R-mini”）今天上线。

　　Step Reasoner mini是Step系列模型家族的首个推理模型，擅长主动进行规划、尝试和反思，能通过慢思考和反复验证的逻辑机制，为用户提供准确可靠的回复。它既擅长通过超长推理能力，解决逻辑推理、代码和数学等复杂问题，也能兼顾文学创作等通用领域。

　　记者了解到，目前大部分推理模型难以兼顾文理科双方向能力——随着训练参数规模增加，模型的文科能力会得到提升，但也会因此损失确定性，造成理工科能力的下滑。Step Reasoner mini通过大规模的强化学习训练，并使用同策略强化学习算法，实现了“文理兼修”。Step Reasoner mini除了能准确解答数学、代码、逻辑推理问题，还能富有创意地完成文学内容创作和日常聊天的任务。

　　例如，在解答“连续整数之和为1000的共有几组”这道题时，Step Reasoner mini展现了全面和严谨的思维链路：先分析用户题目需求，然后选择出最佳的解题公式，在得到初步答案后，它通过多次自我追问确定是否有没被考虑到的因素。

　　而在处理逻辑推理任务时，Step Reasoner mini会自主进行多种解题思路的尝试，在得到初步答案后，会自我反问尝试有没有其他可能性，确保枚举出所有效果良好的解决方案，并在交卷前检查有无遗漏。

　　当接到创作类题目的任务，Step Reasoner mini能够深入理解用户的表达需求，是个“追求完美”的创作者。它会先分析用户对创作主题、文学题材的要求，然后思考处理创作角度、描绘的景物、修辞手法、内容结构，赋予事物人类情感层面的象征意义，并增加个性化的、创新的表达风格。

　　记者获悉，阶跃星辰自研的Step系列基座模型矩阵，目前已经覆盖了从语言、多模态到推理的全面能力。

（文章来源：上观新闻）

Tags:

人工智能模型捷报频传

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

沪研大模型捷报频传阶跃星辰自研推理模型StepR-mini今上线

分子科技节丨暖哇科技分享“理赔领域大模型”应用成果：专识驱动下的风控革新与业务突破

2024年中标前五大模型厂商公布：科大讯飞第一，这四家小跑紧跟

广州银行：探索科技金融大文章的“花城之道”

季昕华：支持文科生参与的产业，将人工智能和文科相结合

人工智能板块本周下探，关注人工智能ETF（159819）、软件30ETF（562930）等产品未来动态

热门文章

GPT-4.5发布了，最突出的是“情商”

布局全产业链发展，广东AI与机器人领域集中上新

【早报】李强同欧盟委员会主席冯德莱恩通电话；A股再掀增持回购小高潮

机器人概念震荡回调，机器人产业ETF（159551）跌超3.3%，连续5日净流入超8000万元

美股最新评级|中信证券维持唯品会买入评级给予美光买入评级

生益电子：服务器销售占比增至近五成智能算力中心高多层HDI项目拟Q4试生产|直击业绩会

（经济观察）DeepSeek点燃A股人工智能“投资热”

李飞飞实验室2025AI报告出炉：中美AI模型差距近乎持平

央视主持王冰冰穿蓝色长裙惊呼：AI算法治好了我的选择困难症！