南农大团队研发“古籍版ChatGPT”，为何取名“荀子”

首页 > AI资讯 > 最新资讯 > 南农大团队研发“古籍版ChatGPT”，为何取名“荀子”

南农大团队研发“古籍版ChatGPT”，为何取名“荀子”

新火种 2023-12-17

“荀子”古籍大语言模型示意图微信公众号@南农信管之窗CIM 图

澎湃新闻12月11日从南京农业大学获悉，该校信息管理学院王东波团队日前研发出国内首个专门用于古籍处理与研究的智能工具——“荀子”古籍大语言模型，包含《四库全书》在内的古籍文献超20亿字大型语料库，具备自然语言理解、自动翻译、自动标引等功能。该模型已在GitHub、ModelScope等网站开源。

王东波表示，荀子不仅是先秦伟大的朴素唯物主义思想家和散文家，对语言学理论的阐述也是开拓者，如此命名是纪念这位语言学先驱，“普通受众要走近繁体、竖版、没有句读的古文不是容易的事，‘荀子’上线，意味着在智媒时代与古籍对话成为可能，古文阅读理解、标点添加、译为现代汉语——这些难啃的‘硬骨头’，‘荀子’可以轻松拿下。”专家则可借助“荀子”完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等。

据介绍，“荀子”的问世离不开高性能算力基础设施，也离不开团队长期积累精加工语料库，投喂了40亿字的混合语料数据。“模型的构建受算力、场景应用等影响，但精准度高的优质数据是关键。”王东波说，团队2008年接触古籍，2013年至今一直专注于人工精标注数据工作，“比如《岳阳楼记》，要训练机器标注其中的形容词，先要训练相关人员标注形容词，在大量人工标注的基础上让机器学习”。

王东波表示，期待通过“荀子”大语言模型，将古籍的智能化研究与跨学科人才培养结合，让学生既有前瞻的科研视野，又积累较深厚的人文底蕴，同时让更多受众接触、品读、传播古籍，唤活“故纸堆”。

Tags:

机器学习农大古籍

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

南农大团队研发“古籍版ChatGPT”，为何取名“荀子”

“新湖系”邦盛科技终止IPO进程：连续三年亏损，聘客户当辅导机构

美亚柏科申请基于SQL实现机器学习算法的专利，提高了机器学习算法的执行效率和可维护性

大华股份申请感知模型迁移专利，实现对原感知模型的点云数据的复用

首批通过国家大模型标准测试名单公布，人工智能AIETF(515070)涨超1.24%

思普科与北京儿童医院、知网三方签署了“儿科虚拟患者大模型”合作框架协议

热门文章

0326东吴宏观股指每日观点|市场弱势震荡磷化工领涨

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

AI图像生成平台「LiblibAI」获数亿元融资

L3上路倒计时？工信部加快推进智能网联车规划产业基建+商业化迎来关键节点

ChatGPT引爆“吉卜力”风格图像生成浪潮同时激发AI违法争议

AI战略锁定增长确定性，粉笔2024年净利润2.4亿元

山西今年将对农用无人驾驶航空器进行购置补贴

【明日主题前瞻】又一巨头切入具身智能领域，机构称具身智能有望成为经济增长新引擎

南方电网人工智能科技公司增资至4.4亿元