「直击引领区」如何撷取人工智能皇冠上的明珠,来看这名“浦东新区科技精英”的创业故事
在当今的人工智能产业里,文本识别是最难的领域,比尔盖茨说,文字资料处理是人工智能皇冠上的明珠。为了从皇冠上撷取这颗明珠,陈运文博士及其所创办的达观数据努力耕耘七载,推出代表国内“文本智能处理”最高水准的曹植垂直大模型。
三次工作经历决定创业方向
从象形文字到甲骨文,从雕版印刷到活字印刷,从计算机到大数据,人类对文字处理的升级迭代,如划破寂寂长夜的流星,在茫茫宇宙中照亮整片夜空。作为文字发展的延续,文本智能处理是计算机科学、AI、语言学的交叉领域,经历了第一代符号主义、第二代语法规则、第三代统计学习,文本挖掘工作目前处于第四代深度学习阶段,将实现用一个复杂的模型模拟人脑神经网络运作,从而能够像人类一样进行说文解字。
回望人工智能曲折起伏的60余年,人们曾热衷于各种人机大战,相较之下,“文本智能处理”是又难又不易被感知到的“小事”。在复旦读博时,陈运文开始触及到文本智能处理,他的论文获得上海市优秀博士论文奖,当时人工智能的概念并非热门,学习和研究的更多叫机器学习(Machine Learning)和模式识别(Pattern Recognition),陈运文只是感觉这些技术确实挺有意思,也非常有实用意义。
似乎冥冥中的安排,毕业后陈运文在百度负责搜索引擎算法研发的工作,使用到自然语言处理和数据挖掘的技术,也实践了各类机器学习算法。在盛大研究院和盛大文学负责大数据中心的工作,同样每天的主要精力也在处理海量的文字资料,包括之后在腾讯文学以及阅文集团也是负责自然语言处理的团队工作。这三次工作经历,加上看好自然语言处理技术的产业应用前景,引导他选择了如今的创业方向。
“进窄门、走远路、见微光”
2015年,陈运文在张江“天之骄子孵化器”里敲下了第一行代码,带着30余人的团队创业,租了孵化器里一间20多平方米的办公室,对于那段经历,陈运文回忆道,虽然孵化器空间不大,但和其他创业者一起奋斗的感觉特别棒。在陈运文的认知中,创业的过程好比“进窄门、走远路、见微光”,选择方向时要有自己的坚持,有些看上去没那么众人皆知的领域,可能反而蕴藏着机会。在人机大战占据人工智能主流发展趋势时,他把目光投向文本智能处理这道“窄门”,发现了其中巨大的市场潜力。创业前陈运文接触过大量的C端用户,创业后意外发现在ToB领域价值,文本智能处理技术的市场更广阔,且在国内处于真空地带,发现到这个商机,陈运文义无反顾的投身其间。
在文本智能处理领域苦耕7年,从技术落地到创造价值,达观数据成为国内文本智能行业的翘楚,为众多企业提供多场景的智能文本处理产品,为“智慧办公”创造了条件。疫情期间,达观智能文本处理平台协助企业和政府进行疫情防控辅助的工作。上海每轮核酸筛查需要处理2000余万人的信息,使用达观智能文本处理平台效率提升30倍以上。
从2022年底,陈运文敏锐意识到这是人工智能进入新阶段的大年,得益于ChatGPT的发展,达观研发的国产版GPT“曹植”大语言模型LLM系统可以说是站在了ChatGPT“巨人的肩膀”上。“曹植”大语言模型作为一款垂直、专用、国产的大模型,具备长文本、多语言、垂直化三大特点,创新性地采用了多模型并联(Ensemble)架构,通过将不同参数规模和不同类型的模型相结合,未来将可持续赋能金融、政务、制造等多个垂直领域和通用场景人工智能的落地和发展。
为母校设立“达观数据奖学金”
因为在文本智能处理领域中的成就,陈运文及企业获得了中国人工智能领域最高奖“吴文俊人工智能奖”,被评为行业首家国家级专精特新“小巨人”企业,入选胡润百富独角兽企业,福布斯科技创新50强,国际权威咨询集团IDC创新者,德勤授予的科技创新明日之星等国际奖项。
2021年,他为母校捐资设立“达观数据奖学金”,表达其对教育事业和计算机人才培养的关爱和支持,以及对复旦大学优秀学生成长成才的殷切期盼。而今,数据深度学习的革命方兴未艾,人工智能作为新一轮科技革命和产业变革的重要驱动力量,正在深刻改变世界。上海浦东作为人工智能的高地,正多点突破,加速抢跑。达观也在全力跑出加速度,冲出上海,走向全国,摘取人工智能皇冠上的明珠。
编辑:鲁琳
资料:区科协
* 转载请注明来自浦东发布官方微信
* 【直击引领区】浦东生物医药产业规模达3300亿元,今年已有4个一类新药获批上市* 【一线新动态】累计发放专项资金212亿元!“沪科专贷”“沪科专贴”精准支持小微、民营科创企业融资- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。