首页 > 会议 > 2023大模型前沿技术讲习班·第四期暨智源FlagOpen大模型开源体系与应用

2023大模型前沿技术讲习班·第四期暨智源FlagOpen大模型开源体系与应用

新火种    2023-09-19

大模型前沿技术讲习班第一季第四期(S01E04)将在 2023年10月28日至29日线下召开,本期主题聚焦于“智源FlagOpen大模型开源体系与应用”。

智源研究院 FlagOpen(飞智)大模型技术开源体系旨在打造全面支撑大模型技术发展的开源算法体系和一站式基础软件平台,支持协同创新和开放竞争,共建共享大模型时代的“新Linux”开源开放生态。FlagOpen 包含大模型算法、模型、数据、工具、评测等重要组成部分,国内外开发者基于FlagOpen可以快速开启各种大模型的尝试、开发和研究工作,企业可以低门槛进行大模型研发。同时,FlagOpen大模型基础软件开源体系正逐步实现对多种深度学习框架、多种AI芯片的完整支持,支撑AI大模型软硬件生态的百花齐放。本次讲习班将由智源研究院研究员担纲介绍 FlagOpen 的近期进展以及落地实践。

FlagOpen 官网: https://flagopen.baai.ac.cn/

授课

时间

主题

大纲

授课

专家

10月28日

09:30-

10:30

《悟道·天鹰Aquila 语言大模型及开源生态》

智源研究院推出的悟道·天鹰Aquila语言大模型,是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型,并且正在持续完善训练数据、优化训练方法、提升模型性能,持续开源开放。本次报告将介绍 Aquila系列模型的进展及应用实践。

报告提纲:

1. 语言大模型的发展历程

2. 语言大模型的基本概念

3. Aquila 系列模型介绍

Aquila 基础模型

AquilaChat 对话模型

AquilaCode 代码生成模型

4. 基于FlagAI的Aquila系列模型实践

刘广

张博文

10月28日

10:40-

11:40

《多模态大模型及其应用》

多模态大模型是综合利用多种模态类型(文本,图像,音频)的信息来进行任务处理的大模型,涵盖了多模态检索、生成、编辑等具有实用价值的任务。本次报告将介绍智源研究院推出的AltCLIP多语言CLIP模型,AltDiffusion多语言文生图模型和CoIE指令链多属性编辑模型。

报告提纲:

1. 基础理论

多模态预训练大模型的发展历程

多模态预训练大模型的常见结构和预训练任务

2. 系列模型介绍

AltCLIP - 多语言文图匹配模型

模型基本结构

基于AltCLIP模型的实践

AltDiffusion - 多语言文生图模型

模型基本结构

基于AltDiffusion模型的实践

CoIE 指令链多属性编辑模型

模型基本结构

基于CoIE模型的实践

张振铎

吴欣雅

10月28日​

14:00-

15:30

《链接大模型与外部知识,语义向量模型 BAAI General Embedding(BGE) 及应用实践》

语义向量是连接大语言模型与世界知识的桥梁。语义向量检索可以高效地为大语言模型补充世界知识和本地知识;同时,精准且通用的语义表征能力对于提升大语言模型的事实性、实现其长期记忆、以及快速构建大语言模型面向垂直领域的应用都具备深远的意义。本次报告将介绍智源研究院语义向量模型 BAAI General Embedding(BGE) 及应用实践。

报告提纲:

1. 基础理论

语义检索基础

面向语义表征的预训练语言模型

2. 应用实践

BGE模型代码解析

BGE模型结合大语言模型的应用

刘政

肖诗涛

9月23日

15:40-

17:10

《FlagEval 大模型评测体系及开放平台》

模型评测是模型生产生命周期中非常重要的一环,随着近年来基础模型相关理论和技术的高速发展,但传统的评测方法和基准在基础模型评测上正面临失效的困境,因此研发面向基础模型的评测方法和工具就显得更为重要。FlagEval 大模型开源评测体系创新构建了“能力-任务-指标”三维评测框架,尝试细粒度刻画基础模型的认知能力边界。

报告提纲:

1. FlagEval 项目建设背景

2. FlagEval 大语言模型评测体系

大语言模型评测存在的难点

评测框架介绍

主流开源模型能力评测结果及解读

杨熙

10月29日

09:30-

10:30

《FlagData大模型数据处理工具集》

在大模型时代,训练数据的重要性被提升到了一个新的高度。训练数据是模型能力的重要来源,提升数据质量对于提升大模型的性能具有重要的意义。当前在大模型开发的过程中,对海量的预训练数据进行分析、清洗和过滤已经成为一项重要的工作内容。FlagData大模型数据处理工具集,提供了数据标注、分析、清洗等流程在内的全流程工具,能够为大模型开发中的数据工作提供帮助。

报告提纲:

1. 大模型时代的数据处理

2. 数据处理工作中的难点

3. FlagData工具集

4. 总结与展望

张正

10月29日

10:40-

11:40

《从视觉到多模态基础模型》

语言基础模型率先取得突破,如何构建通用的视觉和多模态基础模型,成为现在视觉领域关注的热点问题。本次报告将围绕视觉上下文学习、图文对比学习、生成式多模态预训练等技术,介绍大规模视觉表征、通才视觉模型、通才多模态模型等最新研究进展和应用实践。

报告提纲:

1. 基础算法

图文对比学习

上下文视觉学习

生成式多模态预训练

2. 应用实践

EVA-CLIP在开放视觉识别中的应用

SegGPT 分割模型使用实践

Emu在多模态理解和生成中的应用

王鑫龙

_

结营仪式

_

报名通道

授课专家

刘广,北京邮电大学博士,北京智源人工智能研究院NLP和多模态研究中心负责人,负责飞智FlagAI开源项目以及训练悟道·天鹰Aquila系列基础模型,主持科技创新2030-“新一代人工智能”重大项目课题,在人工智能领域学术会议和期刊上发表论文,发明专利申请十余项,主要研究方向是预训练大模型和多模态文图生成等方向。

张博文,北京科技大学博士,北京人工智能研究院NLP和多模态研究中心研究员,悟道·天鹰Aquila系列基础模型核心参与者,主持开发AquilaCode系列开源模型,FlagAI开源项目和FlagEval核心开发者。在自然语言处理、信息检索、人工智能领域顶级学术会议和期刊SIGIR, ACL, CIKM, ICASSP, Information Sciences等发表论文多篇。

张振铎,北京智源人工智能研究院NLP和多模态研究中心研究员,清华大学硕士,FlagAI开源项目和悟道·天鹰Aquila模型的核心参与者,负责BAAI InstructFace开源项目的开发工作。主要研究方向包括图像识别、视频识别和检索、多模态生成、大模型预训练等领域,在计算机视觉、人工智能领域顶级学术会议和期刊发表论文多篇。

吴欣雅,北京智源人工智能研究院NLP和多模态研究中心研究员,北京邮电大学硕士,FlagAI开源项目和悟道·天鹰Aquila模型的核心参与者,负责Alt-diffusion开源项目的开发工作。主要研究方向包括大模型,多模态预训练,文图生成等方向。

刘政,北京智源人工智能研究院信息检索与知识计算组负责人,香港科技大学博士,曾担任MSRA主管研究员、华为2012实验室技术专家等职务,主持研发BAAI General Embedding等开源模型,参与开发BING Ads、Microsoft News、Huawei Petal Search等多个商用信息检索系统开发;在自然语言处理、信息检索、与数据挖掘领域等领域的顶级刊物发表论文数十篇。

肖诗涛,北京智源人工智能研究院信息检索与知识计算组研究员;北京邮电大学硕士;智源FlagEmbedding项目核心开发者,主持开发BAAI General Embedding等开源模型;在KDD、SIGIR、ACL、EMNLP等顶级学术会议发表多篇论文。

杨熙,北京智源人工智能研究院技术平台智能评测组负责人。北京大学博士,中科院计算所博士后。FlagEval核心贡献者,主要研究多领域、多维度的基础模型评测方法及工具。

张正,北京智源人工智能研究院数据研究组负责人,清华大学博士,研究领域为自然语言处理、大模型和对话系统,曾主持国家重点研发计划课题和国家自然科学基金项目,参与组织了FlagData的开发工作。

王鑫龙, 智源研究院视觉模型研究中心负责人。本科毕业于同济大学,博士毕业于澳大利亚阿德莱德大学,师从沈春华教授。他的研究兴趣是计算机视觉和基础模型,近几年研究工作包括视觉感知 (SOLO, SOLOv2),视觉表征 (DenseCL, EVA),视觉通才模型(Painter, SegGPT),多模态表征(EVA-CLIP),多模态通才模型(Emu)。曾获Google PhD Fellowship和阿德莱德大学博士研究奖章。

往期讲习班焦点回顾

讲习班第一季的前三期均已在线下成功召开,来自顶尖科研领域及相关应用方向的权威专家联合授课。他们有:旷视科技主任研究员张祥雨,微软亚洲研究院高级研究员吴晨飞,南京航空航天大学教授李丕绩,哈尔滨工业大学教授张伟男,上海交通大学助理研究员陈露,中国人民大学准聘助理教授李崇轩,中国人民大学准聘助理教授林衍凯,哈尔滨工业大学教授车万翔,科大讯飞研究院资深科学家崔一鸣,腾讯AI Lab专家研究员涂兆鹏,第四范式强化学习科学家黄世宇,以及中科院自动化所研究员刘静。

/ 现场一瞥 /

注册须知

课程形式:所有专家均在现场授课,学员亲临现场参与,如外地学员有困难,可申请线上听课。按照报名及付费顺序,优先录取线下学员。名额满额后,仅提供线上通道。

教学地点:智源大厦综合报告厅(北京市海淀区成府路150号)

授课时间:每日上午09:30-12:00,下午14:00-17:00

课后录播:课程结束后,所有学员将在一定期限内获得在线回放视频(含教学课件)。

注册费:第四期(S01E04)每人1999元,学生优惠999元;购买第一季(S01E01-04,共四期)套票每人4999元,学生2999元。

所有线下学员将获赠一本《自然语言处理 基于预训练模型的方法》图书

线下学员参与Q&A时还可获赠书籍等礼品

成为学员,可获得AI职位服务推荐机会,请在报名时选择

唯一报名通道

申请全额奖学金

如满足以下任一条件,可在报名后申请全额奖学金:

开源项目作者:GitHub开源AI项目(文档类300 Star以上、项目类50 Star以上)主要贡献者

基于FlagOpen发表论文或创建开源项目(5 Star以上)

成为OpenLabel数据标注共享平台优秀贡献者

加入BAAI实习计划,或成为优秀学员

注意事项

报名费用将用于会议费、报名费、学习费、资料费、茶歇费、书籍费、结业证书费、现场茶歇、饮用水、线上会议室等

食宿及交通需自理

报名后,工作人员将邀请加入学员微信群

讲习班支持开具发票,类型包括:会议费、会议注册费、培训费、专票等

讲习班提供邀请函,入群后领取

如需开发票,请在报名并加入微信群后填写对应表单

如对课程有任何问题,请联系editor@baai.ac.cn

点击

阅读原文

立即报名讲习班

第一期:/uploads/pic/20230919/3694319550200

第二期:/uploads/pic/20230919/4698389866414

第三期:/uploads/pic/20230919/8712043160614 

Tags:
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。