2023年最重要的3项人工智能创新：多模态AI、宪法AI和文本转视频技术

首页 > AI资讯 > 最新资讯 > 2023年最重要的3项人工智能创新：多模态AI、宪法AI和文本转视频技术

2023年最重要的3项人工智能创新：多模态AI、宪法AI和文本转视频技术

新火种 2023-12-28

站长之家12 月 22 日消息:2023 年，人工智能（AI）领域见证了重大进展，不仅公众对 AI 有了更深的理解，政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现，更是长期孕育后的集中爆发。

OpenAI ChatGPT，人工智能，AI

以下是过去一年中人工智能领域最重要的三项创新：

多模态 AI（Multimodality）多模态 AI 指的是 AI 系统处理各种不同类型数据的能力，不仅包括文本，还包括图像、视频、音频等。今年，公众首次获得了强大的多模态 AI 模型的访问权限。OpenAI 的 GPT-4 是其中的先锋，允许用户上传图像以及文本输入。例如，用户可以基于冰箱内容的照片询问 GPT-4 晚餐应该做什么。9 月，OpenAI 推出了用户通过语音以及文本与 ChatGPT 互动的功能。

宪法 AI（Constitutional AI）宪法 AI 尝试解决如何使 AI 符合人类价值观的难题。2022 年 12 月，顶尖 AI 实验室 Anthropic 的研究人员首次描述了宪法 AI，并在其 2023 年推出的聊天机器人 Claude 中使用了这一技术。该技术的核心是先撰写一份表达期望 AI 遵循的价值观的「宪法」，然后训练 AI 根据宪法评分响应，并激励模型输出得分更高的响应。这是一种 AI 反馈的强化学习方法，与人类反馈的强化学习相比，更精确控制 AI 行为，且需更少的人类标签。

文本转视频技术文本转视频工具的迅速崛起是今年投入 AI 领域的数十亿美元资金的显著成果。布鲁克林的 AI 视频初创公司 Runway 的最新模型 Gen-2 允许用户不仅根据文本生成视频，还能根据文本提示改变现有视频的风格。此外，另一家初创公司 Pika AI 正在使用其技术每周创建数百万新视频。这些免费工具试图改变用户生成内容的格局，可能在 2024 年发生，但由于文本转视频工具计算成本高，一旦风险资本用尽，它们可能开始收费。

Tags:

神经网络和文人工智能

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

2023年最重要的3项人工智能创新：多模态AI、宪法AI和文本转视频技术

美光科技：人工智能（AI）需求稳健，驱动数据中心DRAM产品增产

Meta发布多模态LLAMA3.2人工智能模型，能够同时理解图像和文本

全球人工智能基础设施融资风起云涌，汇丰希望投身其中

达能集团首席执行官盛睿安：上海完全有能力作为探索人工智能在医疗领域应用的试点城市

工信部辛国斌：深化5G+工业互联网和人工智能赋能加快数字技术在制造业全行业全链条的应用

热门文章

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

AI剧本风控项目启动天使轮融资

AI图像生成平台「LiblibAI」获数亿元融资

【VIP机会日报】机器人概念再度走强栏目追踪行业动态提及产业相关公司强势涨停

紫光国微：在特种集成电路业务方面强化业务能力、提升发展质量

联芸科技：我司已量产的商用产品暂未应用于无人驾驶

L3上路倒计时？工信部加快推进智能网联车规划产业基建+商业化迎来关键节点

资讯出海，扬帆起航正当时！

ChatGPT引爆“吉卜力”风格图像生成浪潮同时激发AI违法争议