太魔幻了!DALL·E2居然能用自创的语言来生成图像,AI模型的可解释性再一次暴露短板
万一DALL·E-2是在向人类发出什么了不得的信号呢?这门语言快学起来!作者|李梅、刘冰一编辑|陈彩娴DALL·E 和 DALL·E-2从文本生成图像的魔力,想必大家都已经见识过了。作为深度生成模型,它们能够将文本作为输入,生成匹配给定文本的超逼真图像。不过,DALL·E-2 的一个众所周知的局限性
万一DALL·E-2是在向人类发出什么了不得的信号呢?这门语言快学起来!作者|李梅、刘冰一编辑|陈彩娴DALL·E 和 DALL·E-2从文本生成图像的魔力,想必大家都已经见识过了。作为深度生成模型,它们能够将文本作为输入,生成匹配给定文本的超逼真图像。不过,DALL·E-2 的一个众所周知的局限性
南方财经全媒体记者丁莉广州报道 点进直播间,“化作人形”的AI摇身一变为带货主播,推销话术丰富且风趣;对着手机喊一声,AI助手就能根据主人要求下单商品、回复消息……学会自主思考、甚至使用工具的AI已日益全面且深入地参与到了人们的日常生活中。 11月17日,2024大湾区科学论坛—人工智能分论坛暨
大模型带来的生命科学领域突破,刚刚再传新进展。来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正式对外开源。它不仅可以准确识别细胞身份,还具有很强的零样本分析能力,论文已被ICML 2024录⽤。LangCell的数据集中包含约2750万条数据,覆盖了细胞类型、发育阶段、组织器
机器之心报道参与:思源你是否有时要用 PyTorch,有时又要跑 TensorFlow?这个项目就是你需要的,你可以在训练中同时使用两个框架,并端到端地转换模型。也就是说 TensorFlow 写的计算图可以作为某个函数,直接应用到 Torch 的张量上,这操作也是很厉害了。在早两天开源的 TfPy
tokenizer对于图像、视频生成的重要性值得重视。在讨论图像、视频生成模型时,人们的焦点更多地集中在模型所采用的架构,比如大名鼎鼎的 DiT。但其实,tokenizer 也是非常重要的组件。
2024年6月3日,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来,是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 M
11月20日消息,在前不久的vivo开发者大会上,vivo发布了基于蓝心大模型的“蓝心千询”自然语言对话机器人,并表示将开放给所有手机品牌使用。目前,“vivo千询”应用已经正式上架vivo官方应用商店,所有品牌手机都可以通过下载apk文件来安装使用。用户下载安装之后,需要vivo账号进行登录,
12月30日消息,明天就是跨年夜了,如果你拍摄技术堪忧,跨年大片可以交给腾讯混元AI了,直接一键生成绝美大片。腾讯元宝“AI美照”功能已经上线了跨年专区,可以免费制作预制写真,通过各种模版来生成自己的跨年大片。整体来说流程还是非常简单的,整体逻辑有些类似去年爆火的“妙鸭相机”,通过AI来美化修图。
7月25日消息,前不久,小米宣布小米小爱大模型将迎来全量升级,全部免费。除了手机、平板之外,还有电视、汽车、音箱等设备都将支持升级。
这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。简单来说,AppAgent 的智能代理能力可以用于操作任何 App,它在 50 个复杂手机任务上展示了强大的能力。AppAgent 幕后团队来自腾讯,相关技术论文也已经公布。