8岁孩子也能编程!4名MIT本科生打造AI“神器”
特斯拉前AI和自动驾驶视觉总监、OpenAI创始成员Andrej Karpathy于2023年年初在X上发帖预言称,最热门的新编程语言是英语。现在,这几乎已经成为现实。就在上周,知名AI编程工具Cursor发布了一项更新,最新版本的Cursor通过能够独立浏览上下文和执行终端操作的AI代理实现了部分
特斯拉前AI和自动驾驶视觉总监、OpenAI创始成员Andrej Karpathy于2023年年初在X上发帖预言称,最热门的新编程语言是英语。现在,这几乎已经成为现实。就在上周,知名AI编程工具Cursor发布了一项更新,最新版本的Cursor通过能够独立浏览上下文和执行终端操作的AI代理实现了部分
今天分享一篇被CVPR 2020接收的论文,这篇论文与生成对抗GAN相关,题目为“MSG-GAN: Multi-Scale Gradient GAN for Stable Image Synthesis”(MSG-GAN:用于稳定图像合成的多尺度梯度GAN)。
2月8日消息,明天就是除夕了,很多人都会在除夕晚吃完团圆饭与家人一起拍上一张全家福。对此,余承东发文推荐Mate 60/X5等产品的人像AI云增强功能,可以智能优化人像照片,让每个人的面部细节更加清晰,甚至头发都根根分明。
10月16日消息,AI换脸技术已经成为当前反诈工作的一大难点,对此,荣耀CEO赵明今日发文宣布,荣耀Magic7的端侧AI模型具备deep fake换脸检测能力,能在视频通话中一眼识别真伪。
近日,AIGC软件A股上市公司万兴科技(300624.SZ)加码AI在全球电商市场的应用落地,在海外重磅推出新一代AI电商图片生成神器Wondershare VirtuLook,上线“AI试衣间”及“AI商品图”功能,为电商商家提供商品实拍图的模特及场景替换解决方案,多维赋能商家低成本、分钟级生成多
用GAN模型进行图像合成有一个显著缺点,就是生成的图像不可控制,经常是摘个眼睛把性别都变了。最近Adobe提出新一代GAN模型,能够自由控制35个人脸属性的变化,而不会互相干扰。图像合成中的一个重要问题就是图像内的纠缠(entanglement)问题。
声明:本文来自于饱受会议折磨的打工人,终于可以解放了!就在刚刚举办的Google Cloud Next’23大会上,谷歌宣布了一系列科技新进展,最瞩目的要属其中的“开会AI替身”了。只需要一句“帮我参加”,AI就能替你开会,并在合适的时机发言提问:
虽然多模态大模型都能挑西瓜了,但理解复杂文档方面还是差点意思。面对文字密集、多栏混排等文档时往往力不从心,区域级别的细粒度理解,就更是无从谈起了。最近,旷视团队打造了一支多模态大模型的“点读笔”——Fox,轻松实现对8页文档(中英混合,单栏多栏格式混合的极端场景)的交互式感知理解。对于信息密集的PD
看看这个 AI 生成的女团 MV 效果如何。如果你手机里有一些修图软件,你可能用过里面的「AI 绘画」功能,它通常会提供一些把照片转换为不同风格的选项,比如动漫风格、写真风格。但如今,视频也可以这么做了:这些动图来自 X 平台(原推特)网友 @CoffeeVectors 生成的一段视频。
12月31日消息,微软针对Windows 11 AI+ PC设备推出了一项名为AI Dev Gallery的新功能,旨在帮助开发者在其应用中融入端侧AI功能。