首页 > 实时

实时

  • 瑞萨电子推视觉AI和可实时控制微处理器无需依赖云计算平台

    29日讯,瑞萨电子宣布推出一款面向高性能机器人应用的微处理器(MPU)新品RZ/V2H。该新品可实现视觉AI与实时控制功能,配备瑞萨新一代专有AI加速器DRP-AI3(动态可配置处理器-AI3),可带来10 TOPS/W的能效,相比早期型号提高可达10倍。

  • 超越GPT-4o!阿里发布最强开源多模态模型Qwen2-VL,支持实时视频对话

    新的最强开源多模态大模型来了!阿里Qwen2大模型家族新添多模态模型Qwen2-VL,在图像和长视频理解任务上双双取得了SOTA。在具体的子类任务中,Qwen2-VL在大部分的指标上都达到了最优,甚至超过 GPT-4o等闭源模型。在多模态能力的加持下,Qwen2-VL可以实时读取摄像头或电脑屏幕,进

  • 工作空间设计的未来:人工智能、3D演练和实时协作

    在过去的十年里,在引入智能的人工智能工具之后,工作空间的设计已经完全改变了。早些时候,办公室布局有基于预先设计的分层工作站,忽略了工作环境。这些办公室也有过时的管理系统,依赖于手工流程,缺乏可扩展性。在这里,室内设计师很少考虑符合人体工程学的家具和灵活的工作站。然而,人体工程学的重要性使建筑师和设计

  • 安徽省高速ETC车型识别实时稽核

    8月28日,记者获悉,为有效应对“改变车型”逃费行为,省交控集团建立计费与通行车型比对模型,开发高速公路ETC门架车辆车型识别及存疑车辆拦截功能,提高稽核工作效率。  稽核系统通过“ETC”门架车

  • 桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

    GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马get到这是巴黎地标。然后再给它看一眼地铁图,指一指

  • 用VisionPro实时训练机器狗!MIT博士生开源项目火了

    Vision Pro又现火爆新玩法,这回还和具身智能联动了~就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对机器狗的实时控制。不仅开门这样的动作能精准get:也几乎没什么延时。Demo一出,不仅网友们大赞鹅妹子嘤,各路具身智能研究人员也嗨了。

  • OpenAI发布实时API语音合作伙伴 Agora、Twilio在列

    今天,OpenAI发布了实时 API 公开测试版,用于构建基于GPT-4o语音到语音的AI应用和智能体,所有付费的开发者都能在应用程序中构建低延迟、多模态的实时互动体验。同时OpenAI 还公布了3家语音API合作者LiveKit、Agora、Twilio。其中Agora的兄弟公司是声网,两家公司在