首页 > LLM

LLM

  • OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

    LLM 能力强大,倘若别有用心之人用其来干坏事,可能会造成难以预料的严重后果。虽然大多数商用和开源 LLM 都存在一定的内置安全机制,但却并不一定能防御形式各异的对抗攻击。近日,OpenAI 安全系统(Safety Systems)团队负责人 Lilian Weng 发布了一篇博客文章《Advers

  • 微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了

    大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。原文来源:机器之心由无界 AI生成我们知道,仅在无监督文本语料库上预训练的基

  • GPT-4不知道自己错了!LLM新缺陷曝光,自我纠正成功率仅1%,LeCun马库斯惊呼越改越错

    GPT-4根本不知道自己犯错?最新研究发现,LLM在推理任务中,自我纠正后根本无法挽救性能变差,引AI大佬LeCun马库斯围观。原文来源:新智元由无界AI生成大模型又被爆出重大缺陷,引得LeCun和马库斯两位大佬同时转发关注!在推理实验中,声称可以提高准确性的模型自我纠正,把正确率从16%

  • 小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%

    对于 2023 年的计算机视觉领域来说,「分割一切」(Segment Anything Model)是备受关注的一项研究进展。Meta四月份发布的「分割一切模型(SAM)」效果,它能很好地自动分割图像中的所有内容Segment Anything 的关键特征

  • LeCun和xAI联创对呛,GPT-4重大推理缺陷无解?网友:人类也是「随机鹦鹉」

    原文来源:新智元由无界AI生成最近,包括LeCun在内的一众大佬又开始针对LLM开炮了。最新的突破口是,LLM完全没有推理能力!在LeCun看来,推理能力的缺陷几乎是LLM的「死穴」,无论未来采用多强大的算力,多广阔和优质的数据集训练LLM,都无法解决这个问题。而LeCun抛出的观点,引发

  • 研报丨AI与Web3数据行业融合的现状、竞争格局与未来机遇探析(上)

    GPT的横空出世将全球的目光吸引至大语言模型,各行各业都尝试着利用这个“黑科技”提高工作效率,加速行业发展。Future3 Campus携手Footprint Analytics共同深入研究AI与Web3结合的无限可能,联合发布了《AI与Web3数据行业融合现状、竞争格局与未来机遇探析》研报。该研报

  • 小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大

    原文来源:机器之心由无界 AI生成大型语言模型 (LLMs) 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更好

  • 最顶尖的大语言模型人才,只关心这10个挑战

    来源:硅兔赛跑作者:林檎 编辑:蔓蔓周由无界 AI生成编者按:本文探讨了大语言模型(LLM)研究中的十大挑战,作者是Chip Huyen,她毕业于斯坦福大学,现为Claypot AI —— 一个实时机器学习平台的创始人,此前在英伟达、Snorkel AI、Netflix、Primer公司

  • LLM幻觉问题全梳理!哈工大团队50页综述重磅发布

    原文来源:新智元由无界 AI生成幻觉,老朋友了。自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。当然,有关大语言模型幻觉的问题已经有了无数研究。最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。这篇综述从LL