诱导 - 新火种

首页 > 诱导

用深度催眠诱导LLM「越狱」，香港浸会大学初探可信大语言模型

尽管大语言模型 LLM (Large Language Model) 在各种应用中取得了巨大成功，但它也容易受到一些 Prompt 的诱导，从而越过模型内置的安全防护提供一些危险 / 违法内容，即 Jailbreak。深入理解这类 Jailbreak 的原理，加强相关研究，
2023-11-23 17:52
研究称ChatGPT搜索功能存在被操纵风险：可被恶意网站诱导输出不可信内容

26日讯，根据英国《卫报》发布的一项调查，OpenAI的ChatGPT搜索工具可能会被隐藏内容操控，甚至返回恶意代码。《卫报》测试了ChatGPT如何应对包含隐藏内容的网页摘要。这些隐藏内容可能包括来自第三方的指令，干扰ChatGPT的回应，或是包含旨在影响回应的内容，如大量隐藏的文字推销某个产品或
2024-12-26 09:20