人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024
亿华灵动2025-11-26 20:12:25【物联网】4人已围观
简介利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。来自人大&港科大的研究人员提出安全概念激活向量SCAV)框架,通过精确解读大模型的安全机制来指导攻击。基于SCAV的攻击方法能
利用概念激活向量破解大模型的港科安全对齐,揭示LLM重要安全风险漏洞
。大揭洞利的安
来自人大&港科大的模型模型研究人员提出安全概念激活向量(SCAV)框架