基于深度Q网络和动态策略检索的大语言模型越狱攻击自适应策略学习

张鑫泽; 李帅; 苗莉

在位置 0 处没有任何行。基于深度Q网络和动态策略检索的大语言模型越狱攻击自适应策略学习-Adaptive Policy Learning for Large Language Model Jailbreaking via Deep Q-Networks and Dynamic Strategy Retrieval