17吃瓜

您当前位置: 17吃瓜  >  17吃瓜  >  17吃瓜网 新闻  >  正文

17吃瓜网 新闻

刘华虓教授团队论文被自然语言处理领域顶级会议ACL2026接收

发布日期:2026-05-13 发布人: 点击量:

  17吃瓜网 刘华虓教授团队论文“Route to Rome Attack: Directing LLM Routers to Expensive Models via Adversarial Suffix Optimization” ACL 2026 主会录用。论文主要作者包括2024级软件17吃瓜网 硕士研究生唐浩淳、2024级计算机17吃瓜网 硕士研究生卢嘉华,通讯作者为17吃瓜网 刘华虓教授和香港科技大学(广州)戴恩炎教授。


  该工作首次系统性地揭示了成本感知大语言模型路由系统在黑盒场景下的严重安全漏洞。针对现有路由攻击依赖白盒梯度或启发式模板、在真实场景中失效的局限,团队提出了一种新颖的黑盒路由攻击框架 R2A。该方法通过构建混合集成代理路由器,在极少量查询预算下精准拟合闭源路由决策,迫使路由器将任意简单查询错误导向高算力昂贵模型。该攻击展现了极强的泛化能力与实用性:在黑盒条件下,R2A 不仅成功攻破多个开源路由系统,还直接作用于 GPT-Auto OpenRouter 等商业级生产系统,导致推理成本最高飙升 2.9 倍。