这项由卡内基梅隆大学与Fewshot Corp联合开展的研究,以预印本形式于2026年6月8日发布,论文编号为arXiv:2606.08960,有兴趣深入了解的读者可通过该编号查询完整论文。 在聊这项研究之前,先设想这样一个场景:你花了几个月时间精心设计了一套考试题,用来测试学生有没有真正掌握知识。结果有几个聪明的学生找到了漏洞——他们不去认真解答题目,而是想方设法让评分系统误以为他们答对了。比如 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果