
AI幻觉由来已久。而对严谨性要求很高的科研人来说,AI的胡编乱造是个很大的问题。
为什么AI会生成不存在的「假文献」「假链接」?
(对这部分不感兴趣的同学,可直接跳过,进入实操环节)
•
本质上,无论是推理模型(如,GPT-o系列,DeepSeek R1),还是非推理的普通模型(如,GPT-4、DeepSeek V3),它们在做的都是基于预测概率的next token prediction(「预测下一个词元」)。
•
简单理解,模型会根据前文预测每个词(更准确地说,是token)的概率,然后基于概率分布采样生成下一个词。哪个词的预测概率高,自然就更容易被采到而成为下一个词。当然,实际情况比这复杂得多。
•
既然是基于概率的采样,那么胡编乱造就很难避免了。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。