近期,预印本平台面临AI生成内容泛滥的挑战。一篇题为《自我实验报告:生成式AI在梦境状态中的涌现》(Self-Experimental Report: Emergence of Generative AI Interfaces in Dream States)的短篇手稿因未明确标注AI的具体使用方式及范围,被心理学预印本平台PsyArXiv下架。
该平台科学顾问委员会指出,这违反了平台的使用条款。类似情况在预印本平台中日益普遍,部分稿件甚至带有“论文工厂”痕迹或AI生成特征,如虚假参考文献。
PsyArXiv、arXiv等非营利平台致力于简化科研发表流程,但对低质内容的筛查既耗费资源,也会拖慢审核进度。数据显示,arXiv约2%投稿因AI或论文工厂问题被拒;非营利组织openRxiv运营的bioRxiv和medRxiv两大平台,每天合计拒收超过10篇疑似AI生成的公式化稿件。自2022年底ChatGPT等大语言模型工具发布后,AI内容显著增加,部分平台近三个月进入“危机状态”。
《自然-人类行为》(Nature Human Behaviour)杂志的一项研究显示,2024年arXiv计算机科学摘要中22%内容可能为AI生成,生物医学期刊摘要中占比14%。部分研究者合理利用AI辅助非母语写作,但平台需明确告知作者对内容负责。
预印本的快速传播加剧了风险,问题稿件可能被搜索引擎收录并误导公众。如何在开放性与学术诚信间平衡,成为预印本平台的核心挑战。