历史小故事

审稿人 撰写 识别 摘要 论文

审稿人或难识别AI撰写的论文摘要

jnlyseo998998 发表于2023-03-13 20:09:03 浏览37 评论0

抢沙发发表评论

来源：科技日报

据近日发表在预印本服务器bioRxiv上的一项研究，人工智能(AI)聊天机器人ChatGPT已可写出令人信服的假研究论文摘要，甚至连审稿科学家也无法发现。

聊天机器人ChatGPT会根据用户提示创建逼真文本，它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具，并供用户免费使用。

自发布以来，研究人员一直在努力解决相关伦理道德问题，因为它大部分输出可能很难与人类撰写的文本区分开来。近日美国西北大学的一个研究小组使用ChatGPT生成人工研究论文摘要，以测试科学家是否可辨别它们。

研究人员要求机器人基于发表在《美国医学会杂志》《新英格兰医学杂志》《英国医学杂志》《柳叶刀》和《自然·医学》上的50篇研究编写摘要。然后，他们通过抄袭检测器和AI输出检测器将这些摘要与原始摘要进行比较，并要求一组医学研究人员找出编造的摘要。

结果，ChatGPT生成的摘要通过了抄袭检查器，原创性得分中位数为100%，表明没有检测到抄袭。人工智能输出检测器发现了66%的生成摘要，但人工审稿人只正确识别了68%的生成摘要和86%的真实摘要，他们错误地将生成摘要中的32%识别为真实，将14%的真实摘要识别为编造。

研究人员称，ChatGPT写出了能骗过人类的科学摘要，如果科学家无法确定研究是否属实，或会产生“可怕的后果”。

研究人员表示，在虚假信息会危及人们生命安全的医学等领域，期刊需要采取更严格的方法来验证信息的准确性。而这些问题的解决方案，不应集中在机器人本身，“而是导致这种行为的不正当激励措施，例如通过论文数量进行招聘和晋升审查，而不考虑其质量或影响”。

少长咸集