在当下,AI生成内容日益增多,人们对文字来源的怀疑也愈发强烈。一个普通工作日,编辑部围绕一篇稿子展开了AI文风大讨论。这篇两千字的稿子,频繁出现“有人认为”“有网友认为”,且“端水”明显,引发了大家对是否为AI创作的猜测。
给AI断文风看似荒谬,可随着AI作品增多,人类开始担忧无法辨别文字出自人手还是代码。如今,编辑怀疑投稿文学作品、读者怀疑网络新闻报道、用户怀疑社交平台帖子,甚至外卖软件的好评都可能是AI生成。人类文字内容进入特殊怀疑主义时代,AI的高效传播让怀疑情绪不断增长。
为探测AI编造能力的边界,我们进行了一场AI对人类作家风格模仿的测试。参赛选手有豆包、Kimi-k1.5、DeepSeek-R1、文心一言4.0工具版和GPTo3-mini。以鲁迅为例,文心一言推理过程简洁明确,但生成内容忽略鲁迅所处时代及微观风格;GPTo3-mini虽宣称进行深刻反思和评论,但内容刻板;Kimi思考过程复杂,却产出句式相似文本;DeepSeek方案合理,实践中却因“极繁主义”暴露马脚。
那么,当真假作家文本混杂,人类读者能否辨别呢?本次测试邀请了老板Tim和同桌园长作为嘉宾。测试结果表明,当前AI模仿作家风格生成的新文本,无法骗过读者。Tim通过词汇、意象等判断标准,快速找出AI模仿沈从文的作品;园长则凭借直觉分辨出AI版张爱玲文本。
有趣的是,当把AI选手仿写的鲁迅片段投喂给DeepSeek时,它竟将不同选手的作品错认成其他作家。这显示出AI在文风辨别上也存在困难。
尽管论文、小说等领域的AI写作备受关注,但实际上,充斥互联网的日常语料才是AI编造的重灾区。社交平台的短内容、新闻评论区等,都有AI生产的日常语料混入。这些内容短、语境轻松、辨别成本高,用户辨别意愿低。
“用AI伪装人类互动,在很多内容平台早已存在,大模型出现后伪装更像。”互联网从业者表示,“水军”或平台可能有生产AI评论的动机。当人类日常语料被无限稀释,我们需要思考如何应对这一现象。