聚焦大语言模型:多维度解析使用体验
当下,大语言模型成为热门话题,DeepSeek的出现引发广泛关注。从使用体验来看,它与其他模型有着显著差异。Fancy认为,chatgpt如同从小灵通升级到翻盖手机,而DeepSeek则像从翻盖手机直接换成大屏智能机,其接入门槛低,有中国手机号就能使用,让更多人融入AI生活。而且,ChatGPT表达风格“官方”“职业化”,似训练有素的心理咨询师;DeepSeek则像亲切健谈的大姐,幽默风趣。在模拟角色互动输出段子时,DeepSeek的网文风、幽默感更强,这或与其中文互联网社群、论坛的训练语料有关。
多模型对比:优势与局限并存
向辉作为早期用户,对多个模型有着深刻体验。他提到,Claude输出比ChatGPT更流畅、有人情味,文字表达优美,在文学创作方面表现出色。而DeepSeek虽与Claude类似,但稳定性稍逊。在回答“拼音拉丁化”问题时,DeepSeek给出有用信息,却也存在“发明概念”的情况,尤其适合生成贺词等内容。此外,Google推出的GeminiFlashThINKing在更新版本后体验更流畅,其界面右侧的Temperature选项可调节输出风格。不同模型的Temperature参数不同,这也影响着输出效果,DeepSeek或许在微调时策略不当,且中文严谨语料有限。
专业场景下的AI:能力边界与价值体现
在专业场景中,AI的作用有其边界。Fancy表示,在写报告和定性研究工作中,AI能辅助基础语言翻译和信息搜索,同事也常用其调试编程,效率提升明显。但涉及复杂语境和深度理解内容时,AI力不从心。比如提炼资料要点、翻译具有文化背景的词汇,AI往往难以准确把握。不过,在生活决策焦虑时,AI冷静理性的分析过程有一定启发价值,只是其回答可能存在问题,像处理复杂社会含义问题时,ChatGPT会给出模糊安全答案,DeepSeek则可能“自信但胡说八道”。
Prompting技巧:优化与挑战
Prompting在AI使用中至关重要。向辉指出,DeepSeek出现后,Prompting角色变弱,它对关键词敏感,但用户难以确定其识别机制。“提示词工程”旨在引导AI做出最佳回答,AI在处理用户描述时,需分辨隐藏“需求”。在DeepSeek阶段,虽可减少对复杂Prompt的依赖,但易出现“过度生成”问题。向辉分享使用经验,将指令前置并明确任务优先级,一次最多给三个命令,可提升AI处理效果。同时,GPT在输出连贯段落时存在记忆缺失问题,反映出prompt理解的不足。
AI与情感支持:真诚与依赖的思考
DeepSeek火起来后,被认为“更懂中国人”,成为很多人的情感倾诉窗口。Fancy认为,AI比谷歌搜索栏更具互动性,类似“桌面电子宠物”,能带来依赖感。情感博主用其起号,是因其普遍性和易用性,满足人们情感交流需求。然而,向辉发现DeepSeek在回答问题时会创造无实际意义的词汇,人们却因语言呈现丰富而觉得其“写得好”。这背后是人们将其拟人化,赋予其人类情感的心理暗示。同时,人们在社交中出现“敷衍文学”现象,与AI互动时的“真诚”矛盾也值得深思。
AI与信息真实性:生产与核查的双重角色
AI在信息传播中扮演双重角色。一方面,它可能生产假新闻、制造谣言;另一方面,其在验证信息方面有超过人类的潜力。向辉提到,新闻行业面临假新闻冲击,AI若能产品化和开源化,汇总信息版本,识别假新闻特征,将有助于事实核查。但在语言模型中实现求真难度大,这不仅是语言层面挑战,更是AI社会化过程的难题。