
防范大模型幻觉可能导致的信息安全问题

刘永谋(中国人民大学吴玉章讲席教授)
2025年春节以来,DeepSeek的发布在全球范围内掀起一波大模型应用的新热潮。由于在中文问答方面的优异表现,它受到中文大模型用户万众瞩目般的追捧,同时带动其他中文大模型产品如文小言、豆包、Kimi、腾讯元宝等的下载量。
不用做专业技术测评,用户可以直观感受到DS强大的推理能力。在深度思考功能中,首先可以看到为完成用户的任务,DS是如何“思考”即很大一段推理过程或方法论的描述,由灰色字体标识出来;然后才是黑色字体标识的正式回答,往往呈现出非常完整的框架性结构和逻辑链条。毫不夸张地说,DS的推理能力超过很多忽视逻辑推理能力训练的普通老百姓。
除此之外,DS令人惊艳的还有中文表述上的文采,令很多人评价“辞藻华丽”“情绪给到位”。作为一名学术用户,笔者能直观感受到DS标题取得好,讲究大词、术语的使用,行文工整,透露一股自信和专业的味道。如果特别地要求文本的风格,会发现它对语词的褒贬义、情绪和细节的选取非常讲究,用来做原创性不高的广告、文案、公文非常好用。
然而,随着DS用户爆炸式的增长,对它更高的期望也被越来越多的用户提出来。普通用户可以直接感受到的问题主要有两点:第一,响应率不高,很容易出现“服务器繁忙,请稍后再试”的情况。仅用作日常娱乐搜索问题不大,但如果用在正式的工作场合容易误事。第二,AI幻觉明显,事实性的东西胡编乱造的情况不少。据报道,行业权威Vectara HHEM人工智能幻觉测试显示,DeepSeek-R1显示出14.3%的幻觉率,远高于行业平均水平。
从原理上说,AI幻觉根源于统计学上的“随机鹦鹉”现象,所有的大模型都不可能完全避免,但是可以尽力消除。相比较而言,国产大模型产品各有千秋,但在遏制幻觉问题上,明显文心一言表现最为优异,无疑与研发团队一开始就将AI幻觉作为最重要的研究问题来对待有关。
如果说大模型产品只想做为某种娱乐工具,写写“小作文”,调节调节情绪,似乎AI幻觉问题不大。但如果想作为高效劳动工具和严肃的信息来源,AI幻觉问题处理不好会很危险,甚至很致命。毫不夸张地说,克服AI幻觉问题事涉信息安全问题,是大模型发展的基础性和前提性问题,任何一种大模型应用都无法绕过去。
笔者尝试用DS辅助收集学术资料,发现DS将作者与作品张冠李戴、杜撰文献和作者以及胡乱内容描述的情况不少。如果完全相信DS的回答,不仅无法切实提高工作效率,相反制造混乱和错误。当然,如果仅仅作为框架性的参考和提示,DS还是能发挥一定的辅助收集资料作用。
问题是在AI时代,很多人数字素养不高,容易迷信大模型产品。最近,在学界不少人用DS评价学者、著作、论文和某项研究的水平,以为DS客观公正,可以杜绝人情、关系和权力等因素的干扰。这是典型的技术迷信行为,相信大模型至上,将之凌驾于人的判断之上。国际通行的学术评议方式是同行评议(peer review),也就是由专业小同行进行学术评价。大模型根本不理解人类作品的含义,只是通过搜索、学习和上下文概率排序等技术手段生成文本,本质上是网上内容的“镜子”或“平均值”。显然,网上内容大部分不专业、不精确、不客观,如此大模型怎么可以取代同行评议呢?因此,完全以幻觉严重的AI产品作为研究根据,在学术上万万不行。
在社会传播方面,AI幻觉严重的大模型产品如果接入新闻、自媒体当中,大量假消息、假信息迅速生成。再加上开放和便捷的互联网传输,以及社交媒体的去中心化、反权威性,肯定会大大加剧后真相时代虚假信息泛滥的状况。使用大模型辅助生成各种文本的学生、文员和策划,长期使用AI幻觉严重的大模型产品,逐渐会丧失区别真实与虚假的判断力,甚至觉得只要形式精致、表述华丽就可以而真真假假都不重要了。
当事实性输出有问题时,不管推理能力如何强大,以错误事实为基础做决策肯定非常危险。不能否认可能出现“瞎猫碰到死耗子”的情况,但此类概率微乎其微,因为科学决策以准确而完善的信息收集为前提。有了关于决策对象各个方面的信息,才能提出有针对性的备选方案,决策者再从中挑选适合国情社情的决策方案。因此,大模型产品用于政务活动,首先就要对产品的除幻性能进行认真的评估。
如何防范大模型幻觉可能导致的信息安全问题?现阶段首要责任在大模型企业,必须投入人财物力压缩幻觉率,使之达到安全的阈值。其次,大模型产品的使用人员要提高数字素养,不可迷信AI,牢记以AI辅助劳动的“辅助”为主,让AI为人所用,严防AI反客为主。再次,尤其对于一些专业领域的大模型运用,文本生成精度要有特殊的标准,接入之前要进行严格而有针对性的幻觉率评估,切不可操之过急。最后,从长远来看,大模型信息安全问题值得各方面合作进行跨学科深入而细致的研究,形成系统化的防范方案,有步骤、有预案、有章法地推进大模型产品在各行各业的深度应用。
测评案例:DS、豆包与文心一言的学术信息收集整理能力
1.测试问题
“请推荐十本国内技术哲学著作。”
问题选择理由:笔者并非技术专家,不做专业的技术数据测评,做也是拿别人的工具跑一跑,因此仅做直观的问答内容测试,选择笔者非常熟悉的技术哲学领域,测试这三个大模型处理事实性信息的能力。
2.DS的回答
注意:在DS的正式回答之前,它有段推理提示,copy不下来,大家在下面的图片中可以看到。
以下是十本国内技术哲学领域的代表性著作,涵盖经典理论、前沿探索与中国本土视角:
---
### **1. 《技术哲学引论》**
**作者**:陈昌曙
**关键词**:技术本体论、技术价值、中西技术观比较
**推荐理由**:国内技术哲学奠基之作,系统构建技术哲学理论框架,提出“技术是人对自然的能动关系”的核心命题。
---
### **2. 《技术哲学讲演录》**
**作者**:吴国盛
**关键词**:技术思想史、自然哲学、现代性批判
**推荐理由**:融通中西技术思想,揭示“技术”概念在中国传统文化中的独特意涵,重构“技以载道”的本土话语。
---
### **3. 《过程论视野中的技术》**
**作者**:远德玉
**关键词**:技术演化、动态过程论、创新哲学
**推荐理由**:突破静态技术观,提出“技术是动态过程集合体”,为中国技术创新研究提供哲学基础。
---
### **4. 《技术哲学导论》**
**作者**:张华夏、张志林
**关键词**:技术认识论、系统哲学、技术伦理
**推荐理由**:结合系统科学方法论,构建技术哲学分析模型,注重逻辑严谨性与跨学科对话。
---
### **5. 《信息文明的伦理基础》**
**作者**:段伟文
**关键词**:数据伦理、人工智能治理、数字社会
**推荐理由**:直面算法社会核心问题,提出“可接受的科技”框架,推动伦理原则向治理实践转化。
---
### **6. 《中国科学技术的西传及其影响》**
**作者**:韩琦
**关键词**:中西科技交流、李约瑟难题、文化比较
**推荐理由**:从全球史视角重新审视中国技术传统,回应“为何近代科学未在中国诞生”的经典追问。
---
### **7. 《技术哲学研究》**
**主编**:朱葆伟、赵建军
**关键词**:技术批判、生态技术观、马克思主义技术哲学
**推荐理由**:国内技术哲学研究论文集萃,涵盖技术伦理、生态哲学与技术政治学多元议题。
---
### **8. 《技术解释研究》**
**作者**:张华夏
**关键词**:技术知识论、解释模型、复杂性科学
**推荐理由**:从科学哲学延伸至技术哲学,探讨技术解释的独特性与认知逻辑。
---
### **9. 《可接受的科学:当代科学基础的反思》**
**作者**:刘大椿
**关键词**:科学划界、技术风险、后学院科学
**推荐理由**:反思科学技术的边界与责任,提出“可接受性”作为科技发展的伦理标准。
---
### **10. 《技术与现代性:中国道路的哲学追问》**
**作者**:刘永谋
**关键词**:技术现代性、中国模式、技术治理
**推荐理由**:结合中国技术实践,批判西方技术霸权,探索技术发展的“第三条道路”。
---
### **延伸推荐(聚焦前沿领域)**
- **《赛博空间的哲学探索》**(曾国屏):国内最早系统研究虚拟技术的哲学著作。
- **《人工智能与价值审度》**(王前):从中国哲学视角解析AI伦理,提出“道器之辨”新解。
- **《技术伦理年鉴》**(系列丛书,中国社会科学院):追踪年度技术伦理热点与政策动态。
---
### **阅读提示**
- **思想溯源**:从陈昌曙、吴国盛的著作入手,把握国内技术哲学的理论根基。
- **现实关怀**:段伟文、刘永谋的著作聚焦数字时代的技术治理挑战。
- **中西对话**:通过韩琦、李约瑟(《中国科学技术史》)理解本土技术传统的全球意义。
这些著作既呈现了国内技术哲学从引进消化到自主创新的学术脉络,也体现了中国学者对技术文明独特路径的深刻思考。
3.豆包的回答
以下是十本国内技术哲学的经典著作推荐:
1. 《技术哲学引论》:陈昌曙著,国内第一部以“技术哲学”为书名的专著。
2. 《技术哲学概论》:卡尔·米切姆著,殷登祥、曹南燕译,系统介绍了技术哲学的基本理论。
3. 《科学技术哲学导论》:刘大椿著,全面阐述了科学技术哲学的基本框架。
4. 《“道”“技”之间——中国文化背景的技术哲学》:王前著,从中国文化背景出发探讨技术哲学问题。
5. 《技术哲学导论》:拉普著,刘武、康荣平、吴明泰译,介绍了西方技术哲学的研究成果。
6. 《技术哲学讲演录》:吴国盛著,通过讲演形式深入浅出地探讨技术哲学问题。
7. 《技术与社会》:陈昌曙著,探讨技术与社会之间的相互作用关系。
8. 《技术文化论》:张明国著,从技术文化的角度解析技术问题。
9. 《技术与技术哲学》:邹珊刚主编,汇集了国内技术哲学领域的研究成果。
10. 《技术哲学新论》:陈凡著,对技术哲学的新问题、新观点进行深入探讨。
这些著作涵盖了技术哲学的多个方面,从基本理论到实践应用,从中国文化背景到西方研究成果,都是国内技术哲学领域的经典之作。
4.文心一言的回答
以下是为您推荐的十本国内技术哲学著作:
1.《技术哲学引论》
作者:陈昌曙
出版社:科学出版社
出版年份:1999年
简介:本书是国内第一部以“技术哲学”为书名的专著,标志着中国技术哲学研究的正式开启。书中系统地探讨了技术哲学的对象、历史、基本问题,以及技术的基本特点和技术与社会的相互关系。
2.《技术哲学概论》
作者:卡尔·米切姆(著),殷登祥、曹南燕(译)
出版社:天津科技出版社
出版年份:1999年
简介:本书由国际知名的技术哲学家卡尔·米切姆撰写,是国内翻译介绍西方技术哲学专著的重要成果。书中全面系统地介绍了技术哲学的基本概念、研究方法和主要理论观点。
3.《技术哲学导论》
作者:F.拉普(著),刘武、康荣平、吴明泰(译)
出版社:辽宁科学技术出版社
出版年份:1986年
简介:本书是国内最早翻译出版的技术哲学专著之一,对技术哲学的学科性质、研究对象、历史发展等进行了详细的阐述,为国内学者了解和研究技术哲学提供了重要的参考资料。
4.《科学技术哲学导论》
作者:刘大椿
出版社:中国人民大学出版社
出版年份:2005年(第二版)
简介:本书系统介绍了科学技术哲学的基本概念、研究方法和主要理论观点,涵盖了科学哲学、技术哲学、科学技术与社会等多个方面,是国内科学技术哲学领域的经典教材。
5.《陈昌曙技术哲学文集》
作者:陈昌曙
出版社:科学出版社
出版年份:2002年
简介:本书收录了陈昌曙教授在技术哲学领域的主要研究成果,包括论文、讲演稿等,全面展示了他在技术哲学方面的学术思想和贡献。
6.《社会技术哲学》
作者:田鹏颖
出版社:人民出版社
出版年份:2005年
简介:本书是国内第一部系统研究社会技术哲学的专著,对社会技术的本质、特点、作用以及社会技术哲学的研究对象、方法等问题进行了深入的探讨。
7.《社会技术与社会工程论》
作者:田鹏颖
出版社:中国社会科学出版社
出版年份:2011年
简介:本书进一步拓展了社会技术哲学的研究领域,将社会技术与社会工程相结合,探讨了社会工程的基本原理、方法以及社会技术在社会工程中的应用。
8.《审度:马克思科学技术观与当代科学技术论研究》
作者:刘大椿
出版社:中国人民大学出版社
出版年份:未提供
简介:本书从马克思科学技术观的角度出发,对当代科学技术论进行了深入的研究和探讨,为理解马克思主义技术哲学提供了重要的视角。
9.《马克思技术哲学纲要》
作者:乔瑞金
出版社:未提供
出版年份:未提供
简介:本书系统地梳理了马克思技术哲学的基本思想和理论框架,为马克思主义技术哲学的研究提供了重要的参考。
10.《“道”“技”之间——中国文化背景的技术哲学》
作者:王前
出版社:未提供
出版年份:2009年
简介:本书从中国文化的角度出发,探讨了技术哲学的相关问题,提出了“道技关系”的范畴,为理解中国文化背景下的技术哲学提供了独特的视角。
这些著作涵盖了技术哲学的基础理论、历史发展、研究方法、应用领域等多个方面,既有对西方技术哲学的引进和介绍,也有对中国技术哲学的研究和探索,是国内技术哲学领域的重要成果。
5.测评结论
——DS——
从形式上看,DS给出的回答读起来感觉相对丰富。它包含推理提示、推荐文本介绍、延伸推荐、阅读提示等。
推荐的十本书看得出来并不是简单地以“技术哲学”“技术”为题目进行检索,出现有《信息文明的伦理基础》《可接受的科学:当代科学基础的反思》《赛博空间的哲学探索》等不以“技术哲学”“技术”为提名的作品。
但是,《中国科学技术的西传及其影响》《可接受的科学:当代科学基础的反思》并非技术哲学著作,而是科技史、科学哲学的作品。
更严重的问题是“幻觉”错误不少。比如,《可接受的科学:当代科学基础的反思》的作者是段伟文而不是刘大椿,刘永谋并没有一本名为《技术与现代性:中国道路的哲学追问》的书。比如《信息文明的伦理基础》的“推荐理由”很混乱,“可接受的科技”是《可接受的科学:当代科学基础的反思》的观点。
——豆包——
豆包回答简单明了,响应很快。除了《荷兰学派技术哲学研究:设计、理论与价值》这本书网上没有找到,其他书都是有的。但是,这十本书主要是东北大学或“东北学派”的作品,尤其陈昌曙就独占六本。严重怀疑是从不多的几个东北大学技术哲学发展史为主题的帖子上归纳的。总体上资料显得很陈旧。
——文心一言——
文心一言的推荐在准确性上没有问题,每本书给出了出版社、出版年份,还包含了国内出版社的两本译著。不过代表性上仍然存在问题,陈昌曙、刘大椿、田鹏颖均有两本。总体上书单缺乏前沿性。
——总体评价——
大模型用于学术资料检索功能差强人意,不可以作为学术研究的唯一依凭,而是作为某种初步的提示。就AI幻觉问题而已,文心一言表现最好,DS幻觉明显。