你可能是正版DeepSeek的受害者!
发布时间:
2025-10-10
DeepSeek为何是最强推理模型?
相信目前,大家或多或少都领略了DeepSeek的强悍。
DeepSeek-R1横空出世至今,一直稳坐“地表最强”推理模型的宝座。
然而,这样的光环下,可能很多人忽视了、或从未发现“最强推理模型”背后带来的致命缺陷。
那么,什么是推理模型?
其实,OpenAI o1和DeepSeek-R1都是推理模型,在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。
例如:DeepSeek-R1,GPT-4o在逻辑推理、数学推理和实时问题解决方面表现突出。
去年OpenAI o1 相当于引爆了一颗原子弹,但选择闭源。DeepSeek-R1在后阶段大规模使用强化学习技术, 在仅有极少数标注数据的情况下,在数学、代码、自然语言推理任务上,复现 OpenAI o1 能力(如下图)。他们通过开源并发布相对详细的介绍,给其他模型厂商提供了完整的复现方式。
这样的对比,高下立判。

回到开头,像DeepSeek R1这样的推理模型和一般语言模型,类似GPT-4o、DeepSeek-V3,有什么区别呢?
直白来说,推理模型的特点是:推理能力强、但是速度慢、消耗高

....
其适用的场景一般如下:
Meta Prompting(让推理模型生成或修改给一般语言模型用的提示词)路径规划
比如,我们传入:
描述应用状态的提示词
描述应用结构的应用截图
通过以上流程,让AI帮我们生成应用代码。

反之亦然,我们也可以让AI 根据应用代码,帮我们生成「描述应用的提示词」。

从左到右可以看作是「解压算法」,从右往左可以看作是「压缩算法」。
理论上,只要提示词精确度足够高,经过AI推理,就可以百分百生成符合描述、且充足完善的效果,看起来是不是非常完美?
然而,问题就在于此:基于AI Agent抽象的「应用压缩算法」也存在失真,也就是「生成的效果不理想」,有时候甚至「生成了看似合理的误导信息」
就像许多使用者发现的,DeepSeek R1也会在回答中,掺杂入许多错误、甚至纯属捏造的信息,同时,依托强大的逻辑推理能力,它还能为自己的“谎言”编制出一套完整、看起来非常合理的体系来自圆其说。

陕西自媒体“决明子”,一直对西安安定门那里的道路规划要绕一圈不解,看到DeepSeek火爆,决定一试,提问DeepSeek“西安的道路路线规划,从环城西路北段到环城西路南段为什么不直行,非得在安定门绕一圈?”

这时候,DeepSeek的表演开始了。
DeepSeeK先在解释中提出了一个“唐皇城交通静默区”的概念,表示根据《西安历史文化名城保护规划(2020-2035)》,安定门周边划定了一级静默区、二级静默区,本质是为了保护文物,防止过大的震动。它甚至还列出了具体的空间数据,距离增加多少、振动传递深度变化是多少。

乍一看,这解释太合理了!甚至连政策、数据都例举的明明白白。
可是一查,这份《西安历史文化名城保护规划(2020-2035)》文件中,压根就没有什么“静默区”。这个看似极为专业、有理有据的回答,居然是“编”的。
同时,若是直接指出它的错误,DeepSeek可能会首先非常有礼貌地道歉,认知自己的不足。
然后开始编造更加可信的内容。

我们可以把这个现象视作——AI幻觉
行业用这个词来形容AI“说假话”的现象,即输出的回答看似内容合理连贯,但“同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证”。
DeepSeek自己也明确承认了“技术局限性认知”:当前大模型内容生成的底层逻辑是基于概率的,确实存在生成信息可信度参差不齐的情况。

究其原因,AI的大脑源自互联网上所有信息,网上有什么内容,不论真假,只要“符合推理逻辑”,哪怕是内容完全架空的幻想小说,都可能变DeepSeeK的引用素材。
而目前,它只负责根据已有的内容进行推理,不对信息本身负责。
如果不对信息加以考证,全心依赖AI,可能会导致一些无法预料的后果。
而DeepSeek-R1的幻觉之所以更加严重,是因为其加强了“思维链”(CoT)和创造力。
而随着上文提到的「AI Agent」能力提高(背后是模型能力提高、工程化的完善),相信「应用压缩算法」的失真率会越来越低。
(所以,为什么非得在安定门绕一圈?)
同时,这也会导致越来越多「原本需要用代码表达的东西」被用提示词表达。
相当于将「引入组件的流程」从:开发者 -> 代码
变成了:开发者 -> 提示词 -> AI Agent -> 代码
这也可能代表着,前端开发的日常编码工作会越来越多被上述流程取代。这对从事相关行业的从业者来说,将是机遇,也是挑战。 关注我们,获得一手官方咨询 2025,VR联合会活动预告! 【邀请函】元宇宙寺庙:一场跨越时空的研讨 深圳市社会组织交流服务展示点项目是一项旨在展示深圳市社会组织在服务社会、推动经济发展、促进社会和谐等方面所做贡献的创新举措。 通过遴选党建引领突出、代表性强、公信力高、枢纽功能发挥明显和对深圳“双区”建设具有重大贡献的相关领域社会组织成为交流服务展示点,搭建全市社会组织交流展示与服务平台,多维度、多领域展示我市社会组织在不同领域对深圳经济社会发展和“双区”建设的突出贡献,涵盖了社会组织在党建引领、内部治理、诚信建设、人才建设、社区治理、科创信息、国际交流、乡村振兴、生态环保、文教卫体等多个领域的服务和成果。充分发挥展示点对同类别社会组织的示范引领作用,鼓励社会组织之间的交流与合作,推动社会组织高质量发展。 编 辑 | 陈泽砚 责 编 | 梁锦滢 校 对 | 谭斐 审 校 | 付孟姣 值班编委 | 梁锦滢







联合会会员部 18211567364 联合会商务部 18823495433 职业技能培训学校 13802218854 湾区AI算力中心 18688993899 VR实训基地 13657272435 前沿研究院 18188615433 低空经济专委会实训基地 18823495433