您现在的位置是:首页 > 数码信息网站首页数码信息
上海交大张拳石:思维链只是表象,DeepSeek凭什么更强
- 编辑:齐茗鸣
- 2025-03-10 10:05:16
- 来源:网易
上海交通大学的张拳石教授近期提出了一种新的观点,他认为当前流行的思维链(Chain of Thought, CoT)机制可能只是解决问题的一种表象,而非根本原因。他指出,虽然CoT在一些特定任务上表现优异,但这并不意味着它是提升模型性能的关键因素。
基于这一观点,由张拳石教授领导的团队开发了名为DeepSeek的新模型。DeepSeek通过引入一种新的训练方法和架构设计,旨在从根本上提高模型的理解能力和泛化能力,而不仅仅是依赖于复杂的推理过程。据称,DeepSeek在多个基准测试中展现出了比现有模型更强大的性能。
张拳石教授强调,DeepSeek的核心在于对问题本质的理解和解决,而不是简单地模仿人类的思维过程。这表明,在人工智能领域,理解问题的本质可能比模拟复杂的思考过程更为关键。
需要注意的是,尽管DeepSeek展示了令人印象深刻的结果,但其实际应用效果仍需进一步验证。此外,关于思维链是否仅为表面现象的论断也值得进一步探讨,因为这涉及到对现有AI理论框架的根本性挑战。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
相关文章
最新文章
- · 上海交大张拳石:思维链只是表象,DeepSeek凭什么更强
- · 凭“弹幕专利”告倒成人网站后,Niconico的矛头会指向B站吗?
- · DeepSeek来了,金融人该「爽」还是「慌」?
- · AI已经进化到能养猪了:可自动判断猪的咳嗽声
- · 58岁考王继续梁实今年将第29次高考 弃考地理改生物
- · QQ浏览器推出AI问答功能“元宝快答”:基于混元快思考模型Turbo S
- · 具身智能的冰与火,巨头与创客的角力场
- · 想做企业级智能体的「AutoAgents」,获数千万元天使轮融资 | 涌现好项目
- · 到底是哪个冤种在排队吃网红餐厅啊
- · 你认同吗AI回答存多少钱才可以潇洒退休:一线城市至少300万起