您现在的位置是:首页 > 数码信息网站首页数码信息

上海交大张拳石:思维链只是表象,DeepSeek凭什么更强

  • 编辑:齐茗鸣
  • 2025-03-10 10:05:16
  • 来源:网易

上海交通大学的张拳石教授近期提出了一种新的观点,他认为当前流行的思维链(Chain of Thought, CoT)机制可能只是解决问题的一种表象,而非根本原因。他指出,虽然CoT在一些特定任务上表现优异,但这并不意味着它是提升模型性能的关键因素。

基于这一观点,由张拳石教授领导的团队开发了名为DeepSeek的新模型。DeepSeek通过引入一种新的训练方法和架构设计,旨在从根本上提高模型的理解能力和泛化能力,而不仅仅是依赖于复杂的推理过程。据称,DeepSeek在多个基准测试中展现出了比现有模型更强大的性能。

张拳石教授强调,DeepSeek的核心在于对问题本质的理解和解决,而不是简单地模仿人类的思维过程。这表明,在人工智能领域,理解问题的本质可能比模拟复杂的思考过程更为关键。

需要注意的是,尽管DeepSeek展示了令人印象深刻的结果,但其实际应用效果仍需进一步验证。此外,关于思维链是否仅为表面现象的论断也值得进一步探讨,因为这涉及到对现有AI理论框架的根本性挑战。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
Top