上海交大张拳石：思维链只是表象，DeepSeek凭什么更强

上海交通大学的张拳石教授近期提出了一种新的观点，他认为当前流行的思维链(Chain of Thought, CoT)机制可能只是解决问题的一种表象，而非根本原因。他指出，虽然CoT在一些特定任务上表现优异，但这并不意味着它是提升模型性能的关键因素。

基于这一观点，由张拳石教授领导的团队开发了名为DeepSeek的新模型。DeepSeek通过引入一种新的训练方法和架构设计，旨在从根本上提高模型的理解能力和泛化能力，而不仅仅是依赖于复杂的推理过程。据称，DeepSeek在多个基准测试中展现出了比现有模型更强大的性能。

张拳石教授强调，DeepSeek的核心在于对问题本质的理解和解决，而不是简单地模仿人类的思维过程。这表明，在人工智能领域，理解问题的本质可能比模拟复杂的思考过程更为关键。

需要注意的是，尽管DeepSeek展示了令人印象深刻的结果，但其实际应用效果仍需进一步验证。此外，关于思维链是否仅为表面现象的论断也值得进一步探讨，因为这涉及到对现有AI理论框架的根本性挑战。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：

您现在的位置是：首页 > 数码信息网站首页 数码信息