CNCC2023上,腾讯首席科学家、腾讯AI Lab及腾讯Robotics X实验室主任张正友发言指出,现在的大模型,只能预测下一个token,更像System 1,不管简单还是复杂问题,都是同样快速响应,但不能实现复杂的推理。
在张正友看来,“现在的大模型,学到的推理更多是‘套模板’的类推推理能力。为了实现复杂推理,需要另外的架构来实现System 2。”
张正友进一步介绍指出,基于文本的LLM不是完整的“世界模型”。在人与人的交互过程中,通过语言文字传递的信息量不到10%,更多地还包括表情、语气以及表述语言的方式等。
“多模态大模型是通往AGI的必经之路,文本的LLM需要其它模态来grounded。”张正友表示。在他看来,“通向AGI的道路虽然是曲折的,但前途也是光明的。”