百度吴甜：新版文心一言能力已超ChatGPT 3.5，未来只会有少量大模型

　　近日，IDC发布AI大模型技术能力评估报告显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一。在面向新浪科技等媒体沟通中，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出，新版本文心一言3.5已超越ChatGPT 3.5，未来国内将只会有少量大模型。

　　“在OpenAI发布ChatGPT之前，真正在做大模型的企业或机构寥寥可数，过去短短几个月内，大量新的模型出现，这是一个阶段性的现象，在演变的过程当中，其实各个企业、机构会逐渐找到自己的定位，下一步逐渐会走向自己细分的方向。”吴甜表示。

　　在吴甜看来，大模型的终局将会集中在少量几个大模型上。因为，真正从底层做起来的大模型成本非常高，并不是想做就能做起来的，它需要有多年的积累，需要非常综合的能力，也需要有绝对的坚定信心，一直投入下去才能够做好。所以，从这一点上可以看到，将来只能有少数的大模型。

　　吴甜指出，大模型产业化面临着挺大的挑战，总结起来有三方面：第一，大模型的体积确实很大，模型大带来的训练难度高，成本高。第二，对于算力规模要求非常大，性能要求非常高。第三，数据规模也很大。我们今天为什么有这么多千亿参数规模，甚至也有万亿参数规模，它跟海量的数据上自定义强相关。数据的规模也非常大，收集、挖掘、建设、筛选这些数据，清洗这些数据本身也是非常大的大工程。

　　“其实完全不要存在大量的大模型，而对于应用者来说，也不需要每一个应用都来进行大模型的开发。”吴甜表示。在他看来，大模型的产业模式，可以类比芯片代工厂，现在芯片的型号、厂商非常多，但是代工厂只有几家而已，芯片代工厂价值非常大，但整个社会不需要有非常多的企业都来实现这个能力，只要少数几家芯片代工厂，对于有芯片生产需求公司来说，只要出生产方案，交给芯片代工厂生产，就可以得到想要的芯片。