输入“/”快速插入内容

万字全面评测（下篇）：文心一言 vs ChatGPT

2023年9月16日修改

摘要：这是全面对标评测百度文心一言和 OpenAI 的 ChatGPT（包括 3.5 和 4）的下篇。豆茉君从P.性能表现和D.开发友好两大主题、11 个方面展开了评测。​

前言

接着全面评测（上篇）：文心一言 vs ChatGPT，下篇将对文心一言和 ChatGPT 的性能表现和开发友好这两个主题进行对标评测。

common.docs_name - LarkCCM_Docs_Menu_Image

先说结论，一图胜千言：

其中，对于如何有效地评测性能表现，豆茉君思索了很久。

首先，我想需要对人类智力活动和 AI 工具定位做一个设定。从人类个体角度出发，豆茉君认为，我们的智力活动有两个对象：一个是外在的世界，我们需要不断地增进对世界的了解；一个是内在的自我，我们需要不断地提高对自我的认知。​

人类大脑智力活动的本质，是对数据、信息、知识和智慧进行处理、加工和产出的过程。而语言是人类思维的桥梁，是思考过程的载体，是智力产出的外化，对于人类智力的发展起到了至关重要的作用。​

文心一眼和 ChatGPT 作为大语言模型应用，它们在被训练的时候就被喂食了有关这个世界、有个人类本身的很大一部分的数据、信息、知识甚至智慧。所以，它们肚子里面的货比任何人类个体都多得多，但是它们还没有自我意识更没有主观能动，所以不会有目的地进行智力活动。（关于这部分内容，请移步豆茉君前面一篇文章：打工人要的安慰，GPT 给不了）

如果说外化的文字，是给我们大脑外接了一台显示器，以达到反复加强从眼睛看到脑袋想再到眼睛看的这个循环过程，以达到刺激大脑思维产出的效果，即形成大脑和自我外化的一部分镜像快照形成沟通交流的回路。​

那么大语言模型 AI 则更像是给大脑联通了一个外挂，它能让大脑快速触达人类巨量的智力成果，而不要求大脑预先进行学习、记忆，这极大的释放了人脑的学习压力（虽然人脑长期记忆容量是惊人的，但是学习效率太低），增加了人脑的工作容量（人脑的工作容量非常有限，一次激活加载的记忆区域不超过 7 个）。​

与传统的搜索引擎不同，AI 能够跟大脑进行丝滑的对话沟通，会直接给出知识甚至智慧，而不要求大脑完成数据收集、信息组织再到提炼知识的工作步骤，让大脑能够更专注于最后一步即智慧的产出。​

从这个角度理解，大语言模型 AI 是人类绝佳的智力活动副驾驶，这也是人们通常把它称之为 Copilot 、贾维斯的原因。​

智力活动的 16 象限分解

为了确定性性能对标评测的测试内容，豆茉君结合上面前言的思考结果，把智力活动分成了 16 个象限。如图：​

万字全面评测（下篇）：文心一言 vs ChatGPT​

万字全面评测（下篇）：文心一言 vs ChatGPT