输入“/”快速插入内容

万字全面评测(下篇):文心一言 vs ChatGPT

2023年9月16日修改
摘要:这是全面对标评测百度文心一言和 OpenAI 的 ChatGPT(包括 3.5 和 4)的下篇。豆茉君从P.性能表现D.开发友好两大主题、11 个方面展开了评测。
前言
接着全面评测(上篇):文心一言 vs ChatGPT,下篇将对文心一言和 ChatGPT 的性能表现开发友好这两个主题进行对标评测。
先说结论,一图胜千言:
其中,对于如何有效地评测性能表现,豆茉君思索了很久。
首先,我想需要对人类智力活动和 AI 工具定位做一个设定。从人类个体角度出发,豆茉君认为,我们的智力活动有两个对象:一个是外在的世界,我们需要不断地增进对世界的了解;一个是内在的自我,我们需要不断地提高对自我的认知。
人类大脑智力活动的本质,是对数据、信息、知识和智慧进行处理、加工和产出的过程。而语言是人类思维的桥梁,是思考过程的载体,是智力产出的外化,对于人类智力的发展起到了至关重要的作用。
文心一眼和 ChatGPT 作为大语言模型应用,它们在被训练的时候就被喂食了有关这个世界、有个人类本身的很大一部分的数据、信息、知识甚至智慧。所以,它们肚子里面的货比任何人类个体都多得多,但是它们还没有自我意识更没有主观能动,所以不会有目的地进行智力活动。(关于这部分内容,请移步豆茉君前面一篇文章:打工人要的安慰,GPT 给不了
如果说外化的文字,是给我们大脑外接了一台显示器,以达到反复加强从眼睛看到脑袋想再到眼睛看的这个循环过程,以达到刺激大脑思维产出的效果,即形成大脑和自我外化的一部分镜像快照形成沟通交流的回路。
那么大语言模型 AI 则更像是给大脑联通了一个外挂,它能让大脑快速触达人类巨量的智力成果,而不要求大脑预先进行学习、记忆,这极大的释放了人脑的学习压力(虽然人脑长期记忆容量是惊人的,但是学习效率太低),增加了人脑的工作容量(人脑的工作容量非常有限,一次激活加载的记忆区域不超过 7 个)。
与传统的搜索引擎不同,AI 能够跟大脑进行丝滑的对话沟通,会直接给出知识甚至智慧,而不要求大脑完成数据收集、信息组织再到提炼知识的工作步骤,让大脑能够更专注于最后一步即智慧的产出。
从这个角度理解,大语言模型 AI 是人类绝佳的智力活动副驾驶,这也是人们通常把它称之为 Copilot 、贾维斯的原因。
智力活动的 16 象限分解
为了确定性性能对标评测的测试内容,豆茉君结合上面前言的思考结果,把智力活动分成了 16 个象限。如图: