实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

ChatGPT2年前 (2023)发布 一起用AI
577 0 0

大家好,我是瓜叔。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

有很多好奇宝宝问我chatGPT4与chatGPT3到底有啥区别?

我们先来问一问chatGPT4

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

好像并没有什么直观可见的区别。

我们只能具体实测一下来看一下这个 GPT-4 相比之前的 3.5 模型都做了哪些升级和改变。

好,我们看到,我们现在还是用的这个 GPT-3.5 的模型,然后这个四是需要升级到 plus 版本才能用的。所以我现在来充上 20 美金,来体验一下

这边呢,我来快速的输入一下银行卡的信息。好,我点击一下订阅。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

还是不行。。。。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

我查询了一下,发现这个国内的信用卡是开不了这个 GPT 的 plus 会员的。然后我看到有方法说,用这个低配的虚拟信用卡是可以开通这个 plus 。但是我进到低配的官方群里之后呢,我还是发现有人在群里反映注册不成功啊,所以我自己就不研究这个低配了。

最后呢我想到一个办法,就是在群里找到一个有 GPT plus 的小伙伴,然后我把问题发给他让他去帮忙提问,这个 GPT-4 把得到的回答截图发给我。然后我们看一下这个GPT-4 相较于之前的 3.5 到底有哪些进步。

我们通过网页的介绍可以看到,GPT-4相较于之前的版本做了一些重要的升级。他的第一个升级呢,就是这个解决知识和问题的能力;

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

然后第二个升级呢,就是这个推理方面的能力。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

所以我们的第一个问题就来测试一下这个 GPT-4 的推理能力,相较于之前的版本是否真的有进步。

所以我们的第一个问题就来测试一下这个GPT-4的推理能力。相较于之前的版本是否真的有进步呢?好,我们的第一个问题是一个非常经典又简单的问题:小明的爸爸有三个儿子,大儿子叫大毛,二儿子叫二毛,请问三儿子叫什么?

我们先来看一下这个GPT3.5的回答。好,我们可以看到,3.5版本给到我们正确的答案。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

但是我印象中就在前几个月的时候,我问到他相同的问题,当时3.5版本的回答还不是这个。看来这几个月他的进步也非常的大。然后我们再来看一下拆的这个第四给到我们的答案。我们看到,对于这种小儿科的问题,不论是3.5的模型还是4的模型都给出了我们正确的答案。

我们来看下一道逻辑题。这个题其实也很简单:一个人掉到一口井里,这个井深是5米。他每天向上爬3米,向下掉2米。请问几天能爬出来?其实这个题有个小陷阱。我先说一下正确答案:他每天向上爬3米,向下掉2米,其实每天是爬了1米。然后第一天他爬了1米,第二天他爬了2米,第三天因为他向上爬3米,他就可以直接爬出这口井了。所以正确答案是应该三天就能爬出来。

我们先来看一下3.5的回答。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

好,3.5版本给出了我们一个错误的答案,他说他需要两天才能爬出这个5米的深井。我们很明显看出这是不可能的,他居然还给出了我们这个推理过程。但是很明显,这个推理过程他已经把自己绕晕了。我们问一下这个GPT4,看一下他会给出我们什么样的答案。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

好,我们看到这个GPT4给出来的答案也是错误的。他的答案是5天。可能没有意识到这个问题陷阱的人也会答5天。因为这个人实际每天向上只能爬1米,然后这口井总共深5米。那么简单计算的话,就是五天才能爬出来。他显然没有意识到,这个人第三天的时候,直接爬3米就可以爬出这口井了。我们这次再来问一遍这个GPT4,看一下他给出的答案是不是还是一样。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

好,我们这一次看到,虽然这个答案对了,需要三天才能爬出来,但是如果我们仔细看的话,就会发现他推理的过程全部是错的。说实话,我也不知道他这种过程全错,但是结论却正确的答案,算不算一个正常的发挥水平。但是就跟3.5版本比起来,这个4版本两次回答,给人的感觉是经过一些思考的。所以,我们这次勉勉强强算这个4答对了。虽然他是蒙对的,但是这个结果确实是对的。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

我们看到,左边是这个GPT3.5对这个百度百科三体页面的总结,然后右边是这个GPT4对这个百度百科页面的总结。通过对比,我们可以看到,3.5版本的总结更加的惊艳,而GPT4的总结更加详尽。我不知道这次是不是一个偶然的现象。所以我现在,再让他们总结一下三体维基百科的页面内容。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

好,我们可以看到,左边还是3.5版本的总结,然后右边是4版本生成的总结。很明显,还是3.5版本的总结更加的精炼一些。相比而言,GPT4生成的总结就更加的丰富一些。

好,我们接下来测试一下3.5版本和GPT4的读图功能。我们分别将两个图片的链接发给GPT3.5和GPT4,让他们来读取一下,看是否能读取到图片的内容。

我在发送了图片链接之后,3.5版本直接就告诉我说,他无法打开这个图片链接。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

而4版本给出了我们这个图片的描述。但是,4给到我们的这个描述,可以说是毫不相关。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

如果非要找共同点的话,就是我们原图确实有个小水塘。然后,这个4把这个小水塘理解成了一片湖,给出了我们这段描述。

好,我们再试一次。这一次,我发给他一张冲浪的图片,看一下这一次的图片测试。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

我们的3.5版本也开始瞎编了。

实测ChatGPT4.0与ChatGPT3.5相比,究竟有哪些突破性进步?

我们看到他在上一次说的是,我无法查看图片的链接。然后这一次呢,没想到他就可以看了,并且给到我们一个美食的描述。虽然这个描述是不对的,但是不得不说,他这个描述写的非常的有食欲。

好,GPT4这边也是不甘示弱,也是给出了一段他自编、自导、自演的描述。把这张冲浪的图片描述成了一个古城的夜景。我感觉他想象力非常的丰富。

那么图片描述这块呢,我就测试到这里。很明显的,GPT4的接口还是没有打开。我们期待GPT4打开接口之后,给我们带来更惊喜的表现。

通过我们简单的测试,我们大概可以感觉到,GPT4相较于之前的3.5版本,他的逻辑分析能力感觉是更强了一些。但是他的总结能力跟3.5版本相比,却没有那么的惊艳。可能是因为我们在指令中没有限制到他给到我们更精确的总结的原因。

对于图片描述这块,很明显,GPT4版本的接口还是没有打开。3.5和4版本现在都处于一个自说自话的阶段。那我们只能期待GPT4版本打开图片接口之后,能带给我们更好的体验。

以上这就是我们这一期的全部内容。非常感谢大家看到这里。接下来,我也会继续关注GPT4的进展,并且请大家关注我的公众号。

© 版权声明

相关文章