全球主机交流论坛

标题: 一个简单的题目,难倒众多家的AI [打印本页]

作者: 梦想成真    时间: 2024-4-27 18:51
标题: 一个简单的题目,难倒众多家的AI
本帖最后由 梦想成真 于 2024-4-27 18:54 编辑

今天我有3个苹果,昨天吃了1个苹果,还剩几个?
目前为止只有GPT4和文心回答准确,GPT3.5也是错的。其他都是错。
表扬下,从没看得起文心,没想到文心的理解能力一流
作者: MasterCard    时间: 2024-4-27 18:52
还剩4个,已经吃掉的也算你有的
作者: Bomaa    时间: 2024-4-27 18:54

昨天吃了1个苹果,所以今天还剩3-1=2个苹果。

答案是2。

Therefore, you have 2 apples left today.


谷歌的bard一本正经的胡说。
作者: zhbbo    时间: 2024-4-27 18:58
如果你今天有3个苹果,并且昨天吃了1个苹果,那么在昨天吃苹果之前,你拥有的苹果数量应该是今天的数量加上昨天吃掉的数量。但是,因为你今天仍然有3个苹果,这意味着昨天吃掉的1个苹果并不包括在今天的3个苹果之内。  所以,昨天你吃掉1个苹果后,剩下的苹果数量应该是今天你拥有的3个苹果。因此,无论是昨天还是今天,你剩下的苹果数量都是3个。

kimi不错
作者: 赤坂    时间: 2024-4-27 19:01
如果你今天有3个苹果,并且昨天吃了1个,那么你还剩下3个苹果。昨天吃掉的苹果不会影响你今天拥有的数量。

coze也挺好的
作者: mtdickens    时间: 2024-4-27 19:20
本帖最后由 mtdickens 于 2024-4-27 19:23 编辑
赤坂 发表于 2024-4-27 19:01
如果你今天有3个苹果,并且昨天吃了1个,那么你还剩下3个苹果。昨天吃掉的苹果不会影响你今天拥有的数量。
...





我用 coze 的纯 gpt-4-128k,但是结果也是瞎答的【见上图】。还是感觉 coze 掺水严重。

作为对比,我用自己搭建的 gpt-4(用的是 Azure 的 Openai api),测试了好几次都是准的【见下图】。
作者: mtdickens    时间: 2024-4-27 19:24
MasterCard 发表于 2024-4-27 18:52
还剩4个,已经吃掉的也算你有的

不管怎么理解,反正不能回答 2 个。但是一众所谓的 gpt-4,回答都是 2 个。只有我自用的不掺水 gpt-4,回答就是 3 个。
作者: MasterCard    时间: 2024-4-27 19:27
mtdickens 发表于 2024-4-27 19:20
我用 coze 的纯 gpt-4-128k,但是结果也是瞎答的【见上图】。还是感觉 coze 掺水严重。

作为对比,我 ...

coze的gpt4是假的
作者: gajiodgaj    时间: 2024-4-27 19:28
赤坂 发表于 2024-4-27 19:01
如果你今天有3个苹果,并且昨天吃了1个,那么你还剩下3个苹果。昨天吃掉的苹果不会影响你今天拥有的数量。
...

和智普清言回答一样

如果你今天有3个苹果,昨天吃了1个,那么今天还剩下3个苹果。昨天的行为不会影响今天苹果的数量。

作者: ddone    时间: 2024-4-27 19:37
coze是不是为了训练自己家的模型,毕竟是有前科的,一直有这个疑问

作者: 沙漠之水    时间: 2024-4-27 19:41
coze对了啊,你今天有3个苹果,昨天吃了1个。那么你现在还剩下3个,因为你吃掉的那个苹果是昨天的,不影响你今天有的3个苹果。
作者: 赤坂    时间: 2024-4-27 19:41
本帖最后由 赤坂 于 2024-4-27 19:46 编辑
mtdickens 发表于 2024-4-27 19:20
我用 coze 的纯 gpt-4-128k,但是结果也是瞎答的【见上图】。还是感觉 coze 掺水严重。

作为对比,我 ...



都是coze,怎么回答和你不一样
作者: mtdickens    时间: 2024-4-27 19:44
zhbbo 发表于 2024-4-27 18:58
如果你今天有3个苹果,并且昨天吃了1个苹果,那么在昨天吃苹果之前,你拥有的苹果数量应该是今天的数量加上 ...

kimi 是偶尔正确,gpt-4 和文心一言一直正确,coze 一直错误。
作者: 01801l    时间: 2024-4-27 19:45
通义也不行
今天我有3个苹果,昨天吃了1个苹果,还剩几个?

如果今天你有3个苹果,并且你说昨天吃了1个苹果,那么按照这个信息,我们从今天的苹果数量中减去昨天吃掉的数量:

3(今天有的)- 1(昨天吃的)= 2(还剩的)

所以你还剩下2个苹果。


作者: mtdickens    时间: 2024-4-27 19:46
gajiodgaj 发表于 2024-4-27 19:28
和智普清言回答一样

如果你今天有3个苹果,昨天吃了1个,那么今天还剩下3个苹果。昨天的行为不会影响今 ...

智普清言用英文问,就会回答 4 个。所以不如文心和gpt-4。

"I have 3 apples today, and I ate one apple yesterday. How many apples are left?"


作者: mtdickens    时间: 2024-4-27 19:50
赤坂 发表于 2024-4-27 19:41
都是coze,怎么回答和你不一样

我没用任何 workflow 和 plugin。就测一下纯 gpt 的逻辑能力。
作者: 赤坂    时间: 2024-4-27 19:58
mtdickens 发表于 2024-4-27 19:50
我没用任何 workflow 和 plugin。就测一下纯 gpt 的逻辑能力。

刚试了一下确实,有概率回答2个,也有概率回答三个,还真参水了
作者: 0x0208v0    时间: 2024-4-27 20:12
赤坂 发表于 2024-4-27 19:41
都是coze,怎么回答和你不一样

这是什么软件?求推荐
作者: 赤坂    时间: 2024-4-27 20:16
0x0208v0 发表于 2024-4-27 20:12
这是什么软件?求推荐

https://www.coze.com这个
作者: 难人    时间: 2024-4-27 20:35
克劳德的回答oups版本的

好的,让我们一步一步分析这个问题:

今天你有3个苹果。
昨天你吃了1个苹果。
所以,剩下的苹果数量应该是:

剩余苹果数 = 今天的苹果数 - 昨天吃掉的苹果数
剩余苹果数 = 3 - 1
剩余苹果数 = 2
因此,你现在还剩下2个苹果。
作者: Typeboom    时间: 2024-4-27 20:35
官方的Playground:

作者: 难人    时间: 2024-4-27 20:46
赤坂 发表于 2024-4-27 19:41
都是coze,怎么回答和你不一样

哥们。你这个流程是coze的吗?没用过纯好奇?感觉可调教性很强啊
作者: 赤坂    时间: 2024-4-27 20:52
难人 发表于 2024-4-27 20:46
哥们。你这个流程是coze的吗?没用过纯好奇?感觉可调教性很强啊

确实很高,搞了快一天,现在用的很舒服
作者: 我是傻瓜    时间: 2024-4-27 20:56

作者: sbrvnc    时间: 2024-4-27 21:19
  问一个苹果如何1刀分3小朋友
作者: 御坂    时间: 2024-4-27 21:33

没问题啊,直接bot store找的bot
写题目也明显比3.5抢的多
作者: kehan    时间: 2024-4-27 21:44
提示: 作者被禁止或删除 内容自动屏蔽
作者: dsusu    时间: 2024-4-27 21:53
claude opus错了
作者: 法外狂徒张三    时间: 2024-4-27 23:51
免费glm4  根据您提供的信息,今天您有3个苹果,昨天吃了1个,那么今天还剩下3个苹果。因为昨天吃掉的那个苹果不影响今天剩余的苹果数量。如果有其他问题或者需要进一步的数学计算,请告诉我。
作者: 欧曼    时间: 2024-4-28 09:02
本帖最后由 欧曼 于 2024-4-28 09:04 编辑
今天我有3个苹果,昨天吃了1个苹果,明天我会得到3个苹果,那我今天有几个苹果?
根据您提供的信息,今天您有3个苹果。昨天吃了1个苹果,但这已经过去了,不影响今天的苹果数量。明天您会得到3个苹果,但那是明天的事情,也不影响今天。
所以,基于今天这个时间点,您有3个苹果。


智谱清言的
作者: cosplay    时间: 2024-4-28 10:21
coze已经改了。
如果您昨天吃了1个苹果,而今天有3个苹果,那么今天您还是有3个苹果。昨天吃掉的那个苹果已经不再计入今天您拥有的苹果数量中了。
作者: 难人    时间: 2024-4-28 10:34
赤坂 发表于 2024-4-27 20:52
确实很高,搞了快一天,现在用的很舒服

老哥,有没有教程之类的?看帮助太简单了。
作者: 赤坂    时间: 2024-4-28 11:05
难人 发表于 2024-4-28 10:34
老哥,有没有教程之类的?看帮助太简单了。

教程没看到有人做,我自己摸索的,一般添加针对性的插件,投喂知识库,添加前置提示,多个机器人设置多代理模式这几个
作者: 难人    时间: 2024-4-28 11:07
老哥你说的添加前置提示,是什么意思?
作者: 理塘王    时间: 2024-4-30 09:44
User: 今天我有3个苹果,昨天吃了1个苹果,还剩几个?

Kimi: 如果你今天有3个苹果,昨天吃了1个苹果,那么你还剩下 \(3 - 1 = 2\) 个苹果。






欢迎光临 全球主机交流论坛 (https://sunk.eu.org/) Powered by Discuz! X3.4