测试过的模型

Grok, Geimini, DeepSeek, ChatGPT,……料想其它也都不行

  • 都能够从图片正确识别题目和要求;
  • 都给出小学四五年级水平的错误解答。
  • 其它发现:
    不过仅限于我所用的聊天方法,我看其他人用Grok、ChatGPT 4o都能够得到一般而正确的答案。——所以,免费的大语言模型跟付费的,似乎差距非常大?x上有人直接@ Grok,是可以直接给出正确答案的。但通过聊天方式,我没有得到正确答案。

原题如下

在下面的长方形中画一个最大的半圆,所得半圆的周长是多少厘米?

在这里插入图片描述

长方形的尺寸是:
长:8厘米
宽:6厘米

其它可能的提示

在这里插入图片描述
最优解对应于:
在这里插入图片描述

在这里插入图片描述

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐