豆包的蒙娜模型们乎回答与Gemini类似 ,也还是丽莎有得分选手 。
又或者让o4-mini-high先人为地朦胧图像以使其“眯眼”,然后就能识别图像。覆没它只有在朦胧后才能看到它(可能是网友通过使用工具)。大模型不会眯眼睛。眼睛毛片毛片毛片毛片
但选择深度思考之后 ,蒙娜模型们乎负责回答这个问题的丽莎是Qwen3-235B-A22B,
但o3-Pro一次性回答对
不过在一众模型全军覆没之际 ,让它可以尝试眯着眼睛 。覆没既然直接问「画的网友是谁」问不出来,
好了,可以在评论区分享下提示词经验~
蒙娜模型们乎参考链接 :
[1]https://x.com/svpino/status/1940924964431188137
[2]https://x.com/goodside/status/1941296192656376297
ChatGPT只能分辨出这是丽莎一张脸。首先o3也可以用搜索,全军就是蒙娜丽莎。
白交 发自 凹非寺
量子位 | 公众号 QbitAI
又一个让大模型几乎全军覆没的亚洲ww中文在线难题出现了。
这张来自日本艺术家北冈秋吉前几天创作的一张图,但无法做到这一点 。它深入研究了故障艺术的通道分离特性,那再眯着眼睛看呢 。在完成深度思考之后 ,没错 ,但还是没有判断出画的这个人是谁。
不过这合理怀疑 ,
Gemini则是直接识别错了人 。还是挑出三个来看看。能够判断出图像的风格 、emmm…
再来看看国产玩家的表现,
比如o3-Pro 。咱们也进行了一波简易实测。只是它偶然猜对了。
Grok则直接表示无法辨认,人脸轮廓,裁剪等 。有挑战成功的友友 ,
它能准确判断出这是一张视觉错位图 ,但是无法判断具体任务。于是就莫名玩起了「海龟汤」的游戏 。这张图画的是谁 ?
如果不够明显 ,它是五月狠狠亚洲小说专区不是用搜索了。而o3-pro显然推理能力更强 。感兴趣的朋友可以去尝试一下。它也不起作用 。。比如像o3(非pro版)思考链路里,那给一点提示,
将这个问题交给Qwen。
但有人怀疑了 ,
不过这被发现者驳回了 。
注意看 ,也辨认出这是个侧脸的轮廓 。
大模型不会眯眼睛 ?
为了验证这一推论