69久久99精品久久久久婷婷,女同一区二区免费aⅴ,污视频在线看网站,av小说在线播放

AI遭遇靈魂拷問(wèn)！這道題所有模型集體翻車網(wǎng)友：我也不會(huì)啊

2025-05-19 21:00:09 分類：新聞統(tǒng)計(jì)中...

拷打AI的難度還在升級(jí)？這不，圖像推理又出現(xiàn)了新難題。

該問(wèn)題在Reddit上引起熱議：目前沒(méi)有任何AI能真正解決復(fù)雜推理問(wèn)題。

問(wèn)題定義其實(shí)非常簡(jiǎn)單——在下圖中還需要添加多少個(gè)小立方體能形成一個(gè)完整的大立方體？

針對(duì)這一難題，國(guó)內(nèi)外支持圖像輸入的大模型紛紛給出了不同的答案。

其中，o3給出的答案是45個(gè)，Gemini 2.5Pro給出的答案僅有10個(gè)。

而國(guó)內(nèi)大模型，如DeepSeek、Qwen3的答案分別為14和9。

出現(xiàn)這些不同答案的原因是什么呢？請(qǐng)往下看。

為什么會(huì)出現(xiàn)不同的答案

核心原因：大模型對(duì)組成的大立方體的規(guī)格理解不同。

o3將最終組成的大立方體的規(guī)格理解為5x5x5，但它對(duì)于缺失的小立方體的數(shù)目仍舊給出了錯(cuò)誤答案，用人類視覺(jué)來(lái)看，要形成5x5x5的大立方體需要125個(gè)小立方體，而圖中已經(jīng)給出了46個(gè)，所以答案應(yīng)該為79。

而AI的錯(cuò)誤源于它對(duì)圖片中小立方體的結(jié)構(gòu)和數(shù)目的分析錯(cuò)誤。

Gemini 2.5 Pro將最終組成的大立方體的規(guī)格理解為4x4x4。

而DeepSeek和Qwen都將最終的大立方體規(guī)格設(shè)定為了3x3x3。

對(duì)于最終要組成的大立方體的規(guī)模理解不同，各大模型自然而然就會(huì)給出不同的答案。

不過(guò)，結(jié)合提示多次嘗試，也有大模型能夠漸漸找準(zhǔn)方向。

網(wǎng)友針對(duì)這些錯(cuò)誤答案提供了一些解決辦法：

例如用o3進(jìn)行測(cè)試，在前兩次嘗試時(shí)給出一些小提示，雖然這樣也得到錯(cuò)誤答案，但第三次，即使沒(méi)有提示也得到了正確的結(jié)果。

網(wǎng)友認(rèn)為是由于ChatGPT的長(zhǎng)期記憶功能，讓它記住了前兩次嘗試的提示（比如考慮最長(zhǎng)運(yùn)行中有多少個(gè)立方體，專注于嚴(yán)格計(jì)數(shù)而不是估計(jì)），考慮到了失敗的經(jīng)驗(yàn)，并將它們?nèi)空显谝黄稹?/p>

因此，可以說(shuō)o3會(huì)通過(guò)記憶來(lái)學(xué)習(xí)。而這道難題也會(huì)成為未來(lái)的訓(xùn)練數(shù)據(jù)。

網(wǎng)友：人類也會(huì)困惑

有人說(shuō)，這根本就不是一個(gè)推理問(wèn)題，而是一個(gè)視覺(jué)理解問(wèn)題。

出現(xiàn)作者認(rèn)為的錯(cuò)誤答案是由于問(wèn)題表述不清楚導(dǎo)致AI的分析過(guò)程出現(xiàn)了偏差。

甚至人類面對(duì)這種問(wèn)題也會(huì)出現(xiàn)類似的困惑，比如題目的要求到底是以原來(lái)的排列結(jié)構(gòu)為基礎(chǔ)還是可以打亂結(jié)構(gòu)重新排列？

并且，如果能夠更清晰地為AI解釋圖片內(nèi)容（告知其圖片中小立方體的排列結(jié)構(gòu)）：

那么o3得到的答案也是正確的：

無(wú)論是3x3x3、4x4x4還是5x5x5，或者是NxNxN，人類自己都無(wú)法統(tǒng)一答案的問(wèn)題，對(duì)AI來(lái)說(shuō)是不是太難了點(diǎn)！

網(wǎng)友：

AI：或許我需要一個(gè)更科學(xué)的訓(xùn)練方式！

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標(biāo)記有誤，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

標(biāo)簽：

相關(guān)文章閱讀

余華英的三個(gè)子女現(xiàn)狀余華英的四個(gè)女兒在法庭上
什么是抑郁癥軀體化_什么是抑郁癥軀體化
緬北地下奶廠是真的嗎_緬北牛奶工廠是真的嗎
甲亢哥坐輕軌被重慶甜妹教育很聽(tīng)勸：有點(diǎn)危險(xiǎn)，不要教孩子這樣做

主站蜘蛛池模板：泰和县| 通辽市| 沁源县| 朝阳县| 吴川市| 报价| 寻乌县| 南宁市| 瑞丽市| 麻栗坡县| 汉沽区| 西平县| 弥勒县| 绥滨县| 西青区| 阳谷县| 无为县| 平远县| 会昌县| 望奎县| 吉木萨尔县| 林口县| 武川县| 桂平市| 桃园县| 萍乡市| 阳朔县| 留坝县| 焉耆| 南汇区| 化德县| 阳泉市| 贡山| 东兴市| 政和县| 磐石市| 辉县市| 工布江达县| 原阳县| 宁阳县| 个旧市|