快訊

考生注意!國中教育會考今登場 應考注意事項一次看

晴朗炎熱飆36度高溫 明天午後對流旺盛 降雨範圍擴全台

閱讀數學/聳立在AI面前的數學高牆(下)

AI示意圖。圖/AI生成
AI示意圖。圖/AI生成

上週我們介紹了針對AI設計的數學題庫FrontierMath。許多數學家對FrontierMath 的評價非常高,包括了前面提到的陶哲軒。他就認為FrontierMath 中的題目「極具挑戰」,即使是該領域的數學家,也需要花費大量的時間和精力才能解決這些問題。有趣的是,除了專家親自出馬,陶哲軒指出的另一條路就是人機協作:讓相關領域的研究生與AI 系統合作。他評估在某些問題上,與目前的 AI協作解題,會比數學家花上多5倍左右的時間成本。然而,很有可能在未來幾年內,就可以下降到差不多的速度。然後,進展得好像比陶哲軒想得更快。不用人機協作,GPT-o3獨立解完了25% FrontierMath題目了。

​不過,雖然GPT-o展現出語言模型前所未有的數學解題能力。但這不代表數學之壁要被攻破了。首先,FrontierMath 的設計目標是評估 AI 模型,因此題庫多是有可自動驗證的問題,例如算出一組答案或可以用軟體驗證。然而,數學研究中很大一部分工作涉及到撰寫證明和開放探索,這些方面是FrontierMath 無法反應的。​

其次,雖然現在的FrontierMath一題就算會耗掉專家好幾小時、好幾天的心力。但許多數學研究更是需要數月、甚至數年的持續探索。費馬定理就是一個最好的例子,數學家們世代接力,花了300年才證明。最後一棒的懷爾斯曾這麼訴說他的心境:

「或許,我能給出關於我研究數學的歷程最貼切的描述,就是進入一棟大房子。當一個人開始探索第一個全黑的房間時,裡頭一片漆黑,他會在家具中邊跌倒邊摸索。漸漸地知道家具的位置。六個月後,你會找到開關並且打開燈。開燈的那一瞬間,整個房間被光線壟罩,你終於,能清楚地看見你站在哪裡。」

數學研究與解FrontierMath難題,兩者在「深度」上還是有很大的差異。

AI 數感實驗室 閱讀數學

相關新聞

科學人/偏方不可信?科學證實「母乳可當眼藥水」 助角膜修復

面對孩子身上層出不窮的大小狀況,許多父母都會口耳相傳各類偏方。用母乳舒緩寶寶眼睛的不適或紅疹,也不是迄今唯一的案例。這次經驗聽起來像是民間偏方,但麥考特將此偏方帶入實驗室,與研究角膜療法的專家彼特拉什

科學人/帶領遠傳殺出電信激戰圈 總經理井琪:懂技術也要知世局

談到電信產業,許多人腦海裡浮現的或許只有手機和基地台,但對遠傳總經理井琪來說,電信早已超越單純的「通訊」。從5G到人工智慧(AI)、從偏鄉診療到智慧城市,她把理性的科技與經營智慧巧妙融合,果斷決策又堅

科學人/開創程式語言的新天地…Pascal語言之父「沃斯」

我教導學生撰寫計算機程式時,總是耳提面命、再三強調,程式等於資料結構加上演算法。其實這個想法源自於1984年圖靈獎得主沃斯(Niklaus Emil Wirth, 1934~)...

紐時賞析/老對手新戰場:印巴展開無人機對決

India and Pakistan, old enemies, are engaged in their most e...

紐時賞析/「防守能拿NBA總冠軍」 這句話還管用嗎?

Dallas Mavericks general manager Nico Harrison has come to r...

閱讀數學/數學家的新能力

去年底,在一場OpenAI的講座〈具有 o1 推理的數學未來〉中,數學家陶哲軒認為,一直以來,研究數學都給人一種很困難的印象,偉大的數學家幾乎都被和「天才」畫上等號…

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。