chatgpt沒有數(shù)學(xué)邏輯 陶哲軒:ChatGPT已加入我的數(shù)學(xué)工作流
,已經(jīng)成為天才數(shù)學(xué)家陶哲軒的研究助手了!
不止,他還直接在網(wǎng)上宣布:
多種AI工具都會納入自己的工作流。
最近這些日子,陶哲軒對AI可是青眼有加,甚至在網(wǎng)上只談?wù)撘粋€話題:AI,特別是大語言模型在數(shù)學(xué)研究中的應(yīng)用。
期間,各種的“隱藏功能”都被陶哲軒挖了出來:
大到尋找公式、輔助證明定理;小到改寫論文語句、查詢小語種數(shù)學(xué)名詞的發(fā)音。
而為何突然對AI協(xié)助工作這么關(guān)注?陶哲軒用自己的老本行數(shù)學(xué)對AI做了個類比:
傳統(tǒng)的計算機軟件就像是數(shù)學(xué)中的標(biāo)準(zhǔn)函數(shù),比較死板;
AI工具更像是數(shù)學(xué)中的概率函數(shù),會更加靈活。
對這個類比,中科院計算所研究員包云崗直接稱贊很形象。
也有網(wǎng)友表示:
AI生成的內(nèi)容有時候真的會有“神來之筆”,幫助人們更好地工作。
不過也有網(wǎng)友對陶哲軒用協(xié)助搞數(shù)學(xué)研究接受無能,畢竟之前很長一段時間大眾對的吐槽都集中在數(shù)學(xué)能力上。
于是,在陶宣稱在數(shù)學(xué)中可以完成一些半成品工作時,有人直接在評論區(qū)發(fā)問:
你是認(rèn)真的嗎?我可是(你的)超級粉絲。
那話說回來,一個“數(shù)學(xué)菜雞”在一個大數(shù)學(xué)家手里究竟能有什么用處?
一起來看~
對搞學(xué)術(shù)的來說“剛剛好”
總的來講,陶哲軒大概的意思就是:
數(shù)學(xué)能力雖然不咋滴,但對做學(xué)術(shù)研究的人來說是個發(fā)散思維的好工具。
(對普通人來說有點不太專業(yè),但對搞數(shù)學(xué)的學(xué)術(shù)人員來說剛剛好)
那這個剛剛好的尺度是如何拿捏的?
陶哲軒直接給出了他用求解數(shù)學(xué)題的幾個示例:
剛開始,他直接把同事詢問的問題逐字逐句拋給了。
也有模有樣地回答了起來,期間還提到了一個高度相關(guān)的術(shù)語:對數(shù)矩生成函數(shù)chatgpt沒有數(shù)學(xué)邏輯,甚至在給出的答案中還討論了一個具體的例子。
這術(shù)語,這舉例…乍一看,甚至騙過了陶哲軒的“法眼”,不過在檢查一遍之后,陶發(fā)現(xiàn):
答案是錯的!
chatgpt沒有數(shù)學(xué)邏輯,按理說一般人的邏輯到這里就該結(jié)束了——得出結(jié)論:的數(shù)學(xué)能力不太行。
但陶哲軒還沒有止步,他仔細(xì)分析了給出的解答過程,發(fā)現(xiàn)并不是完全錯誤的,還是有可取之處。
比如說,在解答過程中用的是lmgf公式,而在克拉默定理給出的標(biāo)準(zhǔn)答案中用到的是lmgf公式的變換。
雖然不是正確的解題思路chatgpt沒有數(shù)學(xué)邏輯,但也很接近正確答案了。
(有點意思)緊接著他又用兒子幫忙做的手機短信版再試了一個數(shù)學(xué)問題:
我該如何證明有無窮多個素數(shù)?
雖然給出的證明的是意料中的不完全正確,但陶發(fā)現(xiàn)給出的論證思路是可以被固定下來的,并且這個思路他之前還從未見過。
這一通試用下來,直接打開了陶哲軒的思路。
既然在具體數(shù)學(xué)問題上給出的答案是不完全正確的,那不如索性發(fā)揮發(fā)揮它生成答案部分正確的特性:
在處理數(shù)學(xué)問題時,可以讓這類大語言模型做一些半成品的語義搜索工作。
也就是說,不用提供確切的答案,只用生成一些可能的提示(類似于幫你找靈感)。
這樣一來,依據(jù)生成的提示+傳統(tǒng)搜索引擎搜索,就能很輕松找到答案了。
隨后,陶哲軒還具體上手演示了一把。
首先要有技巧地拋出一個問題,假設(shè)陶想找?guī)炷瑺柖ɡ淼洸黄饋磉@個定理的名字,他是這樣來問的:
我正在找一個關(guān)于()的公式,它是一個經(jīng)典的理論但我想不起名字,你能給我解答嗎?
最終給出的答案是公式(一個相關(guān)的結(jié)果),然后根據(jù)這個答案用傳統(tǒng)的搜索引擎就可以輕松找到庫默爾定理。
話說回來,既然都只是用作數(shù)學(xué)研究中的一個工具,為啥在陶哲軒眼中AI會更合適,而傳統(tǒng)搜索引擎就不太行呢?
AI“思維邏輯”更發(fā)散
陶直接從傳統(tǒng)計算機軟件和AI工具的內(nèi)部運行邏輯分析了一通。
先來說傳統(tǒng)的計算機軟件,它的運行邏輯類似于函數(shù):→,這是一個很標(biāo)準(zhǔn)的數(shù)學(xué)概念。
具體來說,若輸入的在給定域中,軟件就能夠可靠地給出范圍中的單個輸出(),若輸入不在給定域中,則就不能給出結(jié)果或者說亂給一些結(jié)果。
而AI工具,就不會像傳統(tǒng)計算機軟件那樣死板,它運行的邏輯不是基于經(jīng)典函數(shù),而是類似于概率 μ:→Pr()。
輸入,AI會從一個概率分布μ?中采樣,然后隨機輸出。而這個概率分布,集中在完美結(jié)果()附近。
不過這樣也會導(dǎo)致一些隨機偏差和不準(zhǔn)確結(jié)果的產(chǎn)生。
但整體比較下來,AI工具還是具有一定的優(yōu)勢。
一方面它更加靈活,可以比傳統(tǒng)的軟件工具更優(yōu)雅地處理嘈雜或格式不好的輸入。
另一方面,在一定程度上AI的“思維方式”也會更加發(fā)散。
在宣布把AI工具納入自己的工作流之后,陶哲軒還在上不斷更新用AI工作的帖子。
比如說用AI寫郵件:
或者發(fā)現(xiàn)了在處理數(shù)學(xué)問題時的亮點:能夠識別不同語言的數(shù)學(xué)概念音譯版。
AI半自動證明定理,審稿人難了
陶哲軒對AI的觀察,也在學(xué)術(shù)圈引起了一場討論。
他指出,閱讀AI寫的論文和人寫的論文體驗完全不同。
閱讀人寫的論文,通常能在上下文和風(fēng)格上捕捉到一些線索,通過這些線索可以快速分離出論文的“肉”,加快閱讀速度。
AI生成的數(shù)學(xué)論文,文字看起來都很有說服力,必須一行一行仔細(xì)看才能發(fā)現(xiàn)其中的缺陷。
紐約大學(xué)教授馬庫斯將其解讀為:同行評議從此更難了。
不過網(wǎng)友中也有人認(rèn)為,讓審稿人必須一行一行仔細(xì)看,而不是依賴于膚淺的格式信號,也算得上一件好事。
還有人腦洞大開,想知道AI能否提出一些全新的數(shù)學(xué)猜想。
AI能不能提出猜想不知道,但是AI自動、半自動證明定理已經(jīng)是現(xiàn)實,并且走向?qū)嵱没恕?/p>
還是陶哲軒,2月份他在加州大學(xué)洛杉磯分校的IPAM(純數(shù)學(xué)與應(yīng)用數(shù)學(xué)研究所)組織了一場機器學(xué)習(xí)輔助證明主題研討會,會上展示了很多這方面的前沿成果。
IBM研究員 Rute展示了一種受啟發(fā)的方法,將定理證明類比成圍棋,下一個步驟相當(dāng)于下一手棋,得證相當(dāng)于獲勝。
谷歌科學(xué)家吳宇懷則分享了大語言模型在自動形式化()上的進展。
而陶哲軒本人對AI的興趣也不止于此,用機器學(xué)習(xí)解決實際問題也在他的涉獵范圍之中。
剛剛在澳大利亞的一場講座上,他還分享了如何用數(shù)學(xué)結(jié)合機器學(xué)習(xí)預(yù)測火災(zāi)變化。
參考鏈接:
[1]@tao/
[2]
[3]
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負(fù)責(zé)。如需轉(zhuǎn)載,請聯(lián)系原作者。如果來源標(biāo)注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。