中国工业网_网络工业品牌 资讯创造价值

AI成為數(shù)學(xué)家得力助手還要多久

從計(jì)算機(jī)科學(xué)到醫(yī)學(xué)再到國(guó)家安全,數(shù)學(xué)是眾多關(guān)鍵應(yīng)用的基石,但數(shù)學(xué)領(lǐng)域的進(jìn)步可能需要數(shù)年時(shí)間才能實(shí)現(xiàn)。

幾百年來(lái),數(shù)學(xué)家使用的工具依然簡(jiǎn)樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號(hào)的迷宮中尋找通往真理的路徑。

為了打破這一局面,美國(guó)國(guó)防高級(jí)研究計(jì)劃局今年4月啟動(dòng)了“指數(shù)性數(shù)學(xué)”計(jì)劃,旨在開發(fā)一種能極大提升數(shù)學(xué)研究效率的人工智能(AI)“合著者”系統(tǒng)。

幾十年來(lái),數(shù)學(xué)家借助計(jì)算機(jī)進(jìn)行輔助計(jì)算或驗(yàn)證命題,如今的AI或許能更上層樓,挑戰(zhàn)那些人類長(zhǎng)年未解的難題。不過,從能解高中題的AI,到能協(xié)助攻克前沿?cái)?shù)學(xué)難關(guān)的AI,中間仍隔著一道鴻溝。

圖片來(lái)源:物理學(xué)家組織網(wǎng)

解決重大難題仍力不從心

大型語(yǔ)言模型(LLM)并不擅長(zhǎng)數(shù)學(xué)。它們常常出現(xiàn)“幻覺”,甚至可能被誤導(dǎo)相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現(xiàn)出的進(jìn)步令數(shù)學(xué)家眼前一亮。

今年,這些模型在美國(guó)數(shù)學(xué)邀請(qǐng)賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過去“一錘定音”式的輸出,這些模型開始嘗試模擬數(shù)學(xué)家逐步推理的思考過程。

同時(shí),一些將LLM與某種事實(shí)核查系統(tǒng)相結(jié)合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統(tǒng)將語(yǔ)言模型與棋類AI——AlphaZero結(jié)合,成為首個(gè)取得與國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽銀牌得主成績(jī)相當(dāng)?shù)南到y(tǒng)。今年5月,谷歌的AlphaEvolve模型更進(jìn)一步,在多個(gè)長(zhǎng)期未解的數(shù)學(xué)與計(jì)算難題上找到優(yōu)于人類現(xiàn)有方案的解法。

美國(guó)《麻省理工科技評(píng)論》指出,盡管這些AI成績(jī)亮眼,但專家們普遍認(rèn)為,它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競(jìng)賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數(shù)學(xué)研究則更開放、更復(fù)雜。面對(duì)“P vs NP”“黎曼猜想”等重大難題時(shí),AI仍力不從心。

為了更準(zhǔn)確地評(píng)估AI的能力,初創(chuàng)公司Epoch AI去年推出了FrontierMath測(cè)試,聯(lián)合60多位數(shù)學(xué)家設(shè)計(jì)出全新高難度題目,避開模型已見過的訓(xùn)練數(shù)據(jù),結(jié)果LLM幾乎集體“交白卷”。

這些測(cè)試表明,AI在數(shù)學(xué)道路上雖已邁步,但離“合著者”角色仍有很長(zhǎng)一段路要走。

需攻克“超長(zhǎng)推理鏈”

仔細(xì)觀察數(shù)學(xué)問題會(huì)發(fā)現(xiàn),它們?cè)谀承┓矫骖愃疲航鉀Q問題需完成一系列連續(xù)步驟,關(guān)鍵在于找到這些步驟。

美國(guó)加州理工學(xué)院謝爾蓋·古科夫指出,困難的差異往往體現(xiàn)在路徑的長(zhǎng)度上。高中數(shù)學(xué)可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長(zhǎng)達(dá)百萬(wàn)步。

這類“超長(zhǎng)路徑”極難處理。就像下圍棋時(shí)尋找一條制勝序列,AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。而在數(shù)學(xué)中,這個(gè)復(fù)雜度要遠(yuǎn)超棋類游戲。

據(jù)物理學(xué)家組織網(wǎng)今年2月報(bào)道,為應(yīng)對(duì)這一挑戰(zhàn),古科夫團(tuán)隊(duì)開發(fā)了一種方法,將多個(gè)步驟打包成“超級(jí)步驟”,相當(dāng)于穿上“巨人靴”跨越大段路程。他們?cè)O(shè)計(jì)了一個(gè)系統(tǒng),其中強(qiáng)化學(xué)習(xí)模型負(fù)責(zé)提出超級(jí)步驟,另一個(gè)模型負(fù)責(zé)驗(yàn)證其合理性。

該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學(xué)家推翻了一個(gè)40年來(lái)被廣泛引用的“反例”。這曾被視為證明該猜想錯(cuò)誤的關(guān)鍵依據(jù)。

牛津大學(xué)數(shù)學(xué)家馬丁·布里森對(duì)此表示肯定:“排除錯(cuò)誤路徑,是科研中非常有價(jià)值的一步。”

古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領(lǐng)域。他希望,這種方法不僅能推動(dòng)AI跳出固有模式,也為數(shù)學(xué)研究帶來(lái)新突破。

真正的創(chuàng)新和突破仍屬人類

跳出思維定式,正是數(shù)學(xué)家攻克難題的關(guān)鍵。數(shù)學(xué)常被看作機(jī)械推理,而高等數(shù)學(xué)則更像是一場(chǎng)實(shí)驗(yàn),充滿一波三折的試錯(cuò)與靈光乍現(xiàn)的頓悟。

這正是AlphaEvolve等AI工具的優(yōu)勢(shì)所在。它通過LLM不斷生成并改進(jìn)解題代碼,配合第二個(gè)模型評(píng)估每一輪結(jié)果,最終提出比人類更優(yōu)的解法。這種方法不僅能獨(dú)立探索,也支持人類隨時(shí)介入,提供靈感和指令。

澳大利亞悉尼大學(xué)數(shù)學(xué)家喬迪·威廉姆森強(qiáng)調(diào),探索性思維是數(shù)學(xué)的核心。據(jù)英國(guó)《新科學(xué)家》網(wǎng)站報(bào)道,他與Meta合作開發(fā)了PatternBoost AI系統(tǒng),可根據(jù)一個(gè)數(shù)學(xué)想法生成相似概念,幫助激發(fā)靈感。他說:“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”

這種頭腦風(fēng)暴在數(shù)學(xué)中至關(guān)重要,它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過純粹推理發(fā)現(xiàn)了它,其形狀并不存在于自然界中,卻深刻影響了數(shù)學(xué)的發(fā)展。威廉姆森希望,AI未來(lái)也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學(xué)對(duì)象”。

不過,目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事,讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”,幫助人們發(fā)現(xiàn)路徑、避開死路,但專家普遍認(rèn)為,真正的創(chuàng)新與突破,仍然屬于人類。

關(guān)鍵詞:

來(lái)源:科技日?qǐng)?bào)
編輯:GY653

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作媒體供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 相關(guān)推薦

相關(guān)詞

主站蜘蛛池模板: 黑料网 - 黑料大事记-黑料门 黑料社最新 今日黑料 热门黑料 最新反差免费-黑料网今日黑料首页_黑料网 - 黑料大事记-黑料门 黑料社最新 今日黑料 热门黑料 最新反差免费-黑料网今日黑料首页 | 体育馆木地板厂家_篮球木地板价格_舞台木地板品牌-欧氏地板 | 中科先农农业(河北)智能设备有限责任公司| 上海钧尚电器有限公司 - Faulhaber电机 AMETEK pittman电机 AMETEK ROTRON军用航空风机 Exlar电动缸 MAE电机 MCG电机 CP电动工具 马头工具 AMCI驱动器 直流电机 减速箱 直流伺服电机,无刷电机,直线电机 直流防爆电机 防爆电机 汽车助力转向电机 EPS电机 faulhaber motor faulhaber gearbox NANOTEC电机 ELWOOD电机 PHYTRON电机 EXLAR伺服电动缸 高力矩、高性能直流电机,音圈电机,风机,直流风机,航空风机 | 双合金螺杆|注塑机螺杆|挤出机螺杆|双合金料管—东莞市精耐螺杆机械有限公司 | 偏光显微镜-金相抛光机|预磨机|磨抛机|镶嵌机|切割机-上海蔡康光学仪器厂 | 危废处理_危废处置_危废处理公司-江苏绿瑞特环境科技股份有限公司 | 暖气片,暖气片厂家,散热器,暖气片品牌-青岛瑞雪兆散热器有限公司 | 智齿科技-智齿客服 | 在线客服_呼叫中心_客户联络中心方案 | 苏州拆除公司_太仓拆除公司_常熟拆除公司_昆山拆除公司--苏州伊诺尔拆除工程有限公司 | 五凌汽配-轮胎螺丝|中心螺丝|小螺丝|轮胎螺栓|扭力杆螺丝|高强度紧固件|螺丝螺母|汽车配件 | 医疗器械,理化实验室设备,微生物,培养基,一站式采购 - 杭州润泽仪器商城 | 客服外包_电话调查_电话调研_售前售后在线外包客服公司-北京美宸互联 | 数控机床市场网-专业的数控机床网站| 热水工程|空气能热水工程|超低温采暖工程|太阳能热水工程|空气源热泵厂家|炬邦热能设备有限公司 热熔钻孔机【优质厂家】_多年热熔钻设备研发制造经验 | 装盒机|全自动封盒机|纸盒子包装机|高速装盒机定制-温州胜泰机械有限公司 | 仪商网-专业测试仪器,测量仪表行业信息综合门户 | 山东德曼医疗设备集团有限公司 | 游离二氧化硅处理仪-恒温恒湿称重系统-智能蒸馏仪-硫化物酸化吹气仪-萃取仪-COD消解仪 | 莱湾科技-智能会议室|多功能|多媒体|音视频|无纸化|远程视频会议室运维 | 泡沫混凝土垫层填充厂家,发泡混凝土垫层填充,轻质混凝土垫层填充厂家,深圳市鸿奥建材发展有限公司 | 呼吸家官网|肺功能检测仪生产厂家|国产肺功能仪知名品牌|肺功能检测仪|肺功能测试仪|婴幼儿肺功能仪|弥散残气肺功能仪|肺功能测试系统|广州红象医疗科技有限公司|便携式肺功能仪|大肺功能仪|呼吸康复一体机|儿童肺功能仪|肺活量计|医用简易肺功能仪|呼吸康复系统|肺功能仪|弥散肺功能仪(大肺)|便携式肺功能检测仪|肺康复|呼吸肌力测定肺功能仪|肺功能测定仪|呼吸神经肌肉刺激仪|便携式肺功能 | 天津鸿宸机械设备有限公司-提取浓缩设备和生物制药设备以及制剂设备、粉碎设备、烘干等设备供应商 | 文君阁-提供生活百科,日常生活健康小常识,生活小窍门,百科知识大全 | 排水PVC管-PVC排污管-给水PVC管-电线PVC管-米阳建材pvc管厂 | 诸城市佳品食品机械有限公司| 重庆惠程信息科技股份有限公司| 河南反渗透设备-河南EDI超纯水设备-郑州纯净水设备-郑州友邦水处理设备有限公司 | 泥浆振动筛|卧式泥浆搅拌器|泥浆离心机|泥浆处理固控设备_沧州宏宇石油机械有限公司 | 压力机-压装机-黄油机-黄油泵-[广东品嘉灵]专业定制各种精密压装设备 | 耐磨陶瓷涂料_耐磨防腐涂料_KNM防腐陶瓷涂料-北京耐默 | 郑州网站建设_郑州网站制作_郑州网络公司-三猫网络 | 扫路车_洗扫车_清扫车_道路清扫车_天锦洗扫车-程力专用汽车股份有限公司 | 精品中文字幕在线观看,粉嫩av一区二区三区,最近中文字幕在线看免费视频,亚洲高清在线观看,日本一区二区视频手机免费看,国产黄色小视频,亚洲高清免费视频,国产精品一区二区欧美视频,亚洲人免费视频,亚洲视频在线观看免费,国产免费高清综合视频,中文字幕永久在线 | 清扫器-聚氨酯清扫器-合金清扫器-四连杆自动纠偏-机械纠偏-锥辊纠偏-衡水涌泉机械科技有限公司 | 兰舍硅藻泥 -- 深圳硅藻泥|深圳兰舍硅藻泥|深圳硅藻泥品牌|深圳硅藻泥价格|深圳硅藻泥厂家|深圳硅藻泥施工| | 温州网络公司_网站建设_网络营销策划_阿里淘宝店铺服务-温州聚欣网络科技有限公司 | 质检报告_COC_CE认证_LFGB测试_REACH_FCC_FDA-冠通检测 | 桶装水配送-瓶装水-净水器-厦门水之露商贸有限公司,电话:18205922444 | 军用笔记本电脑_三防加固笔记本电脑_平板型全坚固计算机-集海卫通 | 聚合氯化铝pac-聚氯化铝-饮水级工业级聚合氯化铝-聚合氯化铝厂家价格 |