當AI遇到空間推理難題:最新研究揭示GPT-4等頂尖模型在傳送門解謎和立體拼圖中集體"掛科",復雜智能遠比我們想象的更難實現。
智譜AI和清華大學聯合發布GLM-4.1V-Thinking視覺語言模型,通過創新的推理導向訓練框架,讓AI學會像人類一樣深度思考后再回答。該模型在多個基準測試中超越了規模更大的競爭對手,并首次在開源社區提供了完整的多模態推理解決方案,為AI技術的實際應用開辟了新路徑。
2025施耐德電氣智算峰會上,全新EcoStruxure(TM) Energy Operation電力綜合運營系統正式亮相,定位場站級智慧能源管理中樞,集技術領先性與本土適配性于一體。
這項由中國人民大學與斯坦福大學、微軟公司合作的研究,開發出名為MoCa的革命性多模態AI技術。該技術通過雙向注意力機制和聯合重建訓練,讓AI能夠像人類一樣同時理解圖片和文字,并建立深層語義關聯。在大規模測試中,MoCa顯著超越現有技術,30億參數模型就能匹敵傳統70億參數模型,展現出強大的實用潛力和應用前景。
Atlassian、Intuit和AWS三大企業巨頭正在為智能代理時代做準備,重新思考軟件構建方式。當前企業API為人類使用而設計,未來API將成為多模型原生接口。Intuit在QuickBooks中應用自動發票生成,使企業平均提前5天收款;AWS通過AI輔助遷移服務顯著提升效率;Atlassian推出內部員工入職代理和客戶代理,節省大量時間成本。專家強調需要建立強大的數據架構和信任機制。
這項由耶魯大學聯合紐約大學和艾倫人工智能研究所完成的研究,首次構建了專門針對科學文獻任務的AI評估平臺SciArena。通過收集超過13000張來自102位真實科學家的投票,研究揭示了當前AI助手在科學文獻理解方面的真實水平,同時指出了AI自動評估系統的顯著局限性,為科學研究領域的AI應用提供了重要參考。
MIT研究發現,使用生成式AI完成任務時,大腦運作方式與單純依靠自身思考存在顯著差異。研究顯示,使用ChatGPT等工具的用戶記憶力更差,神經連接活動減少,對所寫內容的回憶能力明顯下降。雖然AI工具能提高效率,但可能導致用戶缺乏對知識的深度理解和掌控感。研究強調需要更多科學數據來了解AI使用對人類認知的長期影響。
蘋果公司聯合香港大學開發了DiffuCoder,這是首個采用擴散模型的AI編程助手,能夠像人類程序員一樣進行全局思考和并行生成代碼。該模型通過創新的"耦合GRPO"強化學習算法,在EvalPlus等權威測試中性能提升4.4%,并實現了更快的代碼生成速度。這項研究為AI編程助手從線性生成向智能化并行思考的轉變奠定了基礎。
Earthgrid公司展示了突破性的等離子體挖掘系統,使用雙2500千瓦等離子炬在花崗巖中開鑿隧道。該技術替代傳統柴油設備和爆破方式,顯著降低環境影響。這項綠色挖掘工藝可高效鋪設地下電力線和光纖網絡,減少野火風險,為AI數據中心等高耗能基礎設施提供可持續的能源解決方案,推動綠色計算發展。
阿里巴巴通義實驗室的研究團隊開發了HumanOmniV2,這是一個能夠真正"讀懂"人類復雜意圖和情感的AI系統。該系統通過改進強化學習方法,讓AI在回答問題前必須先全面理解多模態背景信息,解決了現有AI模型忽略重要線索和缺乏全局理解的問題,在多項測試中表現優異。
OpenAI澄清雖在測試谷歌TPU芯片,但暫無大規模部署計劃。該公司正擺脫對微軟基礎設施的依賴,尋求包括甲骨文、CoreWeave等多家算力供應商合作。OpenAI一直在硬件棧多元化方面努力,從英偉達DGX系統起步,現已使用微軟Maia加速器、AMD Instinct MI300系列等多種硬件。公司還在開發自研AI芯片。分析認為,OpenAI可能因軟件棧主要針對GPU優化,適配TPU架構需要額外時間和資源投入。
MIT等頂尖院校聯合發布的Radial Attention技術,通過模擬自然界能量衰減現象,創新性地解決了AI視頻生成中的計算效率問題。該技術將生成速度提升1.9-3.7倍,訓練成本降低4.4倍,使AI能夠生成4倍長度的高質量視頻,為視頻AI走向實用化奠定重要基礎。