3月2-3日大模型日報

146 0 0

【3月2-3日大模型日報】RNN效率媲美Transformer，Google新架構兩連發：同等規模強於Mamba；月之暗面楊植麟專訪：AI不是接下來一兩年找到PMF，而是接下來十到二十年如何改變世界；十年內出現AGI？下一代Gemini能感知環境？ DeepMind CEO哈薩比斯暢談AI

模型偏好只與大小有關？上交大全面解析人類與32種大模型偏好的定量組分

https://news.miracleplus.com/share_link/20052

在目前的模型訓練範式中，偏好資料的取得與使用已經成為了不可或缺的一環。在訓練中，偏好資料通常被用作對齊（alignment）時的訓練優化目標，如基於人類或AI 回饋的強化學習（RLHF/RLAIF）或直接偏好優化（DPO），而在模型評估中，由於任務的複雜性且通常沒有標準答案，則通常直接以人類標註者或高性能大模型（LLM-as-a-Judge）的偏好標註作為評判標準。儘管上述對偏好資料的應用已經取得了廣泛的成效，但對偏好本身則缺乏充足的研究，這很大程度上阻礙了對更可信 AI 系統的建構。為此，上海交通大學生成式人工智慧實驗室（GAIR）發布了一項新研究成果，對人類用戶與多達32 種流行的大語言模型所展現出的偏好進行了系統性的全面解析，以了解不同來源的偏好資料是如何由各種預定義屬性（如無害，幽默，承認限制等）定量組成的。

RNN效率媲美Transformer，Google新架構兩連發：同等規模強於Mamba

https://news.miracleplus.com/share_link/20053

這一次，Google DeepMind 在基礎模型方面又有了新動作。在GoogleDeepMind 近日的一篇論文中，研究者提出了RG-LRU 層，它是一種新穎的門控線性循環層，並圍繞它設計了一個新的循環塊來取代多查詢注意力（MQA）。他們使用該循環塊構建了兩個新的模型，一個是混合了 MLP 和循環塊的模型 Hawk，另一個是混合了 MLP 與循環塊、局部注意力的模型 Griffin。

大一統影片編輯框架：浙大&微軟推出UniEdit，無須訓練、支援多種編輯場景

https://news.miracleplus.com/share_link/20054

隨著 Sora 的爆火，人們看到了 AI 影片生成的巨大潛力，對這一領域的關注度也越來越高。除了影片生成，在現實生活中，如何對影片進行編輯同樣是一個重要的問題，且應用場景更為廣泛。過去的影片編輯方法往往局限於「外觀」層面的編輯，例如對影片進行「風格遷移」或替換影片中的物體，但關於更改影片中物件的「動作」的嘗試還很少。本文中，來自浙江大學、微軟亞洲研究院、和北京大學的研究者提出了一個基於文字描述的影片編輯統一框架UniEdit，不僅涵蓋了風格遷移、背景替換、剛性/ 非剛性物件替換等傳統外觀編輯場景，更可以有效地編輯影片中物件的動作，例如將上述影片中浣熊彈吉他的動作變成「吃蘋果」或是「招手」。此外，除了靈活的自然語言介面和統一的編輯框架，這款模型的另一個優勢是無需訓練，大大提升了部署的便利性和使用者使用的方便度。

月之暗面楊植麟專訪：AI不是接下來一兩年找到PMF，而是接下來十到二十年如何改變世界

https://news.miracleplus.com/share_link/20055

就在一年以前，AI 科學家楊植麟在矽谷做了一筆精確的計算。他意識到，如果決定啟動以 AGI 為目標的大模型創業，要在未來幾個月立刻籌措超 1 億美金資本。然而，這僅僅只是一張入場券。一年後，這個數字翻了 13 倍。大模型公司的競爭，與其說是一場科學競爭，不如說是先一場殘酷的金錢角力。在資本方摀緊口袋的情況下，你要領先對手找到更多的錢，買更多的卡，搶奪更多的人才。「它需要人才聚集、資本聚集。」成立於 2023 年 3 月 1 日的大模型公司月之暗面（Moonshot AI）創辦人兼 CEO 楊植麟說。楊植麟傾向於將他的公司視為，建構一個結合科學、工程和商業的系統。你可以想像成，他要在人類世界上空，架起一張 AI 實驗台，一手做實驗，一手將尖端技術落進真實世界，透過與人類互動找到應用機會，再將應用程式送入消費者手中。理想狀況是，前者燒掉數以十億、百億計資本；後者再把這些錢數成百上千倍地掙回來——怎麼聽，都像“走鋼索”一樣驚險。「AI 不是我在接下來一兩年找到什麼 PMF，而是接下來十到二十年如何改變世界。」他說。

十年內出現AGI？下一代Gemini能感知環境？ DeepMind CEO哈薩比斯暢談AI

https://news.miracleplus.com/share_link/20056

「如果我們在未來十年內擁有類似 AGI 的系統，我不會感到驚訝。」Google DeepMind 聯合創始人和 CEO Demis Hassabis 最近在人工智慧播客節目 Dwarkesh Podcast 上如是說。在長達一小時的節目中，Hassabis 分享了自己對智慧本質、強化學習、規模擴展和對齊、AGI、多模態等主題的看法。

英偉達黃仁勳：AI將在五年內通過任何測試

https://news.miracleplus.com/share_link/20057

美東時間週五（3月1日），英偉達CEO黃仁勳在美國加州參加史丹佛經濟政策研究所高峰會時表示，他預計通用人工智慧（AGI）最快將在五年內面世。通用人工智慧（AGI）又稱“強人工智慧”，是人工智慧的一種理論形式，指的是人工智慧可以像人類一樣學習和推理，有可能解決複雜的問題並獨立做出決策。由於目前仍沒有公認的人類智慧定義，不同領域科學家對通用人工智慧的定義和標準也各不相同。

MWC2024，看看廠商的新產品能有多離譜！

https://news.miracleplus.com/share_link/20058

在巴塞隆納舉行的世界行動通訊大會（Mobile World Congress,MWC）一直是向世界展示最新、最先進行動技術的地方。本次大會以「VELOCITY」（速度）為主題，全球各地的營運商、手機廠商與技術廠商積極參展，人工智慧主導了大多數重大創新產品的發布，而大會的焦點則指向AI和智慧型手機的結合。不少智慧型手機製造商指出，設備上運行的人工智慧提高了設備的安全性，解鎖了新的應用程序，而且速度更快，因為數據處理是在手機上完成的。對此，CCS Insight首席分析師Ben Wood還表示，「我認為，在MWC上，一個大新聞將是AI大模型在設備本身上運行的能力，這將很有可能改變遊戲規則。」