3月2-3日大模型日報

資訊2個月前发布 AIWindVane
146 0
3月2-3日大模型日報

【3月2-3日大模型日報】RNN效率媲美Transformer,Google新架構兩連發:同等規模強於Mamba;月之暗面楊植麟專訪:AI不是接下來一兩年找到PMF,而是接下來 十到二十年如何改變世界;十年內出現AGI? 下一代Gemini能感知環境? DeepMind CEO哈薩比斯暢談AI


模型偏好只與大小有關? 上交大全面解析人類與32種大模型偏好的定量組分

https://news.miracleplus.com/share_link/20052

在目前的模型訓練範式中,偏好資料的取得與使用已經成為了不可或缺的一環。 在訓練中,偏好資料通常被用作對齊(alignment)時的訓練優化目標,如基於人類或AI 回饋的強化學習(RLHF/RLAIF)或直接偏好優化(DPO),而在模型評估中,由於任務 的複雜性且通常沒有標準答案,則通常直接以人類標註者或高性能大模型(LLM-as-a-Judge)的偏好標註作為評判標準。 儘管上述對偏好資料的應用已經取得了廣泛的成效,但對偏好本身則缺乏充足的研究,這很大程度上阻礙了對更可信 AI 系統的建構。 為此,上海交通大學生成式人工智慧實驗室(GAIR)發布了一項新研究成果,對人類用戶與多達32 種流行的大語言模型所展現出的偏好進行了系統性的全面解析,以 了解不同來源的偏好資料是如何由各種預定義屬性(如無害,幽默,承認限制等)定量組成的。

3月2-3日大模型日報

RNN效率媲美Transformer,Google新架構兩連發:同等規模強於Mamba

https://news.miracleplus.com/share_link/20053

這一次,Google DeepMind 在基礎模型方面又有了新動作。 在GoogleDeepMind 近日的一篇論文中,研究者提出了RG-LRU 層,它是一種新穎的門控線性循環層,並圍繞它設計了一個新的循環塊來取代多查詢注意力(MQA) 。 他們使用該循環塊構建了兩個新的模型,一個是混合了 MLP 和循環塊的模型 Hawk,另一個是混合了 MLP 與循環塊、局部注意力的模型 Griffin。

3月2-3日大模型日報

大一統影片編輯框架:浙大&微軟推出UniEdit,無須訓練、支援多種編輯場景

https://news.miracleplus.com/share_link/20054

隨著 Sora 的爆火,人們看到了 AI 影片生成的巨大潛力,對這一領域的關注度也越來越高。 除了影片生成,在現實生活中,如何對影片進行編輯同樣是一個重要的問題,且應用場景更為廣泛。 過去的影片編輯方法往往局限於「外觀」層面的編輯,例如對影片進行「風格遷移」或替換影片中的物體,但關於更改影片中物件的「動作」的嘗試還很少。 本文中,來自浙江大學、微軟亞洲研究院、和北京大學的研究者提出了一個基於文字描述的影片編輯統一框架UniEdit,不僅涵蓋了風格遷移、背景替換、剛性/ 非剛性物件替換等傳統外觀編輯 場景,更可以有效地編輯影片中物件的動作,例如將上述影片中浣熊彈吉他的動作變成「吃蘋果」或是「招手」。 此外,除了靈活的自然語言介面和統一的編輯框架,這款模型的另一個優勢是無需訓練,大大提升了部署的便利性和使用者使用的方便度。


月之暗面楊植麟專訪:AI不是接下來一兩年找到PMF,而是接下來十到二十年如何改變世界

https://news.miracleplus.com/share_link/20055

就在一年以前,AI 科學家楊植麟在矽谷做了一筆精確的計算。 他意識到,如果決定啟動以 AGI 為目標的大模型創業,要在未來幾個月立刻籌措超 1 億美金資本。 然而,這僅僅只是一張入場券。 一年後,這個數字翻了 13 倍。 大模型公司的競爭,與其說是一場科學競爭,不如說是先一場殘酷的金錢角力。 在資本方摀緊口袋的情況下,你要領先對手找到更多的錢,買更多的卡,搶奪更多的人才。 「它需要人才聚集、資本聚集。」成立於 2023 年 3 月 1 日的大模型公司月之暗面(Moonshot AI)創辦人兼 CEO 楊植麟說。 楊植麟傾向於將他的公司視為,建構一個結合科學、工程和商業的系統。 你可以想像成,他要在人類世界上空,架起一張 AI 實驗台,一手做實驗,一手將尖端技術落進真實世界,透過與人類互動找到應用機會,再將應用程式送入消費者手中。 理想狀況是,前者燒掉數以十億、百億計資本;後者再把這些錢數成百上千倍地掙回來——怎麼聽,都像“走鋼索”一樣驚險。 「AI 不是我在接下來一兩年找到什麼 PMF,而是接下來十到二十年如何改變世界。」他說。

3月2-3日大模型日報

十年內出現AGI? 下一代Gemini能感知環境? DeepMind CEO哈薩比斯暢談AI

https://news.miracleplus.com/share_link/20056

「如果我們在未來十年內擁有類似 AGI 的系統,我不會感到驚訝。」Google DeepMind 聯合創始人和 CEO Demis Hassabis 最近在人工智慧播客節目 Dwarkesh Podcast 上如是說。 在長達一小時的節目中,Hassabis 分享了自己對智慧本質、強化學習、規模擴展和對齊、AGI、多模態等主題的看法。

3月2-3日大模型日報

英偉達黃仁勳:AI將在五年內通過任何測試

https://news.miracleplus.com/share_link/20057

美東時間週五(3月1日),英偉達CEO黃仁勳在美國加州參加史丹佛經濟政策研究所高峰會時表示,他預計通用人工智慧(AGI)最快將在五年內面世。 通用人工智慧(AGI)又稱“強人工智慧”,是人工智慧的一種理論形式,指的是人工智慧可以像人類一樣學習和推理,有可能解決複雜的問題並獨立做出決策。 由於目前仍沒有公認的人類智慧定義,不同領域科學家對通用人工智慧的定義和標準也各不相同。

3月2-3日大模型日報

MWC2024,看看廠商的新產品能有多離譜!

https://news.miracleplus.com/share_link/20058

在巴塞隆納舉行的世界行動通訊大會(Mobile World Congress,MWC)一直是向世界展示最新、最先進行動技術的地方。 本次大會以「VELOCITY」(速度) 為主題,全球各地的營運商、手機廠商與技術廠商積極參展,人工智慧主導了大多數重大創新產品的發布,而大會的焦點則指向AI和智慧型手機的 結合。 不少智慧型手機製造商指出,設備上運行的人工智慧提高了設備的安全性,解鎖了新的應用程序,而且速度更快,因為數據處理是在手機上完成的。 對此,CCS Insight首席分析師Ben Wood還表示,「我認為,在MWC上,一個大新聞將是AI大模型在設備本身上運行的能力,這將很有可能改變遊戲規則。」

3月2-3日大模型日報
© 版权声明

相關文章

暫無評論

暫無評論...