2月21日大模型日報合輯

資訊2個月前发布 AIWindVane
124 0
2月21日大模型日報合輯

【2月21日大模型日報合輯】20分鐘學會組裝電路板! 開源SERL框架精密操控成功率100%,速度三倍於人類;Sora新視頻只發TikTok:OpenAI 4天漲粉10萬;Karpathy新視頻又火了:從頭構建GPT Tokenizer;運行LIama2需要8400萬元, 最快AI推理晶片成本推算引熱議


20分鐘學會組裝電路板! 開源SERL框架精密操控成功率100%,速度三倍於人類

 

連結:https://news.miracleplus.com/share_link/18873

近年來,機器人強化學習技術領域取得顯著的進展,例如四足行走,抓取,靈巧操控等,但大多數局限於實驗室展示階段。 將機器人強化學習技術廣泛應用到實際生產環境仍面臨許多挑戰,這在一定程度上限制了其在真實場景的應用範圍。 強化學習技術在實際應用的過程中,任需克服包括獎勵機制設定、環境重置、樣本效率提升及動作安全保障等多重複雜的問題。 業界專家強調,解決強化學習技術實際落實的許多難題,與演算法本身的持續創新同等重要。 面對這項挑戰,來自加州大學柏克萊、史丹佛大學、華盛頓大學以及Google的學者們共同開發了名為高效機器人強化學習套件(SERL)的開源軟體框架,致力於推動強化學習技術在實際機器人應用中 的廣泛使用。

2月21日大模型日報合輯

首次大規模多語言評估,支援7種語言,生物醫學領域7B開源LLM

 

連結:https://news.miracleplus.com/share_link/18874

大語言模型 (LLM) 已應用於醫療保健和醫學等專業領域。 儘管有各種為健康環境量身定制的開源 LLM,但將通用 LLM 應用於醫學領域仍存在重大挑戰。 近日,法國阿維尼翁大學(Avignon Université )、南特大學(Nantes Université)和Zenidoc 的研究團隊開發了BioMistral,一個專為生物醫學領域量身定制的開源LLM,利用Mistral 作為其基礎模型,並在 PubMed Central 上進行了進一步的預訓練。 研究人員根據由 10 項既定的英語醫學問答 (QA) 任務組成的基準對 BioMistral 進行了全面評估。 也探索透過量化和模型合併方法獲得的輕量級模型。 結果證明了 BioMistral 與現有開源醫療模型相比具有卓越的性能,並且與專有模型相比具有競爭優勢。 最後,為了解決英語以外的數據有限的問題,並評估醫學 LLM 的多語言泛化能力,自動將該基準翻譯和評估為 7 種其他語言。 這標誌著醫學領域 LLM 的首次大規模多語言評估。

2月21日大模型日報合輯

OPPO 劉作虎:10 年內,手機還是 AI 的最佳載體

 

連結:https://news.miracleplus.com/share_link/18875

手機 AI 功能該怎麼做? 上個時代最重要的智慧型設備,在 AI 時代是將體驗升級,還是將被新設備取代? 前幾日,魅族宣布將停止傳統「智慧型手機」新專案的開發,全力投入新一代 AI 設備,引起了小範圍的熱議。 而 2 月 20 日,彷彿是一種回應,將 AI 功能部署到手機上最積極的手機廠商之一的 OPPO,宣布了其 AI 戰略。 OPPO 在手機的 AI 功能方面佈局很早。 在 2020 年,OPPO 推出了首個 AI 大模型。 2023 年大語言模型蓬勃發展的一年,OPPO 堅定了 AI 手機的佈局。 2024 年初,OPPO 發布了 Find X7,是首個能夠在端側應用 70 億參數大語言模型的手機。


Sora新影片只發TikTok:OpenAI 4天漲粉10萬

 

連結:https://news.miracleplus.com/share_link/18876

Sora新視頻,變成“抖音獨佔”了。 悄無聲息,OpenAI正式殺入TikTok,加上洗腦配樂直接讓人刷到停不下來,瘋狂引流吸粉中:短短4天,漲粉10萬,50萬贊——這還是不打槍不宣傳 的情況下。 a16z合夥人驚呼,如果這是在資訊流裡刷出來的,絕對分不出真假。

2月21日大模型日報合輯

Karpathy新影片又火了:從頭開始建立GPT Tokenizer

 

連結:https://news.miracleplus.com/share_link/18877

技術大神卡帕西離職OpenAI以後,營業可謂相當積極啊。 這不,前腳新項目剛上線,後腳全新的教學影片又給大夥整出來了:這次,是手把手教咱構建一個GPT Tokenizer(分詞器),還是熟悉的時長(足足2小時13分鐘)。 Tokenizer即分詞器是大語言模型pipeline中一個完全獨立的階段。 它們有自己的訓練集、演算法(例如BPE,位元組對編碼),並在訓練完成後實現兩個功能:從字串編碼到token,以及從token解碼回字串。 為什麼我們需要關注它? 卡帕西指出:因為LLM中的許多奇怪行為和問題都可以追溯到它。

2月21日大模型日報合輯

運行LIama2需要8400萬元,最快AI推理晶片成本推算引熱議

 

連結:https://news.miracleplus.com/share_link/18878

想實現史上最快大模型推理,得要1171萬美元(8410萬元)。 同等項目下,使用英偉達GPU成本只需30萬美元。 關於最強AI晶片易主Groq,可能得讓子彈再飛一會兒了。 這兩天,Groq驚艷亮相。 它以號稱「性價比高英偉達100倍」的晶片,實現每秒500tokens大模型生成,感受不到任何延遲。 喧囂過後開始出現一些理智討論,其中主要還是針對Groq的效益成本問題。 網友粗略一算,現在演示Demo就需要568塊晶片,花費1171萬美元。 參與Groq成本問題討論的,有電腦學生,也有同提供推理服務的雲端廠商,甚至還有Groq前員工大戰現員工。

2月21日大模型日報合輯

旨在建構首個通用生物學AI模型,前Google DeepMind科學家聯手創建Biooptimus

 

連結:https://news.miracleplus.com/share_link/18879

隨著法國新創企業生態系統的持續繁榮,例如 Mistral、Poolside 和 Adaptive。 2 月 20 日,總部位於巴黎的 Biooptimus 在獲得 3,500 萬美元的種子輪融資後,從隱身中脫穎而出,其使命是建立第一個用於生物學的通用人工智慧基礎模型。 新的開放科學模型將把不同規模的生物學與生成人工智慧連接起來——從分子到細胞、組織和整個生物體。 Bioptimus 聯合了一個由Google DeepMind alumni 和Owkin 科學家組成的團隊,其中AI 生物技術新創公司Owkin 本身就是一家法國獨角獸,他們將利用AWS 計算和Owkin 的數據生成功能,並訪問來自全球領先學術醫院的 多模態患者數據。

2月21日大模型日報合輯
© 版权声明

相關文章

暫無評論

暫無評論...