2月21日大模型日報合輯

124 0 0

【2月21日大模型日報合輯】20分鐘學會組裝電路板！開源SERL框架精密操控成功率100%，速度三倍於人類；Sora新視頻只發TikTok：OpenAI 4天漲粉10萬；Karpathy新視頻又火了：從頭構建GPT Tokenizer；運行LIama2需要8400萬元，最快AI推理晶片成本推算引熱議

20分鐘學會組裝電路板！開源SERL框架精密操控成功率100%，速度三倍於人類

連結：https://news.miracleplus.com/share_link/18873

近年來，機器人強化學習技術領域取得顯著的進展，例如四足行走，抓取，靈巧操控等，但大多數局限於實驗室展示階段。將機器人強化學習技術廣泛應用到實際生產環境仍面臨許多挑戰，這在一定程度上限制了其在真實場景的應用範圍。強化學習技術在實際應用的過程中，任需克服包括獎勵機制設定、環境重置、樣本效率提升及動作安全保障等多重複雜的問題。業界專家強調，解決強化學習技術實際落實的許多難題，與演算法本身的持續創新同等重要。面對這項挑戰，來自加州大學柏克萊、史丹佛大學、華盛頓大學以及Google的學者們共同開發了名為高效機器人強化學習套件（SERL）的開源軟體框架，致力於推動強化學習技術在實際機器人應用中的廣泛使用。

首次大規模多語言評估，支援7種語言，生物醫學領域7B開源LLM

連結：https://news.miracleplus.com/share_link/18874

大語言模型 (LLM) 已應用於醫療保健和醫學等專業領域。儘管有各種為健康環境量身定制的開源 LLM，但將通用 LLM 應用於醫學領域仍存在重大挑戰。近日，法國阿維尼翁大學（Avignon Université ）、南特大學（Nantes Université）和Zenidoc 的研究團隊開發了BioMistral，一個專為生物醫學領域量身定制的開源LLM，利用Mistral 作為其基礎模型，並在 PubMed Central 上進行了進一步的預訓練。研究人員根據由 10 項既定的英語醫學問答 (QA) 任務組成的基準對 BioMistral 進行了全面評估。也探索透過量化和模型合併方法獲得的輕量級模型。結果證明了 BioMistral 與現有開源醫療模型相比具有卓越的性能，並且與專有模型相比具有競爭優勢。最後，為了解決英語以外的數據有限的問題，並評估醫學 LLM 的多語言泛化能力，自動將該基準翻譯和評估為 7 種其他語言。這標誌著醫學領域 LLM 的首次大規模多語言評估。

OPPO 劉作虎：10 年內，手機還是 AI 的最佳載體

連結：https://news.miracleplus.com/share_link/18875

手機 AI 功能該怎麼做？上個時代最重要的智慧型設備，在 AI 時代是將體驗升級，還是將被新設備取代？前幾日，魅族宣布將停止傳統「智慧型手機」新專案的開發，全力投入新一代 AI 設備，引起了小範圍的熱議。而 2 月 20 日，彷彿是一種回應，將 AI 功能部署到手機上最積極的手機廠商之一的 OPPO，宣布了其 AI 戰略。 OPPO 在手機的 AI 功能方面佈局很早。在 2020 年，OPPO 推出了首個 AI 大模型。 2023 年大語言模型蓬勃發展的一年，OPPO 堅定了 AI 手機的佈局。 2024 年初，OPPO 發布了 Find X7，是首個能夠在端側應用 70 億參數大語言模型的手機。

Sora新影片只發TikTok：OpenAI 4天漲粉10萬

連結：https://news.miracleplus.com/share_link/18876

Sora新視頻，變成“抖音獨佔”了。悄無聲息，OpenAI正式殺入TikTok，加上洗腦配樂直接讓人刷到停不下來，瘋狂引流吸粉中：短短4天，漲粉10萬，50萬贊——這還是不打槍不宣傳的情況下。 a16z合夥人驚呼，如果這是在資訊流裡刷出來的，絕對分不出真假。

Karpathy新影片又火了：從頭開始建立GPT Tokenizer

連結：https://news.miracleplus.com/share_link/18877

技術大神卡帕西離職OpenAI以後，營業可謂相當積極啊。這不，前腳新項目剛上線，後腳全新的教學影片又給大夥整出來了：這次，是手把手教咱構建一個GPT Tokenizer（分詞器），還是熟悉的時長（足足2小時13分鐘）。 Tokenizer即分詞器是大語言模型pipeline中一個完全獨立的階段。它們有自己的訓練集、演算法（例如BPE，位元組對編碼），並在訓練完成後實現兩個功能：從字串編碼到token，以及從token解碼回字串。為什麼我們需要關注它？卡帕西指出：因為LLM中的許多奇怪行為和問題都可以追溯到它。

運行LIama2需要8400萬元，最快AI推理晶片成本推算引熱議

連結：https://news.miracleplus.com/share_link/18878

想實現史上最快大模型推理，得要1171萬美元（8410萬元）。同等項目下，使用英偉達GPU成本只需30萬美元。關於最強AI晶片易主Groq，可能得讓子彈再飛一會兒了。這兩天，Groq驚艷亮相。它以號稱「性價比高英偉達100倍」的晶片，實現每秒500tokens大模型生成，感受不到任何延遲。喧囂過後開始出現一些理智討論，其中主要還是針對Groq的效益成本問題。網友粗略一算，現在演示Demo就需要568塊晶片，花費1171萬美元。參與Groq成本問題討論的，有電腦學生，也有同提供推理服務的雲端廠商，甚至還有Groq前員工大戰現員工。

旨在建構首個通用生物學AI模型，前Google DeepMind科學家聯手創建Biooptimus

連結：https://news.miracleplus.com/share_link/18879

隨著法國新創企業生態系統的持續繁榮，例如 Mistral、Poolside 和 Adaptive。 2 月 20 日，總部位於巴黎的 Biooptimus 在獲得 3,500 萬美元的種子輪融資後，從隱身中脫穎而出，其使命是建立第一個用於生物學的通用人工智慧基礎模型。新的開放科學模型將把不同規模的生物學與生成人工智慧連接起來——從分子到細胞、組織和整個生物體。 Bioptimus 聯合了一個由Google DeepMind alumni 和Owkin 科學家組成的團隊，其中AI 生物技術新創公司Owkin 本身就是一家法國獨角獸，他們將利用AWS 計算和Owkin 的數據生成功能，並訪問來自全球領先學術醫院的多模態患者數據。