2月21日日刊大型模型コレクション

情報2ひと月前发布 AIWindVane
4 0
2月21日日刊大型模型コレクション

【2月21日日刊大型模型コレクション】20分で基板の組み立てがわかる! オープンソースの SERL フレームワークの精度制御成功率は 100%、その速度は人間の 3 倍です; Sora の新しいビデオは TikTok にのみ投稿されます: OpenAI は 4 日間で 10 万人のファンを獲得しました; Karpathy の新しいビデオが再び人気です: GPT Tokenizer をゼロから構築; LIama2 の実行には 8,400 万元が必要、最速の AI 推論チップのコスト見積もりが白熱した議論を巻き起こした


20 分で回路基板の組み立てを学びましょう! オープンソースの SERL フレームワークは 100% の精度制御成功率を誇り、人間の 3 倍の速度を誇ります。

 

リンク: https://news.miracleplus.com/share_link/18873

近年、ロボットの強化学習技術の分野では、四足歩行や掴み、器用な操作など大きな進歩が見られますが、その多くは実験室での実証段階にとどまっています。 ロボット強化学習テクノロジーを実際の運用環境に広く適用するには、依然として多くの課題があり、実際のシナリオでの適用範囲がある程度制限されます。 強化学習技術の実用化の過程では、報酬メカニズムの設定、環境のリセット、サンプル効率の向上、行動の安全性の保証など、複数の複雑な問題を克服する必要があります。 業界の専門家は、強化学習テクノロジーの実際の実装における多くの問題を解決することは、アルゴリズム自体の継続的な革新と同じくらい重要であると強調しています。 この課題に直面して、カリフォルニア大学バークレー校、スタンフォード大学、ワシントン大学、Google の学者は、強化学習の応用促進に特化した Efficient Robot Reinforcement Learning Kit (SERL) と呼ばれるオープンソース ソフトウェア フレームワークを共同開発しました。実際のロボットにも応用され、広く普及している技術です。

2月21日日刊大型模型コレクション

生物医学分野で 7 言語、7B オープンソース LLM をサポートする初の大規模多言語評価

 

リンク: https://news.miracleplus.com/share_link/18874

大規模言語モデル (LLM) は、ヘルスケアや医学などの専門分野に適用されています。 医療環境向けにカスタマイズされたさまざまなオープンソース LLM がありますが、ジェネリック LLM を医療分野に適用するには依然として大きな課題があります。 最近、フランスのアヴィニョン大学、ナント大学、ゼニドックの研究チームは、生物医学分野向けに調整されたオープンソース LLM である BioMistral を開発しました。この製品は、ミストラルを基本モデルとして使用し、PubMed Central でさらなる事前トレーニングが実行されました。 研究者らは、確立された 10 個の英語による医療質問応答 (QA) タスクからなるベンチマークに対して BioMistral を総合的に評価しました。 量子化およびモデル結合方法によって得られる軽量モデルも検討されます。 この結果は、既存のオープンソース医療モデルと比較して BioMistral が優れたパフォーマンスを示し、独自のモデルと比較して競争上の優位性があることを示しています。 最後に、英語以外の限られたデータの問題に対処し、医療 LLM の多言語汎用化能力を評価するために、ベンチマークが他の 7 つの言語に自動的に翻訳され、評価されました。 これは、医学におけるLLMの初の大規模多言語評価となる。

2月21日日刊大型模型コレクション

OPPO Liu Zuohu: 10 年後も携帯電話は AI の最高のキャリアである

 

リンク: https://news.miracleplus.com/share_link/18875

携帯電話のAI機能はどのように実装すればよいのでしょうか? 過去の時代の最も重要なスマートデバイスのエクスペリエンスはAI時代にアップグレードされるのでしょうか、それとも新しいデバイスに置き換えられるのでしょうか? 数日前、Meizuは従来の「スマートフォン」の新規プロジェクトの開発を中止し、新世代のAIデバイスに全力を注ぐと発表し、小規模な激しい議論を巻き起こした。 これに呼応するかのように、2月20日、携帯電話へのAI機能の搭載に最も積極的な携帯電話メーカーの一つであるOPPOがAI戦略を発表した。 OPPOは非常に早くから携帯電話向けのAI機能を展開してきました。 2020年、OPPOは初の大型AIモデルを発売した。 大型言語モデルがブームとなる2023年に、OPPOはAI携帯電話のレイアウトを決定した。 2024 年初頭に、OPPO はデバイス側で 70 億パラメータの大規模言語モデルを適用できる初の携帯電話である Find X7 をリリースしました。


Sora の新しいビデオは TikTok にのみ投稿されます: OpenAI は 4 日間で 100,000 人のフォロワーを獲得しました

 

リンク: https://news.miracleplus.com/share_link/18876

ソラの新しいビデオは「TikTok限定」になりました。 OpenAI は静かに TikTok に正式に参入し、洗脳サウンドトラックで人々を止めることができなくなりました。狂ったようにファンを魅了し、わずか 4 日間で 10 万人のフォロワーと 50 万件の「いいね!」を獲得しました。これはまだ撮影も宣伝もされていません。の。 A16z パートナーは、これが情報フローに投稿されたら、真実と虚偽を区別する方法がまったくなくなるだろうと叫んだ。

2月21日日刊大型模型コレクション

Karpathy の新しいビデオが再び拡散: GPT Tokenizer をゼロから構築する

 

リンク: https://news.miracleplus.com/share_link/18877

テクノロジーの第一人者である Kapasi 氏が OpenAI を去った後、ビジネスは非常に活発になりました。 いいえ、前足の新しいプロジェクトが立ち上げられたばかりで、後足の新しい教育ビデオが全員向けにリリースされました。今回は、GPT トークナイザー (単語セグメンター) の構築方法を段階的に説明します。今でもおなじみの長さ(たっぷり2時間13分)です。 Tokenizer は、大規模言語モデル パイプライン内の完全に独立したステージです。 これらには独自のトレーニング セットとアルゴリズム (BPE、バイト ペア エンコーディングなど) があり、トレーニングの完了後に 2 つの関数 (文字列からトークンへのエンコード、およびトークンから文字列へのデコード) を実装します。 なぜそれに注意を払う必要があるのでしょうか? Kapasi 氏は、次のように指摘しました。LLM の奇妙な動作や問題の多くは、LLM に遡ることができるからです。

2月21日日刊大型模型コレクション

LIama2の実行には8,400万元がかかり、最速のAI推論チップのコスト見積もりが激しい議論を呼んでいる

 

リンク: https://news.miracleplus.com/share_link/18878

史上最速の大規模モデル推論を達成するには、1,171 万米ドル (8,410 万元) の費用がかかります。 同じプロジェクトの場合、NVIDIA GPU の使用コストはわずか 30 万米ドルです。 最も強力な AI チップの所有権が Groq に変更されたことに関しては、もうしばらくの間、この問題を解決しなければならないかもしれません。 過去 2 日間で、Groq は素晴らしいデビューを果たしました。 「NVIDIAの100倍の費用対効果がある」と言われるチップを採用しており、毎秒500トークンという大規模なモデルを遅延を感じることなく生成できる。 この騒動の後、主に Groq の利点とコストに関して、いくつかの合理的な議論が生まれ始めました。 ネチズンによる大まかな計算によると、デモには 568 個のチップが必要となり、費用は 1,171 万米ドルになります。 Groq のコスト問題に関する議論には、コンピュータ サイエンスの学生、推論サービスも提供するクラウド ベンダー、さらには現従業員と争う元 Groq 従業員も参加しました。

2月21日日刊大型模型コレクション

初の一般的な生物学的 AI モデルの構築を目指し、元 Google DeepMind の科学者が力を合わせて Biooptimus を開発

 

リンク: https://news.miracleplus.com/share_link/18879

フランスのスタートアップ エコシステムが成長を続ける中、Mistral、Poolside、Adaptive などの企業が成長を続けています。 パリに本拠を置くBioptimusは、生物学のための初の汎用人工知能基礎モデルを構築するという使命で、2月20日に3,500万ドルのシードラウンドでステルス状態から浮上した。 新しいオープン サイエンス モデルは、分子から細胞、組織、生物全体に至るまで、さまざまなスケールで生物学と生成 AI を結び付けます。 Bioptimus は、Google DeepMind の卒業生と、AI バイオテクノロジーのスタートアップ自体がフランスのユニコーンである Owkin の科学者のチームと協力して、AWS のコンピューティングと Owkin のデータ生成機能を活用し、世界中の主要な学術病院からのデータにアクセスしています。データ。

2月21日日刊大型模型コレクション
© 版权声明

関連記事

コメントなし

コメントはありません…