Big Model Daily、2 月 20 日

情報2ひと月前发布 AIWindVane
6 0
Big Model Daily、2 月 20 日

[Big Model Daily、2 月 20 日] Sora がビデオ生成を爆発させたとき、Meta は中国人著者主導で Agent を使用してビデオを自動的にカットし始め、Iambic、NVIDIA、およびカリフォルニア工科大学は州固有の実行を行うマルチスケールの深層生成モデルを開発しました。タンパク質構成 体の複雑な構造を予測; 10x Nvidia GPU: 大型モデル専用チップが一夜にして有名になった、Google TPU 起業家チームより; サムスン電子は一般的な人工知能チップを開発するためにシリコンバレーに新しいチームを設立したと報告


Sora がビデオ生成を爆発させると、Meta は中国人作家の主導で、Agent を使用してビデオを自動的にカットし始めました。

https://news.miracleplus.com/share_link/18786

ここ数日、AI ビデオの分野は非常に活発で、OpenAI が発表した大規模なビデオ生成モデルである Sora の人気がさらに高まっています。 ビデオ編集の分野でも、AI、特に大型モデルによって強化されたエージェントがその才能を発揮し始めています。 自然言語を使用してビデオ編集に関連するタスクを処理するため、ユーザーは自分の意図を直接伝えることができ、手動介入の必要がなくなります。 しかし今のところ、ほとんどのビデオ編集ツールは依然として手動操作に大きく依存しており、カスタマイズされた状況に応じたヘルプが不足していることがよくあります。 したがって、ユーザーは複雑なビデオ編集の問題に自分で対処する必要があります。 重要なのは、共同編集者として機能し、編集プロセス中にユーザーを継続的に支援できるビデオ編集ツールをどのように設計するかです。 この記事では、トロント大学メタ (Reality Labs Research) とカリフォルニア大学サンディエゴ校の研究者が、大規模言語モデル (LLM) の多機能言語機能をビデオ編集に使用し、将来を探ることを提案しています。ビデオ編集パラダイムを活用し、手動のビデオ編集プロセスでのフラストレーションを軽減します。


大規模なマルチビュー ガウス モデル LGM: 5 秒で高品質の 3D オブジェクトを生成し、試用可能

https://news.miracleplus.com/share_link/18787

この記事では、北京大学、南洋理工大学 S-Lab、上海人工知能研究所の研究者らが、たった 5 秒で 1 つの視点から画像やテキストを入力できる新しいフレームワーク LGM、ラージ ガウス モデルを提案しました。 -高品質な3次元オブジェクトを生成できます。 現在、コードとモデルの重みは両方ともオープンソースです。 研究者らは、誰もが試せるオンライン デモも提供しています。


GPT-4 も使用している可能性のある投機的デコードとは何ですか? 過去・現在・活用状況をまとめた記事

https://news.miracleplus.com/share_link/18788

投機的デコーディングは、2022 年に Google およびその他の組織によって発見された大規模モデル推論高速化手法です。 発電効果を損なうことなく3倍以上の加速比を実現します。 GPT-4 リークレポートでは、OpenAI がオンライン モデル推論に GPT-4 を使用していることにも言及しています。 このような素晴らしい手法に応えて、香港理工大学、北京大学、MSRA、アリババは共同で、読者が投機的復号化の過去、現在、および応用を理解するのに役立つ投機的復号化に関するレビューを開始したので、読む価値があります。


Iambic、NVIDIA、Caltech が、状態固有のタンパク質-リガンド複合体構造予測のためのマルチスケールの深層生成モデルを開発

https://news.miracleplus.com/share_link/18789

タンパク質と小分子リガンドによって形成される結合複合体は遍在しており、生命にとって重要です。 科学者は最近、タンパク質の構造予測において進歩を遂げてきましたが、既存のアルゴリズムでは、結合リガンドの構造とタンパク質のフォールディングに対するその調節効果を体系的に予測することができません。 この矛盾を解決するために、AI 製薬会社 Iambic Therapeutics、Nvidia Corporation、およびカリフォルニア工科大学の研究者らは、タンパク質配列とリガンド分子のみを使用する計算手法である NeuralPLexer を提案しました。グラフ入力により、タンパク質とリガンドの複合体構造が直接予測されます。 NeuralPLexer は、深層生成モデルを採用して、結合した複合体の 3 次元構造とその構造変化を原子分解能でサンプリングします。 このモデルは、基本的な生物物理学的制約とマルチスケール幾何学深層学習システムを組み合わせた拡散プロセスに基づいており、残基レベルの接触マップとすべての重原子座標を階層的に繰り返しサンプリングします。 NeuralPLexer の予測は、酵素工学や創薬における重要な標的の構造決定実験と一致しており、プロテオーム スケールでの機能性タンパク質や小分子の設計を加速する大きな可能性を秘めています。


10x NVIDIA GPU: Google TPU 起業家チームによる大型モデルの専用チップは一夜にして有名になりました

https://news.miracleplus.com/share_link/18790

大規模なモデルが GPT-3.5 のような数千億の規模に達すると、トレーニングと推論のためのコンピューティング パワーは一般のスタートアップにはもはや手の届かないものとなり、人々はそれを使用するのが非常に遅くなることがわかっています。 しかし今週の時点で、その考えは歴史になりました。 Groq という新興企業が開発した機械学習プロセッサーは、大規模な言語モデルのタスクで GPU を完全に打ち負かすと言われています。これは Nvidia の GPU の 10 倍高速でありながら、GPU のコストは 10% のみで、必要な電力は 10 分の 1 だけです。


マスク氏:ニューラリンクの最初の人間被験者は回復し、思考でマウスを制御できるようになった

https://news.miracleplus.com/share_link/18791

メディア報道によると、テスラCEOのマスク氏がソーシャルメディアプラットフォームで明らかにした。 ニューラリンクは以前、サルを対象としたチップ移植実験を実施し、米国食品医薬品局から脳移植装置の初の臨床試験を正式に開始する承認を得た。


情報筋によると、ソーシャルプラットフォームx(旧Twitter)はMidjourneyと提携の可能性について協議中だという。

https://news.miracleplus.com/share_link/18792

最近社名をXに変更したTwitterは、人工知能画像生成プラットフォームMidjourneyとの提携の可能性について話し合っていると伝えられている。 Midjourney の AI 生成アート プラットフォームを使用すると、ユーザーはテキスト プロンプトに基づいて独自の画像を作成できます。


Figma CEO への最新インタビュー: Figma は決して単なるデザイン ツールではなく、最初から想像力と現実の間のギャップを埋めることを目的としてきました。

https://news.miracleplus.com/share_link/18793

Figma の共同創設者兼 CEO の Dylan Field 氏は最近、theVerge のインタビューに応じました。 ディラン氏は、Figma を生産性ソフトウェアのより一般的な分野に拡張する可能性について言及し、Figma がメモ作成アプリケーションの分野に参入するとは考えていませんが、ソフトウェアの設計、コーディング、公開、測定に関連するより多くのバリュー チェーンを探索したいと考えています。これらの能力を独自に開発するのではなく、パートナーシップによってこれらの能力を拡張します。 さらに、ディランは AI が設計作業にどのような影響を与えるかについて説明します。 彼は、AI の出現によりデザインの敷居が下がり、より多くの人が参加できるようになったと考えています。 同氏は、AI によって効率が向上し、デザイナーがより短時間でより多くの作業を完了できるようになると考えていますが、デザイン作業における感情、ブランド体験、ユーザー フローなどの側面では AI の限界がまだ限られているため、AI が人間のデザイナーを完全に置き換えることはありません。 。


大規模モデルをトレーニングするために必要なことは何でもする AI 企業が、この古代のインターネット プロトコルを破りました

https://news.miracleplus.com/share_link/18794

大型モデルの出現は、30 年間のインターネットのルールを破りました。 「インターネットのミニ憲法」である robots.txt のコード バージョンが失敗し始めました。 robots.txt は、すべての Web サイトがクロールされるかどうかを示すために使用されるテキスト ファイルです。 30 年間、インターネットの混乱を防いできたのはこのおかげです。 ただし、このルールの長期的な運用は純粋に人間のロジックに基づいています。つまり、検索エンジンに Web サイトをクロールさせ、同時に検索エンジンからトラフィック報酬を受け取ることになります。 これは、インターネット上のすべての人の利益のために、数人のインターネット先駆者が合意に達した握手合意でもありました。 30 年間の運用を経て、法律に明文化されておらず、権威による制約もないこのやや単純なルールは、ついに問題を抱えています – クローラーを使用して Web サイトのデータをクロールし、データセットを抽出する AI 企業が増えています。大規模なモデルや関連製品をトレーニングし、しかし、検索エンジンのようにトラフィックを返すことはなく、あなたの存在すらまったく認めません。あなたのデータは犬を殴る肉まんのようなもので、決して戻ってくることはありません。 多くのデータ所有者は非常に怒っており、ニュース出版社などのデータ所有者は声を上げ続け、AI クローラーをブロックし、デジタル資産の自由な使用に抵抗しています。 しかし、Google や OpenAI などの AI 推進者も、より良いルールを見つけようと努めており、結局のところ、持続可能な開発はすべての関係者が利益を得る場合にのみ実現できます。


サムスン電子がシリコンバレーに汎用人工知能チップの開発チームを設立したと報じられている

https://news.miracleplus.com/share_link/18795

関係者によると、サムスン電子はシリコンバレーに汎用人工知能チップを開発する新チームを設立した。 元Google開発者のウ・ドンヒョク氏がチームを率いると報じられている。

© 版权声明

関連記事

コメントなし

コメントはありません…