MITとGoogleが共同で開発したStableRep技術は、AIによって生成された画像を用いて、効率的なAIモデルの学習を行う技術です。
この技術は目覚ましい成果を上げていますが、処理速度が遅い、意味が一致しないといった課題も存在します。基盤となるモデルには、現実世界のデータによる学習が不可欠です。
StableRep技術はGitHubでオープンソースとして公開されており、商用利用も可能です。ただし、画像生成には時間がかかり、コストが高くなる可能性があります。
モデルの訓練・評価・テスト用大規模データセット・ベンチマーク
ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート
MITとGoogleが共同で開発したStableRep技術は、AIによって生成された画像を用いて、効率的なAIモデルの学習を行う技術です。
この技術は目覚ましい成果を上げていますが、処理速度が遅い、意味が一致しないといった課題も存在します。基盤となるモデルには、現実世界のデータによる学習が不可欠です。
StableRep技術はGitHubでオープンソースとして公開されており、商用利用も可能です。ただし、画像生成には時間がかかり、コストが高くなる可能性があります。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
アリババグループは業界初の高性能な拡散言語モデル推論フレームワークであるdInferをオープンソースで公開し、推論速度を著しく向上させました。ベンチマーキングテストによると、これはNVIDIAのFast-dLLMよりも10.7倍高速で、HumanEvalコード生成タスクにおいて単一の推論で1秒間に1011トークンを処理でき、技術の実用化を前進させています。
Metaが思考機械ラボの共同創設者であるアンドリュー・タロックを引き抜いたことにより、業界が注目している。タロックはミラ・ムラティと共同でこのラボを設立し、ムラティはOpenAIを離れたことで話題になっている。今回の出来事はラボに影響を与え、Metaの創業者ザッカーバーグがAI分野に継続的に投資していることを示している。
シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLオープンソースモデルがリリースされました。このモデルは視覚的理解、時系列分析、マルチモーダル推論において顕著な進歩を遂げています。画像のぼけや動画の複雑さなどの課題に対処することができ、視覚認識能力を向上させ、32言語のOCR機能をサポートし、弱い視覚情報の正確な処理が可能となり、ユーザーが複雑な視覚タスクを簡単に処理できるようにします。
Radical Numericsは30Bパラメータのオープンソース拡散言語モデルRND1-Baseをリリースし、スパースエキスパート混合アーキテクチャを採用しており、3Bパラメータのみがアクティブ化されている。このモデルは並列生成の利点を持ち、ベンチマークテストでのパフォーマンスが優れている。また、完全な重みとトレーニングプロセスを公開し、拡散モデル技術の発展を推進している。
OpenAIがSora2をリリースし、5日間でダウンロード数が100万を超えた。App Storeの無料ランキングで首位を獲得し、成長率はGPTを上回っている。前バージョンと比べて、文書理解能力が顕著に向上し、簡単なキーワードから音声と画像が同期した完全な動画を自動生成できる。手動での吹き替えやBGMの追加は必要ない。ショートビデオ、広告、短編ドラマ、MVおよびアニメ制作に適用可能である。
OpenAIはマレーシアでChatGPT Goのサブスクリプションサービスを提供し、月額は約9.25ドルであり、AIの利用ハードルを大幅に低下させます。このサービスにはGPT-5モデルや画像生成、ファイルアップロード、記憶機能などの豊富な機能が含まれており、ユーザー体験を向上させます。この取り組みは、當地で急速に増加する中堅層ユーザーおよび学生層を引きつけることを目的としています。
10月13日、アリグループが高性能拡散言語モデル推論フレームワークdInferをオープンソース化。NVIDIA Fast-dLLMより10.7倍高速で、HumanEvalタスクでは1011Tokens/秒を達成。拡散モデルが自己回帰モデルを初めて上回った。....
AI検索ツールPerplexityのCEOであるスリニヴァサは、伝統的なPPTでの資金調達プレゼンをやめ、AIを活用して投資家向けのプレゼンテーションを行っていると語った。彼はAラウンドの資金調達で一度だけスライドを作成し、以降はAI技術によりプロセスを簡素化しており、これは人工知能がビジネス活動に与える革新の影響を示している。(140文字)
オープンAIの最近の取引により株式構造が複雑化し、投資家はリターンへの懸念を抱えています。企業の評価額は5000億ドルに達し、世界で最も価値のある非上場企業となっています。主な要因はNVIDIAやAMDとの数十億ドル規模のチップ契約であり、資金は1京ドル規模の計算力展開目標に向けて使用される予定です。
AnthropicはClaude Codeのプラグインシステムをリリースし、現在公開ベータテストを開始しました。このシステムでは、VS Codeのように開発者がカスタマイズ可能なツールをサポートし、4つのコアコンポーネントにより効率を向上させ、スラッシュコマンドにより一般的な操作を迅速に実行でき、作業プロセスを簡略化します。