AI業界では、大規模言語モデル(LLM)を巡る激しい競争が勃発しています。Falcon-40BがLlamaを抜き、オープンソースLLMランキングで首位を獲得しました。
この記事では、NLP(自然言語処理)分野を一変させたTransformerアルゴリズムの歴史を振り返ります。競争はもはやエンジニアリングの問題となっており、オープンソースモデルの競争はますます激化しています。
世界各国がこぞって大規模モデル開発競争に参加し、AI分野は新たなブームを迎えています。
AI業界では、大規模言語モデル(LLM)を巡る激しい競争が勃発しています。Falcon-40BがLlamaを抜き、オープンソースLLMランキングで首位を獲得しました。
この記事では、NLP(自然言語処理)分野を一変させたTransformerアルゴリズムの歴史を振り返ります。競争はもはやエンジニアリングの問題となっており、オープンソースモデルの競争はますます激化しています。
世界各国がこぞって大規模モデル開発競争に参加し、AI分野は新たなブームを迎えています。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
本日開催されたHUAWEIのスマートウエアラブルと運動健康に関する新製品技術説明会において、Huaweiはその最新フラッグシップ製品である— Huawei WATCH 5スマートウォッチを正式に発表しました。このウォッチはデザイン面で引き続きファッション性とテクノロジー感を追求しているだけでなく、機能面でも画期的な技術革新を行っています。特に運動・健康分野において、HUAWEI WATCH 5は2つの強力なAI大規模モデル—PanguモデルとDeepSeekモデルにアクセスします。これらのモデルの導入により、ウォッチの音声インタラクションや運動・健康管理などでのパフォーマンスが向上します
先ごろ、小米社が開発したMiMo-VLマルチモーダルモデルがMiMo-7Bの後を引き継ぎ、複数の分野で強力なパフォーマンスを示しています。このモデルは画像、動画、言語の汎用的な質問応答や理解推論などのタスクにおいて、同等サイズのベンチマークとなるQwen2.5-VL-7Bよりも大きくリードしており、GUI Groundingタスクのパフォーマンスは専用モデルと互角以上に達しており、エージェント時代の到来に備えています。
オープンソース大規模モデルの分野で再び重大なニュースが飛び込んできました。DeepSeekプラットフォームは最近、控えめにR1モデルの最新版0528をリリースしました。この動きはAI開発者コミュニティにおいて広範な注目を集めています。興味深いことに、DeepSeekは控えめなリリース戦略を取り、詳細な技術仕様書も公開せず、任何形式のリリースイベントも行わずに、モデルのダウンロードだけを静かに行いました。従来の慣例に従って、公式には近いうちに完全なモデルカードがリリースされる予定であり、その時点で新しいバージョンの機能と特長に関するさらなる情報が明らかになる予定です。
このほど、清華大学、テンセント・ハウン、スタンフォード大学およびキャロライナ州立大学の研究チームによって、多模態大規模モデルの視覚推論能力をテストする新しい評価基準「RBench-V」が発表されました。この基準の登場により、現在の評価システムにおけるモデルの視覚出力能力に関する空白を埋め、既存モデルの性能をより包括的に理解できるようになります。「RBench-V」の基準テストには、幾何学とグラフ理論、力学と電磁気学、マルチターゲット認識と経路計画など、複数の分野から803問の問題が含まれています。