研究者らは、補間技術を用いてオープンソース言語モデルLLaMAのコンテキストウィンドウを10倍、約32,000トークンに拡大し、新しいオープンソース言語モデルGiraffeを開発しました。
このモデルは、数十ページのテキストを扱う商業アプリケーションに適しており、大規模コンテキスト言語モデルの研究に重要な知見を提供します。しかし、研究では現在の技術の限界も指摘されており、長いコンテキストのタスクのパフォーマンスを測定するには、カスタムテストが必要であると結論付けています。
研究者らは、補間技術を用いてオープンソース言語モデルLLaMAのコンテキストウィンドウを10倍、約32,000トークンに拡大し、新しいオープンソース言語モデルGiraffeを開発しました。
このモデルは、数十ページのテキストを扱う商業アプリケーションに適しており、大規模コンテキスト言語モデルの研究に重要な知見を提供します。しかし、研究では現在の技術の限界も指摘されており、長いコンテキストのタスクのパフォーマンスを測定するには、カスタムテストが必要であると結論付けています。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
北京市人工知能産業投資基金は、昨年の投資実績を基に、智譜(Z.ai)に2億元を追加投資することを発表しました。これは、智譜のオープンソースモデルの研究開発とオープンソースコミュニティのエコシステム構築を支援するためです。智譜は、同基金設立以来初のAI大規模モデル企業への投資先であり、現在最も急速に成長している企業でもあります。智譜は、テキスト、推論、音声、画像、ビデオ、コードなど、幅広いモデル能力を有しており、商業化体制も整っています。また、100万人を超える開発者コミュニティと企業ユーザーを抱えています。
北京市人工知能産業投資基金は先日、北京智譜華章科技股份有限公司(以下、智譜)に2億元人民元の追加投資を行うと発表しました。基金によると、智譜は同基金設立以来初のAI大規模モデル企業への投資先であり、現在最も急速に成長している企業の一つです。智譜は、テキスト、推論、音声、画像、ビデオ、コードなどの分野におけるモデル構築において深い蓄積を有しており、同時に充実した商業化体制を構築し、100万人を超える開発者コミュニティと企業ユーザー基盤を確立しています。今回の投資は、更なる…
智譜テクノロジーチームは、32Bと9BシリーズのGLM(General Language Model)モデルをオープンソース化し、新しいインタラクティブエクスペリエンスプラットフォームZ.aiを正式にローンチしたことを発表しました。このシリーズのモデルには、基盤モデル、推論モデル、熟考モデルが含まれており、いずれも緩やかなMITライセンスに従い、開発者に大きな使用と開発の自由度を提供します。商業利用や自由な配布も無料で可能です。
先日、Meta社が公開したオープンソースの大規模言語モデルLlama-4-Maverickが、LMArenaのランキングで2位から32位に急落し、開発者から不正疑惑の声が上がっています。Metaが特別なバージョンを提出してランキングを操作した可能性が指摘されています。発端は4月6日、Metaが最新のLlama4(Scout、Maverick、Behemothの3バージョン)を発表したことでした。その中のLl...
人工知能(AI)モデルの進化は目覚ましく、技術開発者はその性能向上に努める一方、ユーザーはモデルの性能の真偽について疑問を抱いています。この問題に対処するため、ジェフリー・ヒントン(Geoffrey Hinton)氏が設立したベクター研究所は、人工知能研究のための「評価現状研究」を発表しました。この研究では、インタラクティブなランキングを通じて、11個の最先端のオープンソースとクローズドソースのモデルを包括的に評価し、数学、一般知識、コーディングなどを網羅しています。
最近、AIコード生成分野ではオープンソース化の波が押し寄せ、多くの重量級モデルが続々と登場しています。その中でも、Deep Cogitoが発表したCogito v1 Previewシリーズは特に注目を集めています。AIbaseの情報によると、この新しいオープンソースモデルファミリーは、3B、8B、14B、32B、70Bなど、様々な規模のモデルを含んでおり、性能において同等の競合製品を全面的に凌駕するだけでなく、70BバージョンのモデルはMetaが最近発表したLlama 4 109B MoEモデルをも上回り、業界で話題となっています。
先日、Google Cloud Platformは、Vertex AI Model GardenにMetaの最新世代のオープンソース大規模言語モデルLlama 4を正式に導入したと発表し、世界中のテクノロジー業界で大きな話題となっています。Llama 4シリーズのScoutとMaverickの2つのモデルがVertex AIに統合され、完全にマネージドされたモデル・アズ・ア・サービス(MaaS)APIエンドポイントを通じて開発者向けにプレビュー公開されたとのことです。この機能により、