量子位が報じたところによると、天工AIインテリジェントアシスタントは、国内初のMoEアーキテクチャを採用した無料のMoE大規模言語モデルアプリをリリースしました。天工2.0大規模言語モデルは、10万トークンを超える超長文コンテキストをサポートし、パフォーマンスを向上させています。AIアシスタントには、マルチモーダル機能、データ分析、インテリジェント検索などの機能が追加され、幅広い分野をカバーしています。ユーザーは、データ分析、流行語百科事典、画像テキスト対話などの機能を体験できます。
関連AIニュースの推奨

従来の枠組みを破る!FUDOKI モデルでマルチモーダル生成と理解がより柔軟で効率的になる
近年、人工知能分野では大きな変革が起こっています。特に大規模言語モデル(LLMs)は、マルチモーダルタスクで顕著な進展を遂げています。これらのモデルは言語の理解と生成の能力において強力な潜在力を示していますが、現時点では大部分のマルチモーダルモデルが依然として自己回帰(AR)アーキテクチャに基づいており、推論プロセスは比較的一辺倒で柔軟性に欠けます。このため、香港大学と華為ノアの箱船研究所の研究チームは、新しいモデルの提案を行いました。それが、この限界を打ち破ることを目指す FUDOKI です。FUDOKI の主な革新点は

小红書が強力に参上!全新オープンソースの大規模言語モデル dots.llm1 が衝撃のリリース!パラメーター量は1420億に達!

Metaチームの研究により判明: 理論プロセスを簡素化することでAIの精度が大幅に向上
最近、MetaのFAIRチームとエルサレムのヘブライ大学の研究者たちによって新しい研究成果が発表されました。この研究では、大規模な言語モデルの推論時間を短縮することで複雑な推論タスクでのパフォーマンスが著しく改善されることを示しています。研究結果によると、短い理論プロセスを持つAIモデルの正確性は34.5%向上し、現在のAI業界の仮説を挑戦しています。画像出典: 画像はAI生成され、画像提供サービスのMidjourney。本研究において、著者は長時間の思考が

グーグルが大規模なアップデート!LMEvalオープンソース評価フレームワークが登場、AIモデルの競争がより透明になります
先日、グーグルはオープンソースフレームワークのLMEvalを正式にリリースしました。これは大規模言語モデル(LLM)やマルチモーダルモデルに対する標準化された評価ツールを提供することを目指しています。このフレームワークの発表により、プラットフォーム間でのモデル性能の比較が簡素化され、テキスト、画像、コードなど複数分野の評価をサポートしており、グーグルによるAI評価分野における最新の進展が示されています。AIbaseがLMEvalの最新動向とそのAI業界への影響についてまとめました。標準化された評価: プラットフォーム間モデル比較がさらに簡単になりました

中国石油天然气集团公司 launch 了拥有 3 兆参数的大规模语言模型昆仑,推动整个石油价值链的智能化
中国石油天然气集团公司(CNPC)は正式に、北京で 3 兆のパラメーターを持つ新しい大規模言語モデル「昆仑」をリリースしました。この重要な成果は…

ミストラル、新しいAgents APIを発表:開発者がスマートAIエージェントを構築を支援
ミストラル社は最近、新たなAgents APIのリリースを発表しました。これは開発者向けのフレームワークで、AIエージェントの作成を簡素化します。エージェントは多岐にわたるタスクを実行可能で、Pythonコードの実行、画像生成、検索補助生成(RAG)などが含まれます。このAPIの導入により、大規模言語モデル(LLMs)が複数のツールやデータソースと構造化され、永続的な方法で相互作用できる環境が提供されます。Agents API

創造的な拡散思考チェーン: 人工知能をより創造的で柔軟なものに

DMindがWeb3AI革命をリード:専門的なブロックチェーン大規模言語モデルDMind-1シリーズを発表
人工知能とブロックチェーン技術の融合が加速する重要なタイミングで、オープンソースAGI研究機関のDMindはその革新的なWeb3専用言語モデルで業界変革をリードしています。同機関は最近、専門分野向けの大規模言語モデルであるDMind-1およびDMind-1-miniの2つのモデルを発表しました。これらはブロックチェーン、デencentralized finance(DeFi)、スマートコントラクトなどのWeb3シナリオに特化して深い最適化が施されています。専門的なAIモデルの技術革新 DMind-1シリーズのモデルは、垂直分野でのAI技術の重要な進展を象徴しています。

MLX-LMとHugging Faceがシームレスに統合され、Apple Siliconデバイスで大言語モデルを効率的に実行を支援

大規模言語モデルにも記憶障害がある?Supermemoryが無限記憶プラグインを発表 AIの記憶を永遠に保つ!
ChatGPTやClaudeなどの大規模言語モデルとの長時間の対話中に、以前の対話内容を突然忘れてしまう経験はありませんか?これはAIが意図的にそうしているわけではなく、大規模言語モデルが持つ基本的な文脈ウィンドウ制限によるものです。8k、32k、128kトークンという容量に関わらず、その閾値を超えると前の対話内容は切り捨てられ忘れられ、インタラクション体験が大幅に損なわれます。最近、スーパーメモリーという会社が革命的な技術を発表しました——インフィニ(Infin)