AI2は、大規模言語モデルの研究開発を促進するため、オープンソースの言語モデルフレームワーク「OLMo」を発表しました。
このフレームワークは、Hugging FaceとGitHub上で、トレーニングコード、モデル、評価コードを提供しており、学術界や研究者による言語モデルに関する共同研究を可能にします。具体的には、新しい事前学習データセットが下流タスクのパフォーマンスに与える影響の調査や、新しい事前学習方法と安定性の研究などが含まれます。
AI2は、大規模言語モデルの研究開発を促進するため、オープンソースの言語モデルフレームワーク「OLMo」を発表しました。
このフレームワークは、Hugging FaceとGitHub上で、トレーニングコード、モデル、評価コードを提供しており、学術界や研究者による言語モデルに関する共同研究を可能にします。具体的には、新しい事前学習データセットが下流タスクのパフォーマンスに与える影響の調査や、新しい事前学習方法と安定性の研究などが含まれます。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
Googleは控えめながら、Hugging FaceプラットフォームのオープンソースAIモデルをスマートフォン上で直接実行できる実験的なアプリ『Google AI Edge Gallery』を発表しました。ネットワーク接続なしで画像生成、テキスト処理、コード編集などの機能を提供するこのアプリは、エッジコンピューティングとプライバシー優先のAI展開において重要な一歩です。LiteRTによるGoogleのローカライズされたAIは、大きなマイルストーンとなっています。
最近、MetaのFAIRチームとエルサレムのヘブライ大学の研究者たちによって新しい研究成果が発表されました。この研究では、大規模な言語モデルの推論時間を短縮することで複雑な推論タスクでのパフォーマンスが著しく改善されることを示しています。研究結果によると、短い理論プロセスを持つAIモデルの正確性は34.5%向上し、現在のAI業界の仮説を挑戦しています。画像出典: 画像はAI生成され、画像提供サービスのMidjourney。本研究において、著者は長時間の思考が
先日、グーグルはオープンソースフレームワークのLMEvalを正式にリリースしました。これは大規模言語モデル(LLM)やマルチモーダルモデルに対する標準化された評価ツールを提供することを目指しています。このフレームワークの発表により、プラットフォーム間でのモデル性能の比較が簡素化され、テキスト、画像、コードなど複数分野の評価をサポートしており、グーグルによるAI評価分野における最新の進展が示されています。AIbaseがLMEvalの最新動向とそのAI業界への影響についてまとめました。標準化された評価: プラットフォーム間モデル比較がさらに簡単になりました
プログラムナーたちにはまた新たなツールを歓迎する理由が増えました!OpenHands、イェール大学、南カリフォルニア大学、スタンフォード大学の研究チームによって作成されたLocAgentは、専用にソースコードの位置特定を目指して設計されたグラフインデックス型の大規模言語モデル(LLM)エージェントフレームワークです。注目に値するのは、LocAgentのコード位置特定の正確さが92.7%に達したことで、これは2025年のACLカンファレンスで正式に発表されます。プログラマーたちは仕事の中でしばしばコードの問題を見つけ出すことが難しいことに悩まされることがあります。例えば
中国石油天然气集团公司(CNPC)は正式に、北京で 3 兆のパラメーターを持つ新しい大規模言語モデル「昆仑」をリリースしました。この重要な成果は…
ミストラル社は最近、新たなAgents APIのリリースを発表しました。これは開発者向けのフレームワークで、AIエージェントの作成を簡素化します。エージェントは多岐にわたるタスクを実行可能で、Pythonコードの実行、画像生成、検索補助生成(RAG)などが含まれます。このAPIの導入により、大規模言語モデル(LLMs)が複数のツールやデータソースと構造化され、永続的な方法で相互作用できる環境が提供されます。Agents API