非営利機関FutureHouseがAI研究システムKosmosを推出した。12時間で1500編の論文の読解、4万2千行のコード生成および引用レポート作成が可能で、人間チームの6か月分の効率に相当し、出力精度は79.4%である。このシステムは構造化された世界モデルを使用し、並列処理によって検索、分析、検証を処理しており、7つの先端的な発見を再現し成功させた。
FutureHouseがAI研究システム「Kosmos」を発表。12時間で1500本の論文処理、4.2万行のコード生成が可能で、人間チームの半年分の作業量に相当。構造化世界モデルを基に、神経科学分野で7つの発見(内4つが初報告)を達成。自律的な文献検索・知識グラフ更新・計画反復を実現。....
世界規模に対応したマルチモーダル大規模言語モデル
microsoft
Kosmos-2.5はテキスト密集画像の機械読解に向けたマルチモーダルリーディング・ライティングモデルで、画像内のテキスト認識と構造化出力を処理できます。
Mit1208
これはマイクロソフトのKosmos-2モデルを微調整したマルチモーダルモデルで、ポケモンカードのポケモン名を識別するために特別に設計されています。
ishaangupta293
Kosmos-2はマルチモーダル大規模言語モデルで、視覚情報と言語理解を統合し、画像からテキストへの変換や視覚的位置特定タスクを実現します。
Kosmos-2はマルチモーダル大規模言語モデルで、画像に関連するテキスト記述を理解・生成し、テキストと画像領域の関連付けを実現します。
ydshieh
Kosmos-2はマルチモーダル大規模言語モデルで、言語モデルと現実世界の視覚要素をアンカリングし、さまざまな視覚-言語タスクをサポートします。