アップルのSafariチーフデザイナー、Marco Triverio氏がThe Browser Companyに移籍し、業界の注目を集めている。彼はiOSとmacOS版Safariの設計を主導し、プライバシー制御やタブ管理などの核心機能に大きく貢献した。この人材流出は、アップルデザインチームにとって新たな損失と見られている。....
Google Gemini 3 ProがLMArena史上最高の1501 Eloを記録し、GPT-5.1などを超え多モデル首位に。科学・数学・映像タスクで卓越し、『人類究極試験』37.5%、GPQA Diamond 91.9%を達成。Deep Thinkモードで推理力を強化、ARC-AGI-2テストで45.1%を獲得。....
AIブラウザーDiaはArcブラウザーのサイドバーを継承し、AI記憶・エージェント機能を統合。Arcの実験的要素を発展させ、The Browser Companyが開発を確認した革新的ブラウザー。....
Arcブラウザ後継「Dia」がmacOSに登場。AI統合で閲覧・タスク操作を革新。M1チップ以上対応、無料版とPro版(月20ドル、14日試用可)を提供。....
AI駆動型のチャートジェネレーターで、アイデアを素早く明確なチャートやインフォグラフィックに変換します。
AI駆動のグラフ生成ツールで、迅速にアイデアを明瞭なグラフやインフォグラフィックに変換し、カスタマイズして共有できます。
DialLinkは使いやすいクラウド電話システムで、中小企業やスタートアップ企業にAI音声エージェント機能を提供し、電話を自動化して顧客満足度を向上させ、成長を促進します。
一度のパスで超リアルな会話を生成できるTTSモデル。
Alibaba
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Minimax
Stepfun
Chatglm
Sachin-0001
これは🤗 Transformersライブラリに基づく双方向自己回帰Transformerモデルで、モデルセンターにアップロードされています。モデルカードはシステムによって自動生成され、具体的な技術詳細とアプリケーション情報はさらに補足する必要があります。
nari-labs
Dia2はNari Labsによって開発されたストリーミング対話テキストを音声に変換する(TTS)モデルで、リアルタイム音声生成をサポートし、完全なテキストがなくても音声生成を開始でき、対話のコンテキストに応じて調整し、自然でスムーズな対話体験を実現します。
Dia2はNari Labsによって開発されたストリーミング対話テキスト音声変換(TTS)モデルで、リアルタイム音声生成をサポートし、完全なテキストがなくても音声生成を開始でき、自然な対話シーンに特化して設計されています。
mradermacher
これはdiabolic6045/Sanskrit-qwen-7B-Translate-v2に基づく量子化バージョンで、専門的に梵語の翻訳と転写タスクに使用されます。複数の量子化タイプを提供し、英語から梵語への翻訳と転写をサポートし、IASTと天城文の2種類の形式を含みます。
calcuis
nari-labs/Dia-1.6Bを基にしたテキスト音声変換モデルで、GGUF量子化形式をサポートし、gguf-connectorツールで実行可能です。
Lorenzob
Aurora-1.6BはDia-1.6Bをファインチューニングした多言語感情・歌唱音声合成モデルで、複数言語と感情制御をサポートし、ゼロショット音色クローン能力を備えています。
mmwillet2
Dia 1.6Bはテキスト音声変換タスクに適したモデルで、複数の量子化バージョンをサポートし、TTS.cppフレームワークと互換性があります。
Dia-1.6Bをファインチューニングした多言語感情・歌唱音声合成モデル、音色クローンと感情制御をサポート
Alissonerdx
Dia 1.6Bテキスト音声変換モデルの微調整版で、ブラジルポルトガル語に特化して最適化
RobAgrees
Diaは16億パラメータのオープンソーステキスト音声変換モデルで、高度にリアルな対話や非言語表現の生成をサポート
mlx-community
Diaはオープンソースのテキストから対話を生成するモデルで、対話テキスト生成と音声合成をサポートします。
Dia-1.6B-6bit は Dia-1.6B を基にした 6 ビット量子化バージョンで、MLX フレームワーク向けに最適化されたテキスト読み上げモデルです。
Dia-1.6B-3bit は mlx-community/Dia-1.6B を基に変換された3ビット量子化モデルで、主にテキストから音声への変換タスクに使用されます。
Dia-1.6B-4bit はMLXフォーマットに基づく4ビット量子化テキスト音声変換モデルで、nari-labs/Dia-1.6Bから変換されました。
thepushkarp
DiaはNari Labsが開発した16億パラメータのテキスト音声合成モデルで、テキストから高度にリアルな対話を直接生成でき、感情やイントネーションの調整および非言語表現の生成をサポートします。
DiaはNari Labsが開発した16億パラメータのテキスト音声合成モデルで、テキストから高度にリアルな対話を直接生成でき、感情やイントネーションの制御をサポートし、非言語コミュニケーション内容も生成可能です。
Diamantis99
PyTorchベースのUnet画像セグメンテーションモデル、複数のエンコーダーアーキテクチャと事前学習済み重みをサポート
PyTorchベースのセマンティックセグメンテーションモデルで、複数のエンコーダーアーキテクチャをサポートし、画像セグメンテーションタスクに適しています。
PyTorchベースのUnet画像セグメンテーションモデルで、複数のエンコーダーアーキテクチャをサポートし、セマンティックセグメンテーションタスクに適しています。
PyTorchベースのセマンティックセグメンテーションモデルで、複数のエンコーダーアーキテクチャをサポートし、画像分割タスクに適しています。
UML - MCP ServerはMCPプロトコルに基づくUMLチャート生成ツールで、自然言語またはPlantUMLコードを通じて複数のタイプのUML図を生成し、MCPをサポートするクライアントに統合できます。
マーメイドチャートをPNG画像に変換するMCPサーバーで、複数のテーマと背景色のカスタマイズをサポートしています。
Google Dialogflow CX用に設計されたMCPサーバーの実装で、AIアシスタントとDialogflow CXの間のシームレスな統合を提供します。
DialogはAI駆動のRedditインテリジェント調査プラットフォームで、意味検索とバッチ処理機能を通じて、ユーザーが市場調査、競争分析、顧客発見を行うのを支援します。Reddit APIの資格情報を必要とせず、2万以上のアクティブなコミュニティにアクセスできます。