ComfyUI-SUPIRは、ComfyUI用に設計されたSUPIRアップスケーリングラッパーです。画像の品質と解像度を向上させることを目的としています。SUPIR技術により、ユーザーは簡単に画像とビデオの高忠実度アップスケーリングを実現できます。このチュートリアルでは、インストール方法と主要な機能を説明し、カスタマイズオプションを提供します。ユーザーは必要に応じて、最適なアップスケーリング効果を得るために、さまざまなモデルとパラメーターを選択できます。
関連AIニュースの推奨

グーグル DeepMind が MoR アーキテクチャを発表:大規模言語モデルの効率を大幅に向上させる可能性
DeepMindがMoRアーキテクチャを開発。動的トークンルーティングと再帰的深さ割り当てで効率化し、360M規模以上でTransformerを上回る性能を達成。選択的キャッシュでメモリ負荷低減、大規模言語モデル向け効率的ソリューションを提供。....

百度がTizzy.aiをリリース:広告なしのスマート検索アシスタント。映画・テレビコンテンツを一括で確保
百度が新規AI検索アシスタントであるTizzy.aiをリリースしました。広告なしのスマート検索体験を提供します。このアプリは百度の大規模モデルに基づいて開発され、インターフェースはシンプルで、検索とリソースベースへのアクセスのみを残しています。コア機能にはスマート検索、深層思考、リソース検索が含まれ、自動的で迅速な応答と深層推論の2つのモードをサポートしています。特にネット全体の映画・テレビコンテンツを統合し、映画、テレビドラマ、ショートドラマの専用エリアを提供し、再生にジャンプしたり、倍速再生にも対応しています。ワンストップのスマートアシスタントとして、情報検索の正確性に加え、学習や意思決定の補助も可能です。百度がAI分野で新たな突破を遂げたことを示しています。

百度AIアシスタントがビデオ通話機能を提供し、リアルタイムでビデオコミュニケーションを実現
百度AIアシスタントが「ビデオ通話」新機能をリリース。百度APPでAIとリアルタイムビデオ交流が可能に。生活探索、服装アドバイス、ペット行動分析、感情ケアの4シーン対応。方言認識もサポートし、高齢者も簡単利用可。AIアシスタントが生活パートナーへ進化。....

Claudeが大幅アップデート!MCPツールディレクトリに一括接続してAIワークフローの効率が向上
Claude AIが大幅に更新され、外部ツールと連携可能な「アプリ&ツールディレクトリ」機能を追加。MCPプロトコルでAsana、Notion、GitHubなどとシームレス接続。AI統合のハードルを低下させ、業務効率化を促進。....
美図RoboNeoリリース:一言で写真編集とウェブサイト構築が可能に。AI画像処理が全ジャンル対応の時代へ
美图のAIツール「RoboNeo」は、画像編集、ブランドデザイン、Web制作などを自然言語で操作可能。商用写真のレタッチからロゴ・店舗デザイン、EC向け動画作成まで対応。中小企業向けに5分で複数素材を生成可能。AI画像処理のハードル低下を推進。....

グーグルVeo3が画像から動画への変換機能を追加し、7週間以内にユーザーが4000万を超える動画を作成

Kiling AIがKitu 2.1モデルを発表:画像生成能力が大幅に向上し、180種類のスタイルをサポート

vivo 新マルチモーダルモデル登場 AI がGUIインターフェースを理解する能力がさらに向上!
vivoが新たに開発したBlueLM-2.5-3BはGUI理解能力を持つマルチモーダルモデル。2.9Bパラメータで、長短思考モードをサポート。20以上の評価で優れた性能を示し、特にGUI理解と論理推論に強み。効率的なトレーニングにより低コスト運用を実現。....

AIを活用したユーザー行動のシミュレーション ブロクが開発者にとってアプリ体験を向上させる
ブロクはAIテストツールに特化したスタートアップ企業で、イノベーティブな技術によりユーザーの役割をシミュレートし、アプリのテストを行うことで、開発者がユーザー行動を事前に予測するお手伝いをします。創業チームは経験豊富な起業家から構成されており、750万ドルの資金調達を成功させています。従来のテストツールと比較して、ブロクはより前向きなアプローチを取り、コード作成前に改善点を提案できます。現在製品は内側テスト段階であり、テスト精度が求められる金融や医療などに対して主にサービスを提供しています。今年度中に数百万ドルの収益を実現する予定です。

マイクロソフトが新しくPhi-4-miniバージョンをリリース:推論効率が10倍に向上し、ノートブックにも簡単に適合
マイクロソフトがPhi-4-mini-flash-reasoningモデルをオープンソースで公開しました。エッジデバイス向けに設計されており、推論効率が10倍に向上しています。イノベーティブなSambaYアーキテクチャを採用し、効率的なメモリ共有を実現しており、長文生成や数学的推論で優れた性能を発揮します。ベンチマークテストでは長いコンテキストの理解能力が優れており、Phonebookタスクでの正確度は78.13%です。このモデルは教育・研究の分野に適しており、単一のGPUで動作可能です。