KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation MCP

Gemini API führt implizites Zwischenspeicherfeature ein, das Entwicklerkosten um 75% reduziert

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · May 9, 2025

Die Gemini-API hat eine implizite Zwischenspeicherungsfunktion eingeführt, die Entwicklern bedeutende Kostenoptimierungserfahrungen bietet. Diese neue Funktion erfordert nicht, dass Entwickler manuell einen Cache erstellen; wenn Anfragen gemeinsame Präfixe mit früheren Anfragen teilen, wird der Systemcache automatisch getriggert und maximal bis zu einem 75%-igen Rabatt auf Tokens gewährt. Diese Aktualisierung betrifft nun die Gemini 2.5 Pro- und 2.5 Flash-Modelle und verbessert weiter die Wirtschaftlichkeit von KI-Entwicklung. Für weitere Details siehe den offiziellen Link: https://developers.googleblog.com

Kernmechanismus: Automatische Zwischenspeicherung und dynamische Rabatte

Die implizite Zwischenspeicherungsfunktion identifiziert gemeinsame Präfixe in Anfragen und nutzt automatisch bereits verarbeitete Kontextdaten wieder, um redundanten Token-Verbrauch zu reduzieren. Beispielsweise benötigen Entwickler bei der Erstellung von Chatbots oder Code-Analyse-Tools oft wiederholte Systemanweisungen oder große Datensätze. Die implizite Zwischenspeicherung kann diese Inhalte automatisch speichern und mit geringeren Kosten aufrufen. AIbase weiß, dass Google empfiehlt, feststehenden Inhalt am Anfang der Anfragen und dynamischen Inhalt (wie Benutzerfragen) am Ende zu platzieren, um die Trefferrate des Caches zu erhöhen. Feedback aus sozialen Medien zeigt, dass Entwickler die Automatisierung und die Kostenersparnis dieser Funktion sehr schätzen.

Technische Details und Vorteile für Entwickler

Nach offiziellen Angaben wurde die minimale Token-Anforderung für die implizite Zwischenspeicherung deutlich gesenkt; die Gemini 2.5 Flash benötigt 1024 Tokens, und die 2.5 Pro benötigt 2048 Tokens, was ungefähr 750 bis 1500 Wörter entspricht, und erhöht somit die Wahrscheinlichkeit, dass der Cache getriggert wird. Entwickler müssen keine zusätzliche Konfiguration vornehmen, um die Rabatte zu nutzen, und die zurückgegebene usage_metadata der API zeigt die Anzahl der zwischengespeicherten Tokens (cached_content_token_count) klar an, um Rechnungsabrechnung transparent zu halten. Darüber hinaus behält Google die explizite Zwischenspeicher-API für Szenarien bei, in denen Sicherheit bei Kostenersparnissen erforderlich ist. Das AIbase-Redaktionsteam glaubt, dass die Einführung der impliziten Zwischenspeicherung Entwicklungsteams mit kleinem und mittlerem Budget eine niedrigere Schwelle für KI-Entwicklungsmöglichkeiten bietet.

Anwendungsszenarien und Branchenwirkung

Die implizite Zwischenspeicherungsfunktion eignet sich besonders gut für hochfrequente repetitiv-kontextuelle Szenarien, wie z. B.:

Individuelle Chatbots: keine wiederholten langen Prompt-Sendungen notwendig, dadurch Operationskosten reduziert;

Codebibliotheken-Analyse: effizient repetitiven Anfragen für große Codebibliotheken nachgehen;

Dokumentenverarbeitung: Beschleunigen Sie Frage-Antwort- oder Zusammenfassungsaufgaben für lange Dokumente.

AIbase beobachtet, dass diese Aktualisierung der Gemini-API im Moment kommt, als die Wettbewerbsintensität bei KI-Entwicklungskosten zunimmt, wobei Wettbewerber wie OpenAI und Anthropic ihre API-Preise ebenfalls optimieren. Google stärkt durch die implizite Zwischenspeicherung die Kostenwirksamkeit und Benutzerfreundlichkeit von Gemini weiter. Sozialmedien-Diskussionen zeigen, dass diese Funktion möglicherweise mehr Entwickler dazu motiviert, Gemini in Produktionsumgebungen zu integrieren, insbesondere in budget敏感-Projekten.

Eine Revolution in den KI-Entwicklungskosten

Die Veröffentlichung der impliziten Zwischenspeicherung der Gemini-Markenmarke markiert einen Schritt in Richtung größerer Effizienz und Wirtschaftlichkeit in der KI-Entwicklung. Das AIbase-Redaktionsteam prognostiziert, dass sich die Gemini-API mit der weiteren Optimierung des Zwischenspeichermechanismus (wie Latenzzeit-Reduzierung oder Erweiterung der Zwischenspeicherungsszenarien) breiter in Chatbots, RAG-Systemen und multimodalen Anwendungen etablieren wird. In Zukunft könnte die implizite Zwischenspeicherung mit anderen Funktionen (wie Codeausführung oder multimodaler Verarbeitung) kombiniert werden, um die Produktivität der Entwickler weiter zu steigern.

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe