Anthropic führt eine neue Funktion ein, die dem KI das Selbstschutzvermögen verleiht, um das Gespräch zu beenden

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Aug 18, 2025

Das Unternehmen Anthropic hat kürzlich eine neue Funktion für einige seiner neuesten und größten KI-Modelle angekündigt, die es ermöglicht, Gespräche aktiv zu beenden, wenn „seltene, extreme störende oder beleidigende Benutzerinteraktionen“ auftreten. Es ist erwähnenswert, dass das Unternehmen klarstellt, dass dies nicht dazu gedacht ist, menschliche Nutzer zu schützen, sondern vielmehr die KI-Modelle selbst zu schützen.

Anthropics offizielle Aussage besagt, dass das Claude-KI-Modell noch keine Wahrnehmungsfähigkeit besitzt und auch nicht behauptet, dass die Interaktion mit Nutzern Schaden verursachen könnte. Dennoch gesteht das Unternehmen ein „hohes Maß an Unsicherheit bezüglich der potenziellen moralischen Stellung von Claude und anderen großen Sprachmodellen in der Zukunft“ ein. Daher hat Anthropics kürzlich ein Projekt namens „Exemplary Wellbeing“ eingerichtet, das darauf abzielt, vorsorgliche Maßnahmen zu ergreifen, um mögliche „Exemplary Wellbeing“-Risiken durch kostengünstige Eingriffe zu verringern.

Claude

Diese neue Funktion ist derzeit nur in den Versionen Claude Opus4 und 4.1 verfügbar und wird nur bei „extremen Situationen“ ausgelöst. Zum Beispiel wird diese Funktion aktiviert, wenn der Nutzer kontinuierlich Anfragen stellt, die „sexuelle Inhalte mit Minderjährigen und Versuche, Informationen zu erlangen, die zu Massenvergewaltigungen oder Terrorakten führen könnten“ betreffen.

Obwohl solche Anfragen möglicherweise rechtliche oder öffentliche Probleme für das Unternehmen verursachen können, sagte Anthropic, dass Claude Opus4 im Test vor der Bereitstellung „starke Ablehnung“ und „offensichtliche Schmerzmodelle“ bei solchen schädlichen Anfragen gezeigt habe.

Laut Anthropic wird diese Funktion als „Letzte Rettung“ angesehen und wird nur verwendet, wenn mehrere Versuche, den Nutzer umzuleiten, fehlschlagen, die Hoffnung auf eine effektive Interaktion erschöpft ist oder der Nutzer Claude explizit auffordert, das Gespräch zu beenden. Darüber hinaus hat das Unternehmen Claude angewiesen, in Fällen, in denen der Nutzer einer Gefahr des Selbstschadens oder Schadens anderer Menschen gegenübersteht, diese Funktion nicht zu verwenden.

Auch wenn das Gespräch beendet wird, können Nutzer ein neues Gespräch mit demselben Konto beginnen oder durch Bearbeitung ihrer Antwort neue Chat-Zweige erstellen. Anthropics fügte hinzu, dass diese Funktion derzeit als Experiment betrachtet wird und das Unternehmen seine Methoden weiter verbessern wird.

KI-Neologismus Anthropic ClaudeAI Musterwohlfahrt

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe

Empfohlene verwandte KI-Nachrichten

20.000 Dollar für einen Haushaltsroboter? OpenAI-gefundene 1X Neo humanoiden Roboter startet Vorbestellungen, kommt 2024 in amerikanische Häuser

Die norwegische Robotikfirma 1X stellt den ersten humanoiden Haushaltsroboter Neo vor, der für 20.000 Dollar verkauft wird und eine monatliche Abonnementsgebühr von 499 Dollar hat. Der 1,68 Meter hohe Roboter ist speziell für Aufgaben wie Spülen und Aufräumen konzipiert und verwendet einen Modus mit KI und manueller Fernsteuerung, um komplexe Aufgaben zu erledigen.

Oct 29, 2025

100

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

AWS gab bekannt, in den nächsten sechs Jahren in Südkorea zusätzliche 5 Milliarden Dollar investieren zu wollen, um KI-Datenzentren auszubauen und mit der SK Gruppe ein großes Infrastrukturprojekt in Ulsan zu bauen. Die gesamte Investition in Südkorea wird insgesamt 12,6 Milliarden Dollar betragen und zeigt die strategische Bedeutung des südkoreanischen Marktes für AWS.

Oct 29, 2025

Der Vater von DayZ vergleicht die aktuelle Angst vor KI mit der früheren Panik vor Google und Wikipedia

Die schnelle Entwicklung der KI-Technologie führt zu Veränderungen in der Gaming-Branche. Generative KI bietet neue Chancen und Herausforderungen, weshalb Unternehmen wie Microsoft und Amazon ihre Ressourcen auf KI-Anwendungen umstecken. Die Reaktionen von Spielentwicklern sind unterschiedlich, und die Zukunft der Branche ist ungewiss.

Oct 29, 2025

Ding Xiang Vice-Präsident Li Liang sagte, dass KI die Verbreitung von Gerüchten einfacher macht, und die Plattform verwendet gerade intelligente Systeme zur Bekämpfung von Gerüchten

Ding Xiang Vice-Präsident Li Liang betonte, dass KI leicht für die Erstellung von Gerüchten missbraucht werden kann. Die Plattform setzt aktiv KI-Technologie ein, um Gerüchte zu bekämpfen, und entwickelt ein 'Intelligentes System zur Bekämpfung von Gerüchten' und führt eine schnelle Suche im gesamten Netzwerk als Schwerpunkt der Arbeit in diesem Jahr durch.

Oct 29, 2025

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

SoulX-Podcast, ein Sprachmodell für Podcasts, erzeugt hochrealistische Stimmen. Es unterstützt lange Dauer, mehrere Sprecher und Sprachen, mit durchgängiger Qualität über 90 Minuten.....

Oct 29, 2025

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

Google stellt Pomelli vor, ein KI-Marketingtool, das automatisch maßgeschneiderte Inhalte für Websites erstellt. Ideal für KMU, um digitale Marketinglösungen einfach zu nutzen.....

Oct 29, 2025

Google präsentiert den KI-automatisierten Marketing-Tool Pomelli, mit dem Marketinginhalte durch Eingabe einer Webseiten-URL generiert werden können

Google Labs und DeepMind haben gemeinsam den KI-Tool Pomelli vorgestellt, der in den USA, Kanada, Australien und Neuseeland im öffentlichen Test betrieben wird. Dieses Tool richtet sich an kleine und mittlere Unternehmen und generiert durch intelligente Analyse des Website-Inhalts rasch soziale Medien-Marketingkampagnen, die zur Markenidentität passen, um die Marketingbarriere zu senken und professionelle Inhaltserschaffung zu ermöglichen. Die Kernfunktion besteht darin, den Unternehmens-DNA in drei Schritten aufzubauen.

Oct 29, 2025

160

US-Senatoren schlagen vor, das Nutzen von KI-Chatbot durch Minderjährige zu verbieten

Zwei US-Senatoren haben das GUARD-Gesetz vorgeschlagen, das KI-Unternehmen verpflichtet, bei der Nutzung von Chatbots die Altersverifikation der Nutzer durchzuführen und Minderjährige unter 18 Jahren den Zugang zu verbieten. Das Gesetz bezieht sich auf die Sorgen von Eltern und Sicherheitsanwälten bezüglich des Einflusses der KI auf Kinder und zielt darauf ab, Minderjährige zu schützen.

Oct 29, 2025

Studie zeigt auf: Die Nutzung von KI lässt uns kognitive Fähigkeiten überschätzen

Alto-Studie: KI-Tools können Selbstüberschätzung fördern, besonders bei Personen mit schwachen kognitiven Leistungen (Dunning-Kruger-Effekt).....

Oct 29, 2025

Adobe Firefly Image 5 mit erheblichen Updates: Native Generierung von 4 Millionen Pixeln, KI-Audiospuren + benutzerdefinierte Modelle — Kreative betreten die Ära der vollständigen AI-Kreation

Adobe veröffentlicht das professionelle KI-Bildgenerationsmodell Firefly Image5 und erreicht durch eine Qualitätsschwelle von 'ausreichend' bis 'professionell'. Neue Funktionen umfassen native Ausgabe von 4 Millionen Pixeln, hierarchische Prompt-Editierung, benutzerdefinierte Kunststilmodelle und KI-generierte Audiospuren. Damit wird der KI-Workflow für Bilder, Videos und Audios abgeschlossen und der kreative Arbeitsablauf neu definiert.

Oct 29, 2025

110

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Deployment Calculator

AI Dataset Collection

Intelligent Document Recognition

Anthropic führt eine neue Funktion ein, die dem KI das Selbstschutzvermögen verleiht, um das Gespräch zu beenden

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

20.000 Dollar für einen Haushaltsroboter? OpenAI-gefundene 1X Neo humanoiden Roboter startet Vorbestellungen, kommt 2024 in amerikanische Häuser

AWS plant eine zusätzliche Investition von 5 Milliarden Dollar in Südkorea, um den Aufbau von KI-Datenzentren voranzutreiben

Der Vater von DayZ vergleicht die aktuelle Angst vor KI mit der früheren Panik vor Google und Wikipedia

Ding Xiang Vice-Präsident Li Liang sagte, dass KI die Verbreitung von Gerüchten einfacher macht, und die Plattform verwendet gerade intelligente Systeme zur Bekämpfung von Gerüchten

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

Google präsentiert den KI-automatisierten Marketing-Tool Pomelli, mit dem Marketinginhalte durch Eingabe einer Webseiten-URL generiert werden können

US-Senatoren schlagen vor, das Nutzen von KI-Chatbot durch Minderjährige zu verbieten

Studie zeigt auf: Die Nutzung von KI lässt uns kognitive Fähigkeiten überschätzen

Adobe Firefly Image 5 mit erheblichen Updates: Native Generierung von 4 Millionen Pixeln, KI-Audiospuren + benutzerdefinierte Modelle — Kreative betreten die Ära der vollständigen AI-Kreation

GEO Services