Ajustar finamente ChatGPT por 0,2 dólares puede romper la seguridad: Princeton y Stanford publican una advertencia sobre los riesgos de los LLM

新智元

Publicado elNoticias de IA · 2 minutos de lectura · Oct 13, 2023

Advertencia sobre los riesgos de los LLM: Princeton y Stanford

Princeton y Stanford publican una advertencia sobre los riesgos de los modelos lingüísticos grandes (LLM). Se ha demostrado que ajustar finamente ChatGPT, incluso con tan solo 0.2 dólares, puede comprometer significativamente su seguridad. La investigación revela que los modelos ajustados finamente presentan una seguridad preocupante, y que incluso los ajustes realizados por usuarios comunes pueden afectar la seguridad del LLM.

Los resultados muestran que una pequeña cantidad de datos dañinos puede reducir considerablemente la seguridad del modelo, y que el ajuste fino introduce nuevos riesgos. A pesar del compromiso de OpenAI para mejorar la seguridad, se necesitan más medidas para contrarrestar los riesgos del ajuste fino.

LLM ChatGPT Seguridad

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

El lanzamiento de Claude for Chrome está cerca, y Anthropic destaca que los agujeros de seguridad deben corregirse

Aug 28, 2025

OpenAI lanzará una función de monitoreo para padres para enfrentar tragedias de suicidio en adolescentes

Tras el suicidio de un adolescente de 16 años tras hablar con ChatGPT, OpenAI planea funciones de control parental y medidas de seguridad, como contactos de emergencia.....

Aug 28, 2025

Prueba de colaboración inicial entre OpenAI y Anthropic para impulsar estándares de seguridad en la inteligencia artificial

OpenAI y Anthropic colaboran en pruebas de seguridad de sus modelos de IA para identificar puntos ciegos y promover la seguridad en la industria.....

Aug 28, 2025

OpenAI monitoreará los registros de conversación de los usuarios y notificará a la policía sobre contenido amenazante

Aug 28, 2025

AI lleva a un adolescente de 16 años al suicidio OpenAI se ve envuelto en su primera demanda por muerte no natural

Demanda presentada en San Francisco contra OpenAI por el suicidio de un adolescente, alegando que ChatGPT no ayudó y contribuyó a su plan suicida.....

Aug 27, 2025

Un nuevo estudio sobre LLM revela un nuevo enfoque de alineación: el aprendizaje por refuerzo basado en listas supera a los modelos de recompensa tradicionales

Un estudio de Apple muestra que el aprendizaje por refuerzo con listas de verificación (RLCF) mejora significativamente el rendimiento de modelos de lenguaje abiertos, superando a los métodos tradicionales RLHF.....

Aug 26, 2025

OpenAI propone ofrecer gratis ChatGPT Plus a toda la población británica, con un posible costo de 2.000 millones de libras esterlinas

El CEO de OpenAI propuso ofrecer ChatGPT Plus gratis a ciudadanos británicos, pero el plan de 2 mil millones de libras no se concretó.....

Aug 25, 2025

Nueva medida de control de IA para empresas de manzanas ¡No solo ChatGPT deja una puerta trasera para todos los proveedores de IA externos

Apple lanzará herramientas de control de IA para empresas en septiembre, permitiendo a los administradores gestionar el uso de IA. Incluirá opciones para configurar ChatGPT Enterprise de OpenAI, que ya tiene 5 millones de usuarios. La integración es innovadora, según documentos de Apple.....

Aug 25, 2025

OpenAI logra ingresos de 1.000 millones de dólares por mes por primera vez, pero la falta de capacidad computacional se convierte en el mayor problema

En el rápido desarrollo del campo de la inteligencia artificial, OpenAI ha recibido buenas noticias recientemente. Sarah Friar, directora financiera de la empresa, reveló en una entrevista con CNBC que los ingresos mensuales de la compañía superaron por primera vez los 1.000 millones de dólares. Este hito marca el rápido crecimiento de OpenAI desde que lanzó ChatGPT a finales de 2022, y se espera que los ingresos de este año alcancen los 12.700 millones de dólares. Aunque los ingresos son alentadores, Friar señaló que OpenAI sigue enfrentando una gran presión en cuanto al requisito de capacidad computacional. Ella

Aug 21, 2025

La empresa de juegos MIXI colabora con OpenAI y logra implementar ChatGPT Enterprise

La empresa MIXI anunció una colaboración con OpenAI y logró implementar con éxito ChatGPT Enterprise en tan solo 45 días. Esta medida trajo mejoras significativas en la comunicación interna y la eficiencia laboral, permitiendo que más de 1.000 empleados usaran ampliamente esta avanzada herramienta de IA. MIXI es una empresa japonesa conocida por su juego móvil MONSTER STRIKE y la aplicación de compartir fotos familiares FamilyAlbum. La misión de la empresa es enriquecer las comunicaciones,

Aug 21, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

Building and Deploying AI

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

Ajustar finamente ChatGPT por 0,2 dólares puede romper la seguridad: Princeton y Stanford publican una advertencia sobre los riesgos de los LLM

新智元

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

El lanzamiento de Claude for Chrome está cerca, y Anthropic destaca que los agujeros de seguridad deben corregirse

OpenAI lanzará una función de monitoreo para padres para enfrentar tragedias de suicidio en adolescentes

Prueba de colaboración inicial entre OpenAI y Anthropic para impulsar estándares de seguridad en la inteligencia artificial

OpenAI monitoreará los registros de conversación de los usuarios y notificará a la policía sobre contenido amenazante

AI lleva a un adolescente de 16 años al suicidio OpenAI se ve envuelto en su primera demanda por muerte no natural

Un nuevo estudio sobre LLM revela un nuevo enfoque de alineación: el aprendizaje por refuerzo basado en listas supera a los modelos de recompensa tradicionales

OpenAI propone ofrecer gratis ChatGPT Plus a toda la población británica, con un posible costo de 2.000 millones de libras esterlinas

Nueva medida de control de IA para empresas de manzanas ¡No solo ChatGPT deja una puerta trasera para todos los proveedores de IA externos

OpenAI logra ingresos de 1.000 millones de dólares por mes por primera vez, pero la falta de capacidad computacional se convierte en el mayor problema

La empresa de juegos MIXI colabora con OpenAI y logra implementar ChatGPT Enterprise

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

Building and Deploying AI

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

Ajustar finamente ChatGPT por 0,2 dólares puede romper la seguridad: Princeton y Stanford publican una advertencia sobre los riesgos de los LLM

新智元

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

​El lanzamiento de Claude for Chrome está cerca, y Anthropic destaca que los agujeros de seguridad deben corregirse

OpenAI lanzará una función de monitoreo para padres para enfrentar tragedias de suicidio en adolescentes

Prueba de colaboración inicial entre OpenAI y Anthropic para impulsar estándares de seguridad en la inteligencia artificial

OpenAI monitoreará los registros de conversación de los usuarios y notificará a la policía sobre contenido amenazante

AI lleva a un adolescente de 16 años al suicidio OpenAI se ve envuelto en su primera demanda por muerte no natural

Un nuevo estudio sobre LLM revela un nuevo enfoque de alineación: el aprendizaje por refuerzo basado en listas supera a los modelos de recompensa tradicionales

OpenAI propone ofrecer gratis ChatGPT Plus a toda la población británica, con un posible costo de 2.000 millones de libras esterlinas

Nueva medida de control de IA para empresas de manzanas ¡No solo ChatGPT deja una puerta trasera para todos los proveedores de IA externos

OpenAI logra ingresos de 1.000 millones de dólares por mes por primera vez, pero la falta de capacidad computacional se convierte en el mayor problema

La empresa de juegos MIXI colabora con OpenAI y logra implementar ChatGPT Enterprise

El lanzamiento de Claude for Chrome está cerca, y Anthropic destaca que los agujeros de seguridad deben corregirse