Newsliatter
Posts
🔓 Microsoft ha hackeado todos los principales modelos de IA

🔓 Microsoft ha hackeado todos los principales modelos de IA

Microsoft ha identificado un nuevo método de jailbreak llamado "Skeleton Key" que puede sobrepasar las restricciones de seguridad en los principales chatbots de IA.

28 de junio de 2024

¡Bienvenido a la Newsliatter de hoy!

🏆 Historia del día: Microsoft ha descubierto un nuevo truco llamado "Skeleton Key" que puede esquivar las restricciones de seguridad en los chatbots de IA más populares, como ChatGPT, Google Gemini y otros, permitiéndoles hacer cosas que no deberían.

🗞️ ¿Qué mas vas a encontrar en esta edición?

📸 Instagram lanza “AI Studio”
🧠 Apple y Microsoft están reduciendo el tamaño de sus modelos para mejorarlos
🧑🏼‍🏫 OpenAI ha desarrollado CriticGPT
👻 Snap Lense Studio 5.0
📝 ChatGPT conquistando la redacción académica

Pero antes… ¡un update de los mercados!

P.D. Día ligeramente rojo

🏆 Historia del día

🔓 Microsoft ha hackeado todos los principales modelos de IA

Microsoft ha descubierto un nuevo truco llamado "Skeleton Key" que puede esquivar las restricciones de seguridad en los chatbots de IA más populares, como ChatGPT, Google Gemini y otros, permitiéndoles hacer cosas que no deberían.

"Skeleton Key" afecta a los grandes modelos de lenguaje como GPT-3.5 Turbo y GPT-4o de OpenAI, Gemini Pro de Google, Llama 3 de Meta y Claude 3 Opus de Anthropic.
Funciona pidiendo al chatbot que emita una advertencia antes de responder a preguntas que violan las normas de seguridad, engañándolo para que responda a solicitudes prohibidas.
Microsoft probó con éxito la "Skeleton Key" en abril y mayo, haciendo que los chatbots generaran contenido sobre temas delicados como explosivos, armas biológicas y violencia explícita.

Este descubrimiento revela grandes debilidades en la seguridad de la IA. A medida que los chatbots se integran cada vez más en nuestra vida diaria, necesitamos medidas de seguridad más sólidas para protegernos de exploits como "Skeleton Key".

🗞️ Más historias de hoy

📸 Instagram lanza “AI Studio”

El nuevo "AI Studio" de Instagram permite a los creadores desarrollar versiones de chatbots de sí mismos. Actualmente, se está implementando como una prueba inicial en Estados Unidos. [link]

🧠 Apple y Microsoft están reduciendo el tamaño de sus modelos para mejorarlos

Los gigantes tecnológicos están cambiando su enfoque de los LLMs hacia modelos de lenguaje más eficientes y pequeños (SLMs). Apple y Microsoft han presentado modelos con muchos menos parámetros, pero con un rendimiento comparable o incluso superior en pruebas de benchmark. El CEO de OpenAI sugiere que estamos superando la era de los LLMs, ya que los SLMs ofrecen ventajas como la operación en dispositivos locales, mayor accesibilidad para entidades más pequeñas y posibles conocimientos sobre la adquisición del lenguaje humano. [link]

🧑🏼‍🏫 OpenAI ha desarrollado CriticGPT

OpenAI ha desarrollado CriticGPT, un nuevo modelo de IA basado en GPT-4, diseñado para ayudar a los humanos a identificar errores en las respuestas de ChatGPT durante el proceso de Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF). Esta innovación busca mejorar la precisión y fiabilidad de los modelos de IA a medida que se vuelven más complejos. [link]

👻 Snap Lense Studio 5.0

Snap ha lanzado “GenAI Suite” en Lens Studio 5.0. Este avance es significativo y resulta extremadamente útil para el desarrollo de aplicaciones de realidad aumentada (AR). [link]

📝 ChatGPT conquistando la redacción académica

Un nuevo estudio revela que al menos el 10% de los resúmenes de investigaciones biomédicas recientes muestran signos de asistencia por IA, destacando el impacto significativo de herramientas como ChatGPT en la redacción académica. [link]

⭐ Tu feedback nos ayuda a mejorar

Leemos vuestras respuestas a diario. Si tienes alguna sugerencia o comentario, responde a este email.

Si te ha gustado esta edición, reenvíasela a un amigo.

Si te han reenviado esta newsletter y no estás suscrito, suscríbete aquí.

¡Muchas gracias por vuestro apoyo!

Hasta mañana.