Rompiendo la IA a propósito: Cómo los investigadores están ayudando a hacer la inteligencia artificial más segura

English 中文日本語

News Ufl Edu Feb 19, 2026

Los investigadores desarrollaron la Dirección de Espacio Nulo Enmascarada por Cabezal (HMNS) para romper intencionalmente modelos de IA y mejorar sus defensas de seguridad internas.

Leer Artículo Completo

Resumen

El profesor Sumit Kumar Jha y su equipo del CISE de la Universidad de Florida están trabajando para fortalecer la seguridad de la IA al encontrar y explotar intencionalmente vulnerabilidades, un proceso denominado 'romper la IA a propósito'. Su investigación, detallada en el artículo "Jailbreaking the Matrix: Nullspace Steering for Controlled Model Subversion", se centra en sondear las vías de decisión internas de los Modelos de Lenguaje Grandes (LLM) en lugar de depender únicamente de la manipulación externa de indicaciones. Desarrollaron un método llamado Dirección de Espacio Nulo Enmascarada por Cabezal (HMNS), que identifica los componentes activos ('cabezales') en el proceso de respuesta de un LLM, los silencia y dirige otros componentes para observar los cambios en la salida. Esta prueba de estrés interna, aplicada a sistemas de Meta y Microsoft, demostró ser muy eficaz, superando a los métodos de vanguardia en los puntos de referencia de la industria tanto en tasa de éxito como en eficiencia computacional. Los investigadores enfatizan que este trabajo no tiene como objetivo permitir el mal uso, sino revelar modos de falla para que los desarrolladores puedan construir defensas más robustas necesarias para el despliegue seguro y generalizado de la IA en infraestructuras críticas.

(Fuente：News Ufl Edu)

English 中文日本語

Leer Artículo Completo

TechCrunch Apr 30, 2026

SoftBank está creando una empresa de robótica que construye centros de datos — y ya apunta a una OPI de 100 mil millones de dólares

Gizmodo Apr 30, 2026

Se reporta que Anthropic planea superar la valoración de OpenAI en su próxima ronda de financiación

TechCrunch Apr 30, 2026

El negocio de la nube de Amazon está en auge, al igual que su gasto de capital

TechCrunch Apr 30, 2026

Fuentes: Anthropic podría recaudar una nueva ronda de 50.000 millones de dólares con una valoración de 900.000 millones de dólares

The Verge Apr 30, 2026

El peor enemigo de Elon Musk en el tribunal es Elon Musk

TechCrunch Apr 29, 2026

En el estrado, Elon Musk no puede escapar de sus propios tuits

TechCrunch Apr 29, 2026

Meta sigue quemando dinero en AR/VR

TechCrunch Apr 29, 2026

Satya Nadella afirma que está listo para 'explotar' el nuevo acuerdo con OpenAI

TechCrunch Apr 29, 2026

Microsoft afirma tener más de 20 millones de usuarios de pago de Copilot, y que realmente lo utilizan

TechCrunch Apr 29, 2026

Google Cloud supera los 20.000 millones de dólares, pero afirma que el crecimiento estuvo limitado por la capacidad