General

El último juego de OpenAI te enseña a debatir como un bot


OpenAI acaba de lanzar una nueva técnica para el aprendizaje profundo que enfrenta a las IAs contra sí mismas para aumentar la seguridad.

Así es como funciona el juego:

"El juego de debate de un solo píxel se juega entre dos debatientes y un juez. Un debatiente dice la verdad, el otro miente. Los dos debatientes pueden ver una imagen y pueden dibujar rectángulos en la imagen y hablar con el juez. El juez sólo ve los rectángulos: la imagen está oculta. Cada polemista también puede revelar un solo píxel al juez. El píxel debe elegirse con cuidado, ya que solo puede revelar un píxel en total durante todo el debate ".

El equipo de OpenAI dijo que construyeron el sitio web para probar un elemento particular de alineación de IA. El equipo espera que una jugada entre dos debatientes, incluso dos debatientes humanos, pueda finalmente "producir un comportamiento honesto".

Hay una serie de variaciones que los jugadores humanos pueden explorar. Por ejemplo, OpenAI sugiere que el juez cierre los ojos y que los participantes del debate lean las coordenadas del rectángulo en voz alta. También existe la opción de que el juez decida quién dio la información más verdadera y útil. Idealmente, estas reglas sobre jugadores humanos ayudarán a las personas a comprender mejor cómo los sistemas de IA también responden a reglas similares.

"¿Cómo podemos aumentar a los humanos para que puedan supervisar de manera efectiva los sistemas avanzados de IA? Una forma es aprovechar la propia IA para ayudar con la supervisión, pidiendo a la IA (o una IA separada) que señale fallas en cualquier acción propuesta, ", explicó el equipo de OpenAI en una publicación de blog.

"Para lograr esto, replanteamos el problema de aprendizaje como un juego entre dos agentes, donde los agentes tienen una discusión entre ellos y el humano juzga el intercambio", continuó el equipo. "Incluso si los agentes tienen una comprensión más avanzada del problema que el humano, el humano puede juzgar qué agente tiene el mejor argumento (similar a los testigos expertos que argumentan para convencer a un jurado)".

OpenAI fue fundada originalmente por Elon Musk en 2015 para educar mejor y 'entrenar' futuros proyectos de IA. El CEO de Tesla dejó su puesto en la junta de OpenAI en febrero de 2018 para evitar más conflictos con su trabajo en Tesla.

"A medida que Tesla continúe centrándose más en la inteligencia artificial, esto eliminará un posible conflicto futuro para Elon", dijo OpenAI en una publicación de blog.

Musk ha sido franco en sus pensamientos sobre el futuro de la inteligencia artificial. OpenAI como programa de código abierto se creó para mitigar "el mayor riesgo que enfrentamos como civilización", como dijo Musk en entrevistas anteriores.


Ver el vídeo: OG vs OpenAI FIVE - AI vs HUMANS - TI8 CHAMPIONS vs BOTS FINAL DOTA 2 (Enero 2022).