El 29 de enero de 2024, la Chief Digital and Artificial Intelligence Office (CDAO) del Departamento de Defensa puso en marcha los ejercicios AI Bias Bounty.
Estos programas tienen como objetivo la detección colectiva de sesgos en los sistemas de IA, con especial énfasis en los grandes modelos lingüísticos (LLM).
La iniciativa forma parte del esfuerzo más amplio del CDAO por integrar y optimizar la IA segura en todo el DoD.
Las repercusiones de los prejuicios no controlados de la IA son de gran alcance y se manifiestan en diversos sectores, desde las fuerzas del orden y los servicios financieros hasta la atención sanitaria y otros.
Instancias de AI identifica erróneamente a las personas implicados en delitos, la denegación de créditos injustos y el diagnóstico erróneo de pacientes en entornos médicos subrayan la naturaleza crítica del sesgo en los sistemas de aprendizaje automático.
En muchos casos, los conjuntos de datos sesgados incorporan prejuicios a los sistemas de aprendizaje automático. Por ejemplo, el aparentemente inocuo conjunto de datos Tiny Images del MIT contenía contenidos ofensivos. Más recientemente, la base de datos Conjunto de datos LAION-5Butilizado para modelos de imagen como DALL-E, se descubrió que contenía material de abuso sexual infantil.
Matthew Johnson, Jefe en funciones de la División de AI Responsable (RAI) del DoD, habló de la iniciativa del CDAOEl equipo de RAI está encantado de dirigir estas recompensas de IA sesgada, ya que estamos firmemente comprometidos a garantizar que los sistemas de IA del Departamento -y los contextos en los que se ejecutan- sean seguros, fiables y no sesgados".
La primera fase de este innovador programa se centra en descubrir y abordar los riesgos desconocidos asociados a los LLM, empezando por los chatbots de código abierto.
Los participantes pueden ganar recompensas monetarias en función de sus contribuciones, evaluadas por ConductorAI-Bugcrowd y financiadas por el DoD.
Los resultados podrían orientar nuevas políticas y recomendaciones. Craig Martell, Chief Digital and Artificial Intelligence Officer, señaló: "Dado el enfoque actual del Departamento en los riesgos asociados con los LLM, el CDAO está monitoreando activamente esta área; el resultado de las AI Bias Bounties podría impactar poderosamente en las futuras políticas y adopción de IA del DoD."
El Gobierno de EE.UU. ha reclutado a investigadores y hackers de IA para investigar y redirigir modelos respaldó una sesión en la Def Con convención de hackers en Las Vegas.