Facebook pidió a las personas que compartieran su edad y género para crear un conjunto de datos de IA más justo


Facebook está compartiendo un conjunto de datos nuevo y diverso con la comunidad de IA en general. En un anuncio visto por VentureBeat, la compañía dice que prevé que los investigadores utilicen la colección, denominada Casual Conversations, para probar sus modelos de aprendizaje automático en busca de sesgos. El conjunto de datos incluye 3,011 personas en 45,186 videos y recibe su nombre del hecho de que presenta a personas que brindan respuestas sin guión a las preguntas de la compañía.

Lo significativo de Casual Conversations es que involucra actores pagados a quienes Facebook les pidió explícitamente que compartieran su edad y género. La empresa también contrató a profesionales capacitados para etiquetar la iluminación ambiental y los tonos de piel de los involucrados de acuerdo con la Escala de Fitzpatrick, un sistema desarrollado por dermatólogos para clasificar los colores de la piel humana. Facebook afirma que el conjunto de datos es el primero de su tipo.

No es necesario buscar muy lejos para encontrar ejemplos de sesgos en la inteligencia artificial. Una estudio reciente encontrado que programas de reconocimiento y análisis facial como Face ++ calificará los rostros de los hombres negros como más enojados que sus contrapartes blancos, incluso si ambos están sonriendo. Esos mismos defectos se han abierto camino en el software de inteligencia artificial orientado al consumidor. En 2015, Google modificó Fotos para dejar de usar una etiqueta después de que el ingeniero de software Jacky Alciné descubrió que la aplicación era identificando erróneamente a sus amigos negros como «gorilas». Puede rastrear muchos de esos problemas hasta los conjuntos de datos que las organizaciones usan para entrenar su software, y ahí es donde una iniciativa como esta puede ayudar. Un reciente Estudio del MIT de los conjuntos de datos de aprendizaje automático populares encontraron que alrededor del 3.4 por ciento de los datos en esas colecciones eran inexactos o mal etiquetados.

Si bien Facebook describe las conversaciones casuales como un «primer paso adelante bueno y audaz», admite que el conjunto de datos no es perfecto. Para empezar, solo incluye personas de Estados Unidos. La compañía tampoco pidió a los participantes que identificaran sus orígenes y, en lo que respecta al género, las únicas opciones que tenían eran «hombre», «mujer» y «otro». Sin embargo, durante el próximo año, planea hacer que el conjunto de datos sea más inclusivo.



Fuente: engadget.com

Deja una respuesta

*

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con tus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad