Golpear los libros: el sesgo detrás de la falta de comprensión de los acentos de los asistentes de IA


La era de poder hablar con nuestras computadoras tal como lo hacemos con otros humanos finalmente está sobre nosotros, pero los asistentes activados por voz como Siri, Alexa y Google Home no han demostrado ser tan revolucionarios, o inclusivos, como esperábamos. ellos serían. Si bien estos sistemas hacen un esfuerzo encomiable para interpretar con precisión los comandos independientemente de si aprendió su acento en Houston o Hamburgo, para los usuarios con acentos más pesados ​​o menos comunes como el caribeño o cockney, las solicitudes a sus asistentes digitales se ignoran rotundamente. En su ensayo «Disciplinas de Siri» para Tu computadora está en llamas del MIT Press, profesor de la Universidad Towson Dr. Halcyon M. Lawrence, examens algunas de las deficiencias más evidentes de esta tecnología naciente, cómo esas fallas evitables han excluido efectivamente a un número considerable de usuarios potenciales y los sesgos occidentales que sustentan el problema.

Tu computadora está en llamas

Prensa del MIT

Extraído de «Tu computadora está en llamas”Copyright © 2021 Editado por Thomas S. Mullaney, Benjamin Peters, Mar Hicks y Kavita Philip. Usado con permiso del editor, MIT Press.


Las tecnologías de voz se describen habitualmente como revolucionarias. Aparte de la capacidad de la tecnología para reconocer y replicar el habla humana y para proporcionar un entorno de manos libres para los usuarios, estas afirmaciones revolucionarias, especialmente de los escritores de tecnología, surgen de una serie de tendencias: el número creciente de personas que utilizan estas tecnologías, el aumento de el volumen de ventas de asistentes personales como Alexa de Amazon o Google Home, y la creciente cantidad de aplicaciones domésticas que usan voz. Si es un usuario habitual (o diseñador) de tecnología de voz, entonces la afirmación antes mencionada puede resonar en usted, ya que es muy posible que su vida se haya hecho más fácil gracias a ella. Sin embargo, para los hablantes con un acento no estándar (por ejemplo, vernáculo afroamericano o cockney), los asistentes virtuales como Siri y Alexa no responden y son frustrantes: hay numerosos videos de YouTube que demuestran e incluso parodian estos casos. Para mí, hablante de inglés caribeño, hay “silencio” cuando hablo con Siri; esto significa que hay muchos servicios, productos e incluso información a la que no puedo acceder mediante comandos de voz. Y si bien tengo otras formas de acceder a estos servicios, productos e información, ¿cuál es la experiencia de los hablantes con acento para quienes el habla es el modo de comunicación principal o singular? Esta supuesta «revolución» los ha dejado atrás. De hecho, Mar Hicks nos empuja a considerar que cualquier tecnología que refuerce o reinscriba el sesgo no es, de hecho, revolucionaria sino opresiva. El hecho de que las tecnologías de voz no cambien los «prejuicios y jerarquías sociales» existentes, sino que los refuercen, significa que estas tecnologías, aunque útiles para algunos, no son de ninguna manera revolucionarias.

Se podría argumentar que estas tecnologías son incipientes y que con el tiempo se apoyarán más acentos. Si bien esto puede ser cierto, las tendencias actuales no son convincentes. Aquí hay algunas preguntas para considerar: primero, ¿por qué los acentos se han desarrollado principalmente para el inglés estándar en las culturas occidentales (como el inglés estadounidense, canadiense y británico)? En segundo lugar, para las culturas no occidentales para las que se ha desarrollado un soporte de acento no estándar (como el singapurense y el hinglish), ¿qué está impulsando estas iniciativas? En tercer lugar, ¿por qué no ha habido un acento no estándar para los hablantes de inglés de minorías? Finalmente, ¿qué ajustes, y a qué costo, deben hacer los hablantes de inglés estándar y con acento extranjero para interactuar con las tecnologías de voz existentes?

En su biografía de esclavo, Olaudah Equiano dijo: “A menudo he tomado un libro y he hablado con él, y luego lo he escuchado, cuando estoy solo, con la esperanza de que me responda; y me preocupé mucho cuando descubrí que permanecía en silencio «. La experiencia de Equiano con la interfaz tradicional de un libro refleja el silencio que los hablantes de inglés no estándar y extranjeros a menudo encuentran cuando intentan interactuar con tecnologías de voz como Siri de Apple, Alexa de Amazon o Google Home. Con la premisa del uso del lenguaje natural para los hablantes, estas tecnologías animan a sus usuarios a no alterar sus patrones de lenguaje de ninguna manera para interacciones exitosas. Si posee un acento extranjero o habla en un dialecto, las tecnologías del habla practican una forma de «otredad» que es sesgada y disciplinaria, exigiendo una forma de asimilación poscolonial a los acentos estándar que «silencia» la realidad sociohistórica del hablante.

Debido a que estas tecnologías no se han diseñado fundamentalmente para procesar el habla no estándar y con acento extranjero, los hablantes a menudo tienen que hacer ajustes en su habla, es decir, cambiar sus acentos, para reducir los errores de reconocimiento. El resultado es la marginación y deslegitimación sostenidas de los hablantes de inglés no estándar y con acento extranjero. Esta asimilación forzada es particularmente atroz dado que el número de hablantes de inglés como segunda lengua ya ha superado el número de hablantes nativos de inglés en todo el mundo. El número de hablantes de inglés como segundo idioma (ESL) seguirá aumentando a medida que el inglés se utilice a nivel mundial como lengua franca para facilitar actividades comerciales, académicas, recreativas y tecnológicas. Una implicación de esta tendencia es que, con el tiempo, los hablantes nativos de inglés pueden ejercer menos influencia sobre las estructuras léxicas, sintácticas y semánticas que gobiernan el idioma inglés. Estamos comenzando a presenciar la aparición de idiomas híbridos como el spanglish, el konglish y el hinglish, por nombrar algunos. Sin embargo, a pesar de esta tendencia y las implicaciones obvias, los dispositivos mediados por el habla reconocen marginalmente el habla con acento extranjero y con acento no estándar.

Gluszek y Dovidio definen un acento como una «forma de pronunciación con otros niveles lingüísticos de análisis (gramatical, sintáctico, morfológico y léxico), más o menos comparable con el lenguaje estándar». Los acentos son específicos de un individuo, lugar o nación, identificando el lugar donde vivimos (a través de acentos geográficos o regionales, como el sur de Estados Unidos, los afroamericanos o los cockney británicos, por ejemplo), nuestro estatus socioeconómico, nuestra etnia, nuestro elenco, nuestra sociedad. clase, o nuestro primer idioma. La preferencia por el acento propio está bien documentada. Los individuos ven a las personas que tienen un acento similar al suyo de manera más favorable que a las personas que tienen un acento diferente al suyo. Las investigaciones han demostrado que incluso los bebés y los niños muestran preferencia por su acento nativo. Esto es consistente con la teoría de que la similitud en actitudes y características afecta tanto los procesos de comunicación como las percepciones que las personas se forman entre sí.

Sin embargo, con los acentos, la atracción por similitudes no siempre es el caso. Los investigadores han desafiado el principio de similitud-atracción, sugiriendo que es bastante específico del contexto y que los prejuicios culturales y psicológicos a menudo pueden conducir a percepciones positivas de acentos no similares. Los acentos diferentes a veces conllevan estereotipos positivos que conducen a percepciones positivas del habla o del hablante. Los estudios también muestran que incluso cuando los oyentes están expuestos a acentos diferentes, muestran una preferencia por los acentos estándar, como el inglés británico estándar, en contraposición a las variedades no estándar como los acentos cockney o escocés.

Por otro lado, los acentos no similares no siempre se perciben de manera positiva, y los hablantes con acento extranjero enfrentan muchos desafíos. Por ejemplo, Flege señala que hablar con acento extranjero conlleva una variedad de posibles consecuencias para los estudiantes de un segundo idioma (L2), incluida la detección del acento, la aceptabilidad disminuida, la inteligibilidad disminuida y la evaluación negativa. Quizás una de las mayores consecuencias de tener un acento extranjero es que los usuarios de L2 a menudo tienen dificultades para hacerse entender debido a errores de pronunciación. Incluso los hablantes nativos con acento (hablantes de variantes del inglés británico, como yo, por ejemplo) experimentan dificultades similares debido a las diferencias de pronunciación.

Lambert y col. produjo uno de los primeros estudios sobre actitudes lingüísticas que demostró prejuicios lingüísticos. Desde entonces, la investigación ha demostrado consistentemente las percepciones negativas sobre el habla producidas por hablantes no nativos. A medida que el habla se acerca a lo sin acento, las percepciones del oyente se vuelven más favorables y, a medida que el habla se vuelve menos similar, las percepciones del oyente se vuelven menos favorables; Dicho de otra manera, cuanto más fuerte es el acento extranjero, menos favorable es el discurso.

El habla no nativa evoca estereotipos negativos, de modo que los hablantes son percibidos como menos inteligentes, menos leales, menos competentes, hablantes pobres del idioma y con una habilidad política débil. Pero el sesgo no se detiene en la percepción, ya que se han documentado prácticas discriminatorias asociadas con los acentos en la vivienda, el empleo, las sentencias judiciales, los puestos de trabajo de menor categoría y, para los estudiantes, la negación de la igualdad de oportunidades en la educación.

A pesar de las formas documentadas en las que las personas que hablan con acento experimentan habitualmente un trato discriminatorio, todavía hay muy poca conversación generalizada sobre el sesgo del acento y la discriminación. En el otoño de 2017, recibí la siguiente evaluación de estudiante de uno de mis estudiantes, que era un hablante no nativo de inglés y un futuro programador de computadoras:

Voy a ser muy duro aquí, pero por favor no se ofenda, su acento es horrible. Como hablante no nativo de inglés, me costó mucho entender lo que estás diciendo. Un ejemplo que se pega más es que dices gol pero escucho ghoul. Si bien fue divertido al principio, se volvió molesto a medida que avanzaba el semestre. Me quedé con la impresión de que estás muy orgulloso de tu acento, pero creo que al igual que empieza la película [sic] actuando en películas y cambiando su acento, cuando profeses deberías intentar hablar claramente con acento estadounidense para que los estudiantes no nativos puedan entenderte mejor.

Aunque estaba desconcertado, no debería haberlo estado. David Crystal, un respetado y reconocido lingüista británico que es un invitado habitual en un programa de radio británico, dijo que la gente escribía en el programa para quejarse de las pronunciaciones que no les gustaban. Afirma: “Fue la naturaleza extrema del lenguaje lo que siempre me llamó la atención. Los oyentes no solo dijeron que «no les gustaba» algo. Utilizaron las palabras más emotivas que se les ocurrió. Estaban ‘horrorizados’, ‘horrorizados’, ‘estupefactos’, ‘horrorizados’, ‘indignados’ cuando escucharon algo que no les gustó «. Crystal continúa sugiriendo que las reacciones son tan fuertes porque la pronunciación (o el acento) de uno se trata fundamentalmente de identidad. Se trata de raza. Se trata de clase. Se trata de la etnia, la educación y la ocupación de una persona. Cuando un oyente presta atención a la pronunciación de otro, en última instancia, está prestando atención a la identidad del hablante.

Al reflexionar sobre la «evaluación» de mi acento por parte de mi estudiante, me sorprendió que este comentario hubiera provocado indignación si se hubiera hecho sobre las características inmutables de la raza, la etnia o el género de uno; sin embargo, cuando se trata de acentos, existe una aceptabilidad en la práctica del sesgo de acento, en parte porque los acentos se ven como una característica mutable de un hablante, cambiante a voluntad. Como señaló mi alumno, después de todo, las estrellas de cine de Hollywood lo hacen todo el tiempo, entonces, ¿por qué no podría yo? Aunque las personas han demostrado la capacidad de adoptar y cambiar entre acentos (lo que se denomina cambio de código), hacerlo debería ser una cuestión de elección personal, ya que el acento es inseparable de la identidad de uno. Poner sobre otro la expectativa de un cambio de acento es opresivo; crear condiciones en las que la elección del acento no sea negociable por el hablante es hostil; imponer un acento a otro es violento.

Un dominio en el que prevalece el sesgo de acento es en dispositivos aparentemente benignos como los sistemas de megafonía y los sistemas de menú bancarios y de aerolíneas, por nombrar algunos; pero la falta de diversidad en los acentos es particularmente sorprendente en asistentes personales como Siri de Apple, Alexa de Amazon y Google Home. Por ejemplo, mientras que los dispositivos como los sistemas de megafonía solo requieren que los oyentes comprendan los acentos estándar, los asistentes personales, por otro lado, requieren no solo la comprensión, sino también la interpretación de los acentos estándar por parte de los usuarios. Por lo tanto, estos dispositivos exigen que el usuario se asimile al inglés estándar, una práctica que, a su vez, aliena a los hablantes de inglés no nativos y no estándar.



Fuente: engadget.com

Deja una respuesta

*

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con tus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad