Connect with us

Estilo vida

La aplicación Live Transcribe de Google cambia la forma en que los sordos se comunican

Publicado

a

La aplicación Live Transcribe de Google cambia la forma en que los sordos se comunican 1


Cuando se trata de Inteligencia Artificial (IA), nadie lo hace mejor que la gente de Google: desde la detección de inundaciones en la India hasta la preservación de los antiguos guiones japoneses, el gigante tecnológico estadounidense ha aprovechado el poder de la IA para resolver algunos de los más grandes del mundo problemas de manera más eficiente que el cerebro humano.

Y aunque su uso podría no estar tan extendido como algunas de las otras iniciativas de Google, Transcripción en vivo Sin embargo, es una herramienta invaluable que ayuda a las personas sordas o con problemas de audición a comunicarse con el mundo. Disponible en más de 70 idiomas y dialectos, esta aplicación detecta el habla y los convierte en subtítulos en tiempo real, permitiendo que las personas con discapacidad auditiva participen en conversaciones solo con sus teléfonos.

Y como suele ser el caso con las innovaciones tecnológicas, teníamos algunas preguntas: ¿por qué algo tan aparentemente simple tardó tanto en ser lanzado? ¿Cómo se recopilan los datos que usa la IA? ¿La transcripción alguna vez será 100% precisa? Para averiguarlo, nos sentamos con Sagar Savla y Julie Cattiau, dos gerentes de producto de Google AI, y esto es lo que aprendimos.

VP: El reconocimiento automático de voz (ASR) ha existido desde hace algún tiempo, entonces, ¿por qué Google solo está lanzando Live Transcribe ahora? ¿Fue tan simple como tomar la tecnología ASR y ponerla en una aplicación, o tuviste que hacer algo diferente?

SS: Live Transcribe se basó en décadas de investigación para llevar los subtítulos a un nivel en el que valiera la pena usarlo. Si utilizó la misma tecnología hace 10 años, no sería útil porque la precisión sería tan poco confiable que una persona sorda podría comenzar a depender de otras señales de comunicación en lugar de usarla.

Pudimos alcanzar este nivel de manera única en Google porque tuvimos décadas de investigación en reconocimiento de voz recopiladas de otros productos como Google Voice Search y Google Assistant. Esto esencialmente nos facilitó el desafío más difícil, tanto en términos de tener acceso a los expertos como de tener listos los modelos.

VP: Entonces, ¿cómo recopila sus datos de investigación? ¿Se hace a escala pública o privada?

SS: Ambos. Empleamos contratistas para que ingresen al laboratorio y graben audio limpio y profesional, pero también buscamos datos de forma colectiva. En realidad, existe una aplicación llamada Google Crowdsource, que permite a las personas realizar anotaciones y enviar sus propios datos. a veces es voz, a veces son fotos, a veces es texto que entra en las funciones del Traductor de Google.

Diría que hemos realizado un esfuerzo de recopilación de datos en diferentes países durante los últimos diez años. Gujarat, por ejemplo, fue uno de los idiomas que se lanzó recientemente, pero el esfuerzo de recopilación de datos en realidad comenzó hace cuatro años. También recopilamos datos de varias geografías, porque puede haber diferentes acentos dentro de un solo país.

La aplicación Live Transcribe de Google cambia la forma en que los sordos se comunican 2
Sagar Savla (izquierda) y Julie Cattiau (derecha) / Crédito de la imagen: Vulcan Post

VP: ¿Debería la gente preocuparse por la privacidad?

SS: La recopilación de datos de Google es un esfuerzo dedicado y concertado. Cuando nos acercamos a alguien, primero les decimos qué se va a recolectar, para qué se va a usar, quién podrá verlo, cuánto tiempo lo vamos a almacenar y las aplicaciones que pueden salir de él. . Si están completamente de acuerdo con estas condiciones, firman un acuerdo que dice "sí, estoy de acuerdo con que Google use este aspecto de mis datos", y ahí es cuando los traemos para recopilar esos datos.

Esa política existe no solo para las grabaciones de voz, sino también para todos nuestros esfuerzos de recopilación de datos. A veces recopilamos fotos para eliminar los prejuicios de nuestros modelos, y cuando salimos a preguntar si las personas están dispuestas a donar sus datos, les decimos para qué se utilizarán también.

También usamos esta información para devolver, de alguna manera. Muchos de nuestros modelos son de código abierto, y la comunidad académica a veces los utiliza para comparar nuevas investigaciones. Liberamos por completo toda esa capacitación sin dar ninguna identificación.

La aplicación Live Transcribe de Google cambia la forma en que los sordos se comunican 3
Transcribe en vivo en acción. / Crédito GIF: Google

VP: D¿Crees que Live Transcribe alcanzará el 100% de precisión?

JC: Creo que será realmente difícil alcanzar el 100% de precisión. Incluso si habla inglés nativo, seguirá habiendo errores en la tecnología de reconocimiento de voz. La pregunta ahora es "¿cómo podemos cometer la menor cantidad de errores posible para que sea aceptable para las personas?" Todavía estamos en las primeras etapas, pero estamos pensando mucho en eso y pensando dónde trazar la línea. .

SS: Lo que hemos escuchado de nuestros usuarios es que si tuvieran que elegir entre comunicación cero o algo con una precisión del 60%, preferirían tomar esa precisión del 60% y tomar la esencia de la conversación para que aún puedan participar.

Hemos escuchado historias de usuarios que acudieron a citas médicas de emergencia y no pudieron contratar a un intérprete profesional en tan poco tiempo, por lo que utilizaron la aplicación y fue lo suficientemente buena para ellos. El médico probablemente tuvo que repetir algunas cosas dos veces, y tal vez si se suponía que tomaría 60 minutos, tomaría 90 minutos, pero fue lo suficientemente bueno para ellos, ya que no tenían que depender de otra persona.

Todavía estamos muy lejos de alcanzar el 100% de precisión, pero la cuestión es que la comunicación nunca puede ser perfecta. Incluso la comunicación entre humanos es difícil, y aún confiamos en otras señales como el lenguaje corporal. Hace cinco años, la tecnología no era capaz de detectar cosas como silbidos o golpes, y estamos agregando estas pequeñas cosas para aumentar el nivel de inmersión. Tenemos que seguir identificando estos aspectos más pequeños del gran desafío para obtener una mayor precisión.

La aplicación Live Transcribe de Google cambia la forma en que los sordos se comunican 4
Sagar explica cómo funciona Live Transcribe en el evento Solve With AI de Google en Japón / Crédito de la imagen: Vulcan Post

VP: D¿Crees que Live Transcribe alcanzará el 100% de precisión?

JC: Creo que será realmente difícil alcanzar el 100% de precisión. Incluso si habla inglés nativo, seguirá habiendo errores en la tecnología de reconocimiento de voz. La pregunta ahora es "¿cómo podemos cometer la menor cantidad de errores posible para que sea aceptable para las personas?" Todavía estamos en las primeras etapas, pero estamos pensando mucho en eso y pensando dónde trazar la línea. .

SS: Lo que hemos escuchado de nuestros usuarios es que si tuvieran que elegir entre comunicación cero o algo con una precisión del 60%, preferirían tomar esa precisión del 60% y tomar la esencia de la conversación para que aún puedan participar.

Hemos escuchado historias de usuarios que acudieron a citas médicas de emergencia y no pudieron contratar a un intérprete profesional en tan poco tiempo, por lo que utilizaron la aplicación y fue lo suficientemente buena para ellos. El médico probablemente tuvo que repetir algunas cosas dos veces, y tal vez si se suponía que tomaría 60 minutos, tomaría 90 minutos, pero fue lo suficientemente bueno para ellos, ya que no tenían que depender de otra persona.

Todavía estamos muy lejos de alcanzar el 100% de precisión, pero la cuestión es que la comunicación nunca puede ser perfecta. Incluso la comunicación entre humanos es difícil, y aún confiamos en otras señales como el lenguaje corporal. Hace cinco años, la tecnología no era capaz de detectar cosas como silbidos o golpes, y estamos agregando estas pequeñas cosas para aumentar el nivel de inmersión. Tenemos que seguir identificando estos aspectos más pequeños del gran desafío para obtener una mayor precisión.

VP: Ahora que Google ha llegado a un punto en el que tienen la confianza suficiente para lanzar algo como Live Transcribe, ¿qué sigue? ¿Cuál es el siguiente paso para simplificar aún más la comunicación?

SS: Los audífonos actualmente tienen dificultades para diferenciar entre ruido y habla. En una conversación en la cena, por ejemplo, varias personas hablarían y el discurso de todos sería confuso, e incluso se escucharía el sonido de la televisión en la habitación de al lado.

¿Podemos entrenar un modelo para descubrir qué sonidos son importantes y amplificar eso? Si hacemos eso, muchas personas con problemas de audición ni siquiera necesitarán usar subtítulos porque obtendrán un discurso claro independientemente del entorno. Creo que es algo que puede ayudar mucho a la comunicación.

JC: Una cosa que personalmente me importa es el habla acentuada, porque cuando uso el Asistente de Google no siempre capta mi acento. Creo que hay mucho trabajo que podríamos hacer para hablar con acento y asegurarnos de que, independientemente de su acento o su forma de hablar, el reconocimiento de voz funcione para usted.

Crédito de la imagen del encabezado: Vulcan Post

Continuar leyendo
Comentarios

¡Comenta la noticia!

avatar

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

  Suscribirse  
Noticia de
Mire: Ucrania celebra ceremonia por víctimas de accidente aéreo 21 Mire: Ucrania celebra ceremonia por víctimas de accidente aéreo 22
Internacional3 mins ago

Mire: Ucrania celebra ceremonia por víctimas de accidente aéreo

Ucrania rindió homenaje a las 11 víctimas ucranianas de un accidente aéreo en las afueras de Teherán el 8 de...

Goku (Ultra Instinct) se une a Dragon Ball FighterZ como un personaje DLC 23 Goku (Ultra Instinct) se une a Dragon Ball FighterZ como un personaje DLC 24
Videojuegos6 mins ago

Goku (Ultra Instinct) se une a Dragon Ball FighterZ como un personaje DLC

Ha sido una semana emocionante para los fanáticos de los juegos de lucha con Joker presentado para Mortal Kombat 11Byleth...

Los expertos en criptomonedas se unen al Consejo Asesor de "Alto Nivel" de la OCDE 26 Los expertos en criptomonedas se unen al Consejo Asesor de "Alto Nivel" de la OCDE 27
Criptomonedas18 mins ago

Los expertos en criptomonedas se unen al Consejo Asesor de "Alto Nivel" de la OCDE

La Organización para la Cooperación y el Desarrollo Económico, un organismo intergubernamental con 36 países miembros, ha formado "un grupo...

Pars Petrochemical Company de Irán busca aumentar la producción 29 Pars Petrochemical Company de Irán busca aumentar la producción 30
Internacional39 mins ago

Pars Petrochemical Company de Irán busca aumentar la producción

Pars Petrochemical Company de Irán busca aumentar la producción

Akim Aliu habla sobre las experiencias de novatadas en la NHL en la entrevista de 'Hockey Night in Canada' con Ron MacLean 31 Akim Aliu habla sobre las experiencias de novatadas en la NHL en la entrevista de 'Hockey Night in Canada' con Ron MacLean 32
Deportes43 mins ago

Akim Aliu habla sobre las experiencias de novatadas en la NHL en la entrevista de 'Hockey Night in Canada' con Ron MacLean

'Hockey Night in Canada' transmitió la entrevista individual de Ron MacLean con Akim Aliu el sábado en la que el...

Kent Bazemore: Portland Trail Blazers intercambiará a un swingman con Sacramento Kings por alivio de la tapa en un acuerdo multijugador | Noticias de la NBA 34 Kent Bazemore: Portland Trail Blazers intercambiará a un swingman con Sacramento Kings por alivio de la tapa en un acuerdo multijugador | Noticias de la NBA 35
Deportes46 mins ago

Kent Bazemore: Portland Trail Blazers intercambiará a un swingman con Sacramento Kings por alivio de la tapa en un acuerdo multijugador | Noticias de la NBA

Los Portland Trail Blazers están listos para intercambiar al swingman Kent Bazemore con los Sacramento Kings, junto con Anthony Tolliver...

Los adultos mayores que toman té tienen menos probabilidades de estar deprimidos 37 Los adultos mayores que toman té tienen menos probabilidades de estar deprimidos 38
Ciencia49 mins ago

Los adultos mayores que toman té tienen menos probabilidades de estar deprimidos

Investigaciones anteriores han sugerido que existe un vínculo entre la depresión y el consumo de té. Ahora, un nuevo estudio...

Ole Gunnar Solskjaer advierte al Liverpool que aún tienen más que hacer para igualar el lado de Fergie en 1999 39 Ole Gunnar Solskjaer advierte al Liverpool que aún tienen más que hacer para igualar el lado de Fergie en 1999 40
Deportes50 mins ago

Ole Gunnar Solskjaer advierte al Liverpool que aún tienen más que hacer para igualar el lado de Fergie en 1999

El técnico del Manchester United, Ole Gunnar Solskjaer, advirtió al Liverpool que deben dominar la Premier League en los próximos...

Bolsa e inversión52 mins ago

El gobierno australiano dice que apoya la industria del turismo a medida que los incendios forestales retroceden

Por Lidia Kelly y Stefica Nicol Bikes MELBOURNE / KANAGAROO ISLAND, Australia (Reuters) – El gobierno australiano dijo el domingo...

Samsung Galaxy S20 Series Especificaciones filtradas: pantalla de 120Hz, zoom óptico de 10x, Exynos 990 y más 42 Samsung Galaxy S20 Series Especificaciones filtradas: pantalla de 120Hz, zoom óptico de 10x, Exynos 990 y más 43
Gadgets54 mins ago

Samsung Galaxy S20 Series Especificaciones filtradas: pantalla de 120Hz, zoom óptico de 10x, Exynos 990 y más

Las filtraciones de Samsung Galaxy S20 han estado llegando desde todas las direcciones últimamente. Después de que los renders y...

'1917' se lleva el máximo honor en los Premios del Gremio de Productores 44 '1917' se lleva el máximo honor en los Premios del Gremio de Productores 45
Internacional58 mins ago

'1917' se lleva el máximo honor en los Premios del Gremio de Productores

LOS ANGELES, California – Si los Producers Guild Awards son un verdadero predictor de la categoría de mejor película de...

Cultura y Ocio59 mins ago

Regalo para esposa que acaba de enterarse de su herencia sueca

Suegra ha estado investigando sobre su familia biológica y ha descubierto que son muy suecos. Me gustaría darle a mi...

Influentes iraníes rompen filas con el estado después del derribo de un avión ucraniano 47 Influentes iraníes rompen filas con el estado después del derribo de un avión ucraniano 48
Internacional1 hora ago

Influentes iraníes rompen filas con el estado después del derribo de un avión ucraniano

LONDRES – Una serie de influyentes artistas iraníes, personalidades de la televisión y estrellas del deporte rompieron públicamente con Teherán...

Rui Rio se aferra como el líder de centroderecha de Portugal - POLITICO 49 Rui Rio se aferra como el líder de centroderecha de Portugal - POLITICO 50
Internacional1 hora ago

Rui Rio se aferra como el líder de centroderecha de Portugal – POLITICO

La oposición socialdemócrata vota para continuar la línea moderada. Por Paul Ames 1/19/20, 10:11 AM CET LISBOA – El Partido...

Video sobre el 30 aniversario de la tragedia del 20 de enero compartido en la página oficial del presidente Ilham Aliyev en Facebook (VIDEO) 52 Video sobre el 30 aniversario de la tragedia del 20 de enero compartido en la página oficial del presidente Ilham Aliyev en Facebook (VIDEO) 53
Internacional2 horas ago

Video sobre el 30 aniversario de la tragedia del 20 de enero compartido en la página oficial del presidente Ilham Aliyev en Facebook (VIDEO)

BAKU, Azerbaiyán, 19 de enero. Tendencia: Se ha compartido un video sobre el 30 aniversario de la tragedia del 20...

Abierto de Australia 2020: ¿Pueden ser superados Roger Federer, Rafael Nadal, Novak Djokovic? 55 Abierto de Australia 2020: ¿Pueden ser superados Roger Federer, Rafael Nadal, Novak Djokovic? 56
Deportes2 horas ago

Abierto de Australia 2020: ¿Pueden ser superados Roger Federer, Rafael Nadal, Novak Djokovic?

Stefanos Tsitsipas parece listo. Daniil Medvedev parece listo. Dominic Thiem parece listo. El tenis masculino se debe a otro campeón...

Artículos: el interés del Chelsea en £ 60 millones Timo Werner podría forzar la mano del Liverpool | Noticias de futbol 58 Artículos: el interés del Chelsea en £ 60 millones Timo Werner podría forzar la mano del Liverpool | Noticias de futbol 59
Deportes2 horas ago

Artículos: el interés del Chelsea en £ 60 millones Timo Werner podría forzar la mano del Liverpool | Noticias de futbol

Última actualización: 18/01/20 11:29 pm Todas las historias principales y los rumores de transferencia de las páginas posteriores de los...

Detalles de lanzamiento de Ather 450X revelados 62 Detalles de lanzamiento de Ather 450X revelados 63
Motor2 horas ago

Detalles de lanzamiento de Ather 450X revelados

El Ather 450X será un scooter eléctrico más premium de Ather Energy, y obtendrá más funciones y mejores especificaciones que...

Horóscopo semanal: ¡Bienvenido, Temporada de Acuario! 64 Horóscopo semanal: ¡Bienvenido, Temporada de Acuario! 65
Horóscopo2 horas ago

Horóscopo semanal: ¡Bienvenido, Temporada de Acuario!

20 de enero – 26 de enero de 2020 Comenzando la semana, el foco se ilumina cuando el sol entra...

Erdogan exige estar en contra de la 'sangre y el caos' en Libia 66 Erdogan exige estar en contra de la 'sangre y el caos' en Libia 67
Internacional2 horas ago

Erdogan exige estar en contra de la 'sangre y el caos' en Libia

ANKARA – El presidente turco, Recep Tayyip Erdogan, pidió a la comunidad internacional que se oponga a "los comerciantes de...

Lo más leído