Por qué AWS está vendiendo un teclado MIDI para enseñar aprendizaje automático – TechCrunch


A principios de esta semana, AWS lanzó DeepComposer, un conjunto de herramientas basadas en la web para aprender sobre IA para hacer música y un teclado MIDI de $ 99 para ingresar melodías. Ese lanzamiento creó un poco de ConfusiónSin embargo, nos sentamos con Mike Miller, el director del grupo de dispositivos de inteligencia artificial de AWS, para hablar sobre dónde encaja DeepComposer en la línea de dispositivos de inteligencia artificial de la compañía, que incluye Cámara DeepLens y el Coche DeepRacer AI, los cuales están destinados a enseñar a los desarrolladores sobre conceptos específicos de IA, también.

Lo primero que es importante recordar aquí es que DeepComposer es una herramienta de aprendizaje. No está destinado a músicos, está destinado a ingenieros que desean aprender sobre IA generativa. Pero AWS no se ayudó a sí mismo al llamar a esto "el primer teclado musical habilitado para aprendizaje automático para desarrolladores del mundo". El teclado en sí, después de todo, es solo un teclado MIDI básico estándar. No hay inteligencia en eso. Todo el trabajo de IA está sucediendo en la nube.

"El objetivo aquí es enseñar IA generativa como una de las tendencias más interesantes en el aprendizaje automático en los últimos 10 años", nos dijo Miller. “Le dijimos específicamente a las GAN, redes de confrontación generativas, donde hay dos redes que se entrenan juntas. La razón que es interesante desde nuestra perspectiva para los desarrolladores es que es muy complicado y muchas de las cosas que los desarrolladores aprenden sobre el entrenamiento de modelos de aprendizaje automático se confunden cuando entrenan a dos juntos ".

Con DeepComposer, el desarrollador realiza un proceso de aprendizaje de los conceptos básicos. Con el teclado, puede ingresar una melodía básica, pero si no la tiene, también puede usar un teclado en pantalla para comenzar o usar algunas melodías predeterminadas (piense en Ode to Joy). Desde una perspectiva práctica, el sistema se apaga y genera una pista de fondo para esa melodía basada en el estilo musical que elija. Sin embargo, para simplificar las cosas, el sistema ignora algunos valores del teclado, incluida la velocidad (en caso de que necesite más evidencia de que este no es un teclado para músicos). Pero lo que es más importante, los desarrolladores también pueden profundizar en los modelos reales que generó el sistema, e incluso exportarlos a una computadora portátil Jupyter.

Para el propósito de DeepComposer, los datos MIDI son solo otra fuente de datos para enseñar a los desarrolladores sobre GAN y SageMaker, la plataforma de aprendizaje automático de AWS que impulsa a DeepComposer detrás de escena.

"La ventaja de usar archivos MIDI y basar el entrenamiento en MIDI es que la representación de los datos que ingresa al entrenamiento está en un formato que es en realidad la misma representación de datos en una imagen, por ejemplo", explicó Miller. "Y, por lo tanto, en realidad es muy aplicable y análogo, por lo que, a medida que un desarrollador mira ese cuaderno SageMaker y comprende el formato de datos y cómo pasamos los datos, eso también se aplica a otros dominios".

Es por eso que las herramientas exponen todos los datos en bruto, incluidas las funciones de pérdida, el análisis y los resultados de los diversos modelos a medida que intentan llegar a un resultado aceptable, etc. Debido a que esta es obviamente una herramienta para generar música, será También exponga algunos de los datos sobre la música, como el tono y las barras vacías.

"Creemos que a medida que los desarrolladores se incorporen a los modelos de SageMaker, verán que, hey, puedo aplicar esto a otros dominios y puedo tomar esto y hacerlo propio y ver qué puedo generar", dijo Miller.

Habiendo escuchado los resultados hasta ahora, creo que es seguro decir que DeepComposer no producirá ningún éxito pronto. Parece bastante bueno para crear una pista de batería, pero las líneas de bajo parecen un poco erráticas. Aún así, es una demostración genial de esta técnica de aprendizaje automático, aunque supongo que su éxito será un poco más limitado que DeepRacer, que es un concepto que es un poco más fácil de entender para la mayoría, ya que la mayoría de los desarrolladores analizarán creo que necesitan poder tocar un instrumento para usarlo y seguir adelante.

Informes adicionales de Ron Miller.

LO MÁS LEÍDO

Leave a Reply

Your email address will not be published. Required fields are marked *