La carrera por encontrar nuevos materiales con IA necesita más datos. Meta está regalando enormes cantidades de dinero

La carrera por encontrar nuevos materiales con IA necesita más datos. Meta está regalando enormes cantidades de dinero

“Creemos firmemente que al contribuir a la comunidad y construir sobre modelos de datos de código abierto, toda la comunidad avanza más y más rápido”, dice Larry Zitnick, investigador principal del proyecto OMat.

Zitnick dice que el nuevo modelo OMat24 superará a los Tabla de clasificación de Matbench Discoveryque clasifica los mejores modelos de aprendizaje automático para la ciencia de materiales. Su conjunto de datos también será uno de los más grandes disponibles.

“La ciencia de los materiales está experimentando una revolución en el aprendizaje automático”, afirma Shyue Ping Ong, profesor de nanoingeniería de la Universidad de California en San Diego, que no participó en el proyecto.

Anteriormente, los científicos se limitaban a realizar cálculos muy precisos de las propiedades de los materiales en sistemas muy pequeños o a realizar cálculos menos precisos en sistemas muy grandes, dice Ong. Los procesos eran laboriosos y costosos. El aprendizaje automático ha salvado esa brecha, y los modelos de IA permiten a los científicos realizar simulaciones de combinaciones de cualquier elemento de la tabla periódica de forma mucho más rápida y económica, afirma.

La decisión de Meta de hacer que su conjunto de datos esté disponible abiertamente es más importante que el modelo de IA en sí, dice Gábor Csányi, profesor de modelado molecular en la Universidad de Cambridge, que no participó en el trabajo.

“Esto contrasta marcadamente con otros grandes actores de la industria, como Google y Microsoft, que también publicaron recientemente modelos de apariencia competitiva que fueron entrenados en conjuntos de datos igualmente grandes pero secretos”, dice Csányi.

Para crear el conjunto de datos OMat24, Meta tomó uno existente llamado Alejandría y materiales de muestra del mismo. Luego realizaron varias simulaciones y cálculos de diferentes átomos para escalarlo.

El conjunto de datos de Meta tiene alrededor de 110 millones de puntos de datos, que es muchas veces mayor que los anteriores. Otros tampoco necesariamente tienen datos de alta calidad, dice Ong.