Estos días, inteligencia artificial está en todas partes. La mayoría de las grandes empresas tecnológicas han adoptado la inteligencia artificial, ya sea creando sus propios modelos o incorporando modelos de terceros en sus servicios o nuevas funciones. Metauno de los grandes actores de la industria, ha anunciado un nuevo modelo de IA «Evaluador autodidacta» que tiene como objetivo evaluar y entrenar de forma autónoma otros modelos de IA.
Uno de los principales problemas con el desarrollo de modelos de IA son los costos relacionados. En el estado actual de la industria, se necesitan grandes inversiones para ponerse al día y ser competitivos. Además, los desarrolladores utilizan una técnica conocida como “Aprendizaje reforzado a partir de la retroalimentación humana” (RLAIF) durante el proceso de capacitación. Como sugiere su nombre, RLAIF requiere participación humana, lo que puede ralentizar el proceso. Dicho eso, El nuevo evaluador autodidacta de Meta pretende eliminar tal requisito.
El modelo de IA evaluador autodidacta de Meta puede entrenar y evaluar otras IA sin intervención humana
RLAIF utiliza expertos humanos para garantizar que la IA en desarrollo brinde respuestas sólidas y confiables. Después de todo, no importa cuán poderosa sea una IA si tiene una alta tasa de error. Las partes humanas también deben garantizar que los datos utilizados para el proceso de entrenamiento de IA sean correctos. Esto no sólo aumenta los tiempos de desarrollo sino también los costos asociados.
Sin embargo, Evaluador autodidacta de Meta modelo es capaz de evaluar y entrenar otros modelos de IA. Para lograrlo, Evaluador Autodidacta utiliza la técnica de “cadena de pensamiento” que OpenAI implementó en los modelos o1. Esta técnica se basa en abordar problemas complejos dividiéndolos en pasos lógicos más pequeños. Esto da como resultado respuestas más precisas en áreas avanzadas como ciencias, codificación y matemáticas.
De hecho, Meta desarrolló el propio modelo de Evaluador Autodidacta con la técnica de la cadena de pensamiento. Utilizaron datos puramente generados por IA para entrenarlo. «Esperamos que, a medida que la IA se vuelva cada vez más sobrehumana, sea cada vez mejor en la comprobación de su trabajo para que sea realmente mejor que el humano promedio», dijo Jason Weston, uno de los investigadores involucrados.
Provocando un futuro potencial lleno de IA autónomas
Una IA capaz de aprender y evaluar por sí misma sin intervención humana suena como un concepto futurista sacado de una película de ciencia ficción. Sin embargo, los acontecimientos recientes sugieren que quizás no estemos muy lejos de algo como esto. Los expertos en IA sugieren que la implementación de tales modelos en diversos campos podría eliminar en gran medida la intervención humana.
Fuente: Android Headlines