A principios de este año, Veterano Estalló en la escena aparentemente de la nada con un modelo de IA que parecía defenderse contra algunos de los mejores. La compañía anunció recientemente la última actualización de su modelo AI, pero la última actualización de Deepseek podría haber usado Google Gemini para entrenar a sí mismo.
Deepseek se entrena con Géminis de Google
Según una publicación en X de Sam Paech, una razón el Último modelo de Deepseek Los «sonidos» diferentes a su iteración anterior es que usó Google Gemini para entrenar a sí mismo. Paech no está solo al pensar esto. El desarrollador de Speechmap señala que los rastros de Deepseek se leen mucho como el de Gemini. Para aquellos que no están familiarizados, las trazas son los procesos de pensamiento los AI El modelo pasa antes de llegar a una conclusión.
Esta no es la primera vez que los desarrolladores de Deepseek han sido acusados de usar otros AIS para entrenar su propio modelo de IA. Cuando llegó Deepseek por primera vez, Openai sospechó que Deepseek había usado chatgpt para entrenar a sí mismo. Es una de las razones por las cuales Deepseek afirmó que su proceso de capacitación cuesta mucho menos que la competencia.
A diferencia de otros modelos de IA que usan datos sin procesar para «aprender», Deepseek utiliza un proceso llamado destilación. Implica el uso de la salida de otros modelos de IA para enseñarse. Es similar al concepto de estudiante-maestro, donde el maestro destila el conocimiento que aprendieron anteriormente de los libros en algo que el alumno puede entender.
Es cierto que es un método más eficiente, pero existe la cuestión de la ética detrás de él. De hecho, los términos de servicio de OpenAI realmente prohíben que los clientes usen los resultados del modelo de IA de la compañía para construir su propia IA competitiva. Si ese es el caso, Deepseek claramente ha violado las políticas de OpenAi.
Éticamente cuestionable, pero eficiente
Si bien las acciones de Deepseek son éticamente cuestionables, algunos piensan que tiene sentido. Por ejemplo, Nathan Lambert, investigador del Instituto de Investigación de AI sin fines de lucro AI2, dice que Tiene sentido Ese Deepseek usaría Google Gemini para entrena.
Según Lambert, «Si fuera profundo, definitivamente crearía una tonelada de datos sintéticos del mejor modelo de API. Tienen poco tiempo en las GPU y enjuague con efectivo. Es literalmente efectivamente más calculador para ellos. Sí en la pregunta de Distill Gemini».
No olvidemos que la guerra comercial estadounidense-China está obstaculizando los avances tecnológicos de China. Esto incluye bloquear el acceso a tecnología de semiconductores más avanzada y limitar el tipo de tecnología que se puede exportar a China. Por lo tanto, no es sorprendente que las empresas chinas, como Deepseek, encuentren formas alternativas de capacitar a sus modelos.
Fuente: Android Headlines