Fuelles de datos de OpenAI sospecha de AI chino

Autor: Aria Mar 13,2025

Operai ha expresado su preocupación de que los modelos de AI Deepseek de China, conocidos por su costo notablemente bajo, pueden haberse desarrollado utilizando datos de OpenAI. Esto ha provocado fuertes reacciones, con Donald Trump llamando a Deepseek una "llamada de atención" para la industria tecnológica de los Estados Unidos después de una caída significativa en el valor de mercado de Nvidia, una pérdida de casi $ 600 mil millones. La aparición de Deepseek provocó una fuerte disminución en los precios de las acciones de las principales empresas centradas en la IA. NVIDIA, un jugador clave en tecnología GPU crucial para la operación del modelo de IA, sufrió la pérdida más sustancial en la historia de Wall Street, con una caída del 16.86% en el valor de las acciones. Microsoft, Meta Platforms, Alphabet y Dell Technologies también experimentaron disminuciones significativas.

Deepseek promueve su modelo R1 como una alternativa significativamente más asequible a los modelos de IA occidentales como ChatGPT. Construido sobre el Deepseek-V3 de código abierto, según los informes, requiere mucho menos potencia informática y fue entrenado por aproximadamente $ 6 millones. Si bien este costo ha sido debatido, ha planteado preguntas sobre las inversiones masivas realizadas por las compañías tecnológicas estadounidenses en la IA, lo que provoca la aprehensión de los inversores. La popularidad de Deepseek aumentó, convirtiéndose en una aplicación gratuita descargada en los Estados Unidos, alimentada por las discusiones que rodean su efectividad.

Bloomberg informó que Openai y Microsoft están investigando si Deepseek aprovechó la API de OpenAI para integrar los modelos de IA de OpenAI en su cuenta. Operai confirmó su conciencia de tales intentos de las compañías chinas y de otras compañías de utilizar datos de las principales compañías de IA de EE. UU. Este proceso, conocido como destilación, implica la extracción de datos de modelos más grandes para capacitar a otros más pequeños, violando los términos de servicio de OpenAI. Operai enfatizó su compromiso de proteger su propiedad intelectual y colaborar con el gobierno de los Estados Unidos para salvaguardar su tecnología.

David Sacks, el AI Czar del presidente Donald Trump, declaró que hay evidencia sustancial que sugiere que Deepseek usó la destilación para extraer conocimiento de los modelos Operai. Anticipa que las principales compañías de IA implementarán medidas para evitar incidentes similares.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images.

Esta situación ha destacado la ironía de la posición de OpenAi, dadas las acusaciones anteriores de su propio uso del material con derechos de autor en el desarrollo de ChatGPT. Ed Zitron, un escritor de relaciones públicas tecnológicas, señaló esta hipocresía en Twitter. Operai declaró anteriormente en una sumisión a la Casa de Lores del Reino Unido que es imposible crear modelos de IA como ChatGPT sin material con derechos de autor. Esta declaración se alinea con su defensa contra las demandas del New York Times y 17 autores que alegan infracción de derechos de autor. Operai sostiene que sus prácticas de capacitación constituyen "uso justo".

El paisaje legal que rodea los datos de capacitación de IA sigue siendo complejo, como lo demuestra una decisión de la Oficina de Derechos de Autor de los Estados Unidos de 2018 de que el arte generado por IA no puede tener derechos de autor debido a la falta de una expresión creativa de la mente humana nexus.