O OpenAI Data combusta suspeita de clone chinês de IA

Autor: Aria Mar 13,2025

O Openai manifestou preocupações de que os modelos Deepseek AI da China, conhecidos por seu custo notavelmente baixo, possam ter sido desenvolvidos usando dados do OpenAI. Isso provocou fortes reações, com Donald Trump chamando Deepseek de "chamada de despertar" para o setor de tecnologia dos EUA após uma queda significativa no valor de mercado da NVIDIA-uma perda de quase US $ 600 bilhões. O surgimento da Deepseek desencadeou um declínio acentuado nos preços das ações das principais empresas focadas na IA. A NVIDIA, uma participante importante na tecnologia GPU crucial para a operação do modelo de IA, sofreu a perda mais substancial na história de Wall Street, com uma queda de 16,86% no valor da ação. Microsoft, Meta Plataformas, Alfabet e Tecnologias Dell também sofreram declínios significativos.

A Deepseek promove seu modelo R1 como uma alternativa significativamente mais acessível aos modelos ocidentais de IA como o ChatGPT. Construído sobre o Deepseek-V3 de código aberto, ele requer muito menos poder de computação e foi treinado para cerca de US $ 6 milhões. Embora esse custo tenha sido debatido, levantou questões sobre os enormes investimentos feitos pelas empresas de tecnologia americanas na IA, causando apreensão dos investidores. A popularidade de Deepseek aumentou, tornando -se um aplicativo grátis dos EUA nos EUA, alimentado por discussões em torno de sua eficácia.

A Bloomberg relatou que o OpenAi e a Microsoft estão investigando se a API do DeepSeek alavancou o Openai para integrar os modelos de IA do OpenAI. A OpenAI confirmou sua conscientização sobre tais tentativas de chineses e outras empresas de utilizar dados das empresas de IA liderando. Esse processo, conhecido como destilação, envolve a extração de dados de modelos maiores para treinar os menores, violando os termos de serviço da OpenAI. A Openai enfatizou seu compromisso de proteger sua propriedade intelectual e colaborar com o governo dos EUA para proteger sua tecnologia.

David Sacks, o czar da AI do presidente Donald Trump, afirmou que há evidências substanciais sugerindo que a Deepseek usou a destilação para extrair conhecimento dos modelos Openai. Ele antecipa que as principais empresas de IA implementarão medidas para evitar incidentes semelhantes.

A Deepseek é acusada de usar o modelo da OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.

Esta situação destacou a ironia da posição do OpenAI, dadas as acusações anteriores de seu próprio uso de material protegido por direitos autorais no desenvolvimento do ChatGPT. Ed Zitron, um escritor de relações públicas, apontou essa hipocrisia no Twitter. O Openai declarou anteriormente em uma submissão à Casa dos Lordes do Reino Unido de que a criação de modelos de IA como ChatGPT sem material protegido por direitos autorais é impossível. Esta declaração se alinha com sua defesa contra ações judiciais do New York Times e 17 autores alegando violação de direitos autorais. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo".

O cenário legal em torno dos dados de treinamento da IA ​​permanece complexo, como evidenciado por um escritório de direitos autorais dos EUA em 2018 que decidiu que a arte gerada pela IA não pode ser protegida por direitos autorais devido à falta de um nexo de expressão criativa da mente humana.