Fuel di dati aperti sospetti clone di ai cinesi

Autore: Aria Mar 13,2025

Openi ha espresso preoccupazione per il fatto che i modelli di AI Deepseek della Cina, noti per il loro costo notevolmente basso, potrebbero essere stati sviluppati utilizzando i dati di OpenAI. Ciò ha suscitato forti reazioni, con Donald Trump che chiama DeepSeek una "chiamata di risveglio" per l'industria della tecnologia degli Stati Uniti a seguito di un calo significativo del valore di mercato di Nvidia, una perdita di quasi $ 600 miliardi. L'emergere di Deepseek ha innescato un forte calo dei prezzi delle azioni delle principali società focalizzate sull'intelligenza artificiale. Nvidia, un attore chiave nella tecnologia GPU cruciale per il funzionamento del modello di intelligenza artificiale, ha subito la perdita più sostanziale nella storia di Wall Street, con un calo del 16,86% del valore delle azioni. Anche Microsoft, Meta Platforms, Alphabet e Dell Technologies hanno avuto un calo significativo.

DeepSeek promuove il suo modello R1 come un'alternativa significativamente più conveniente ai modelli AI occidentali come Chatgpt. Costruito sull'open-source DeepSeek-V3, secondo quanto riferito richiede una potenza di calcolo molto inferiore ed è stata addestrata per circa 6 milioni di dollari. Sebbene questo costo sia stato discusso, ha sollevato domande sugli enormi investimenti fatti dalle società tecnologiche americane in AI, causando apprensione degli investitori. La popolarità di Deepseek è aumentata, diventando una migliore app gratuita scaricata negli Stati Uniti, alimentata da discussioni che circondano la sua efficacia.

Bloomberg ha riferito che Openai e Microsoft stanno studiando se Deepseek ha sfruttato l'API di Opens per integrare i modelli AI di Openai. Openai ha confermato la sua consapevolezza di tali tentativi da parte delle società cinesi e di altre società di utilizzare i dati delle principali società di intelligenza artificiale statunitense. Questo processo, noto come distillazione, prevede l'estrazione di dati da modelli più grandi per addestrare quelli più piccoli, violando i termini di servizio di Openi. Openi ha sottolineato il suo impegno a proteggere la sua proprietà intellettuale e collaborare con il governo degli Stati Uniti per salvaguardare la sua tecnologia.

David Sacks, lo zar AI del presidente Donald Trump, ha dichiarato che ci sono prove sostanziali che suggeriscono che DeepSeek ha usato una distillazione per estrarre la conoscenza dai modelli Openai. Prevede che le principali società di intelligenza artificiale implementeranno misure per prevenire incidenti simili.

DeepSeek è accusato di usare il modello di Openi per addestrare il suo concorrente usando la distillazione. Credito di immagine: Andrey Rudakov/Bloomberg tramite Getty Images.

Questa situazione ha messo in evidenza l'ironia della posizione di Openi, date le precedenti accuse del suo uso di materiale protetto da copyright nello sviluppo di CHATGPT. Ed Zitron, uno scrittore di PR Tech, ha sottolineato questa ipocrisia su Twitter. Openai ha precedentemente affermato in una sottomissione alla House of Lords del Regno Unito che è impossibile creare modelli di AI come Chatgpt senza materiale protetto da copyright. Questa affermazione si allinea alla loro difesa contro le azioni legali del New York Times e 17 autori che sostengono violazione del copyright. Openai sostiene che le sue pratiche di formazione costituiscono un "equo uso".

Il panorama legale che circonda i dati di addestramento dell'IA rimane complesso, come evidenziato da una sentenza dell'ufficio del copyright degli Stati Uniti del 2018 che l'arte generata dall'IA non può essere protetto da copyright a causa della mancanza di un nesso di espressione creativa per la mente umana.