Nhiên liệu dữ liệu openai nghi ngờ bản sao AI của Trung Quốc

Tác giả: Aria Mar 13,2025

Openai đã lên tiếng lo ngại rằng các mô hình AI Deepseek của Trung Quốc, được biết đến với chi phí thấp đáng kể, có thể đã được phát triển bằng cách sử dụng dữ liệu từ Openai. Điều này đã thúc đẩy những phản ứng mạnh mẽ, với việc Donald Trump gọi Deepseek là một "cuộc gọi đánh thức" cho ngành công nghệ Mỹ sau khi giảm đáng kể giá trị thị trường của NVIDIA, một khoản lỗ gần 600 tỷ đô la. Sự xuất hiện của DeepSeek đã gây ra sự sụt giảm mạnh về giá cổ phiếu của các công ty tập trung AI lớn. NVIDIA, một người chơi chính trong công nghệ GPU quan trọng cho hoạt động mô hình AI, chịu tổn thất đáng kể nhất trong lịch sử Phố Wall, với giá trị cổ phiếu giảm 16,86%. Các nền tảng Microsoft, Meta, Bảng chữ cái và Dell Technologies cũng trải qua những sự suy giảm đáng kể.

Deepseek quảng bá mô hình R1 của mình như một sự thay thế giá cả phải chăng hơn đáng kể cho các mô hình AI của phương Tây như TATGPT. Được xây dựng dựa trên Deepseek-V3 nguồn mở, nó được báo cáo đòi hỏi sức mạnh tính toán ít hơn nhiều và được đào tạo với giá ước tính khoảng 6 triệu đô la. Mặc dù chi phí này đã được tranh luận, nó đã đặt ra câu hỏi về các khoản đầu tư lớn được thực hiện bởi các công ty công nghệ Mỹ trong AI, gây ra sự e ngại của nhà đầu tư. Sự nổi tiếng của Deepseek tăng vọt, trở thành một ứng dụng miễn phí được tải xuống hàng đầu ở Mỹ, được thúc đẩy bởi các cuộc thảo luận xung quanh hiệu quả của nó.

Bloomberg đã báo cáo rằng Openai và Microsoft đang điều tra xem liệu Deepseek đã tận dụng API của Openai để tích hợp các mô hình AI của Openai. OpenAI đã xác nhận nhận thức về những nỗ lực như vậy của Trung Quốc và các công ty khác để sử dụng dữ liệu từ các công ty AI dẫn đầu Hoa Kỳ. Quá trình này, được gọi là chưng cất, liên quan đến việc trích xuất dữ liệu từ các mô hình lớn hơn để đào tạo các mô hình nhỏ hơn, vi phạm các điều khoản dịch vụ của Openai. Openai nhấn mạnh cam kết bảo vệ tài sản trí tuệ của mình và hợp tác với chính phủ Hoa Kỳ để bảo vệ công nghệ của mình.

David Sacks, AI của Tổng thống Donald Trump, tuyên bố có bằng chứng đáng kể cho thấy Deepseek đã sử dụng chưng cất để trích xuất kiến ​​thức từ các mô hình Openai. Ông dự đoán các công ty AI hàng đầu sẽ thực hiện các biện pháp để ngăn chặn các sự cố tương tự.

Deepseek bị buộc tội sử dụng mô hình Openai, để đào tạo đối thủ cạnh tranh bằng cách chưng cất. Tín dụng hình ảnh: Andrey Rudakov/Bloomberg qua Getty Images.

Tình huống này đã nhấn mạnh sự trớ trêu của vị trí của Openai, với những lời buộc tội trước đây về việc sử dụng tài liệu có bản quyền của chính mình trong việc phát triển Chatgpt. Ed Zitron, một nhà văn PR công nghệ, đã chỉ ra sự giả hình này trên Twitter. Openai trước đây đã tuyên bố trong một bản đệ trình lên House of Lords của Vương quốc Anh rằng việc tạo ra các mô hình AI như Chatgpt mà không có tài liệu có bản quyền là không thể. Tuyên bố này phù hợp với sự bảo vệ của họ chống lại các vụ kiện từ Thời báo New York và 17 tác giả cáo buộc vi phạm bản quyền. Openai duy trì rằng các thực hành đào tạo của nó cấu thành "sử dụng hợp lý".

Phong cảnh pháp lý xung quanh dữ liệu đào tạo AI vẫn còn phức tạp, bằng chứng là một văn phòng bản quyền năm 2018 của Hoa Kỳ phán quyết rằng nghệ thuật do AI tạo ra không thể có bản quyền do thiếu một biểu hiện tạo ra tâm trí của con người.