New York Times khởi kiện OpenAI và Microsoft vì đã sao chép bất hợp pháp các bài báo của họ để đào tạo cho công cụ AI

© The New York Times

Tờ báo New York Times (NYT) nổi tiếng mới đây đã lên tiếng tố cáo OpenAI và Microsoft chiếm đoạt nội dung báo chí của họ để cung cấp cho các công cụ AI mà những gã khổng lồ công nghệ này đang phát triển. Vụ kiện được đưa lên tòa án Manhattan của thành phố New York vào thứ Tư tuần trước, đánh dấu cuộc tranh chấp bản quyền nảy lửa giữa một trong những tờ báo uy tín nhất thế giới với trí thông minh nhân tạo.

Cụ thể, NYT đưa ra cáo buộc rằng có đến hàng triệu bài báo của họ đã được sử dụng để đào tạo các mô hình AI phổ biến như GPT-4 của OpenAI và Bing Chat của Microsoft, khiến chúng bắt chước văn phong và tạo ra sự cạnh tranh không lành mạnh.

NYT đã cung cấp nhiều bằng chứng cho thấy các nội dung do AI tạo ra đã sao chép từ những bài báo của họ, đôi khi còn trích dẫn nguyên văn khi chưa được sự cho phép hoặc không ghi rõ nguồn gốc.

Trong số các nội dung bị AI “chôm chỉa” có một bài báo đã đoạt giải Pulitzer về ngành taxi của Thành phố New York và một bài phân tích chuyên sâu về việc các công ty công nghệ như Apple đã gia công phần mềm và định hình lại nền kinh tế toàn cầu như thế nào.

Theo NYT, vụ kiện tụng này không chỉ để bảo vệ tài sản trí tuệ mà còn là việc bảo vệ mô hình kinh doanh của họ. Các công cụ AI được đề cập đã giúp người dùng “vượt rào” và truy cập miễn phí vào thông tin có trả phí của tờ báo, làm sụt giảm doanh thu của họ.

NYT cho biết mình là tài nguyên bị khai thác nhiều nhất trong hành động thu thập dữ liệu hàng loạt này, với hơn 66 triệu hồ sơ được sử dụng để đào tạo các mô hình AI.

Tờ báo cũng trích dẫn một trường hợp trong đó tính năng ‘Browse with Bing’ do ChatGPT cung cấp đã đưa ra các phản hồi “gần như nguyên văn” từ trang đánh giá sản phẩm Wirecutter của họ mà không cung cấp liên kết, dẫn đến lưu lượng truy cập vào trang web và các link liên kết đều sụt giảm nghiêm trọng.

Nổi bật trong vụ kiện là những trường hợp mà kết quả đầu ra của AI không chỉ là sản phẩm bị “sao chép bất hợp pháp” phong cách của NYT, mà chúng còn cắt bỏ những thông tin quan trọng, có thể gây hiểu lầm và sai lệch gây nguy hiểm cho danh tiếng và độ tin cậy của tờ báo.

Trong một ví dụ, NYT cho thấy cách mà Bing Chat của Microsoft đã tạo ra danh sách “15 loại thực phẩm tốt nhất cho tim mạch”, tuy nhiên có đến 12 loại thực phẩm trong đó không hề được liệt kê bởi tờ báo nhưng họ vẫn bị công cụ AI này “nhận vơ”.

Hiện NYT đang kêu gọi “phá hủy” mọi mô hình AI với dữ liệu đào tạo bắt nguồn từ nội dung của mình. Mặc dù chưa nêu rõ họ muốn được bồi thường bao nhiêu cho các cáo buộc đạo văn, nhưng tờ báo nói rằng OpenAI phải chịu trách nhiệm về “thiệt hại hàng tỷ đô la theo luật định và thực tế”.

Theo: DesignTaxi, Engadget, The New York Times