"Có một sự thật sẽ lộ ra trong vụ kiện là New York Times đã trả tiền cho ai đó để hack các sản phẩm của OpenAI", nhóm luật sư của OpenAI nêu trong đơn kiến nghị nộp lên tòa án liên bang ở Manhattan ngày 26/2. Công ty đề nghị thẩm phán "bác bỏ toàn bộ hoặc một phần" trong số 6 cáo buộc mà báo đề cập trong vụ kiện.
Cuối tháng 12/2023, New York Times khởi kiện OpenAI với lý do công ty và đối tác Microsoft đã sử dụng "hàng triệu bài báo" để đào tạo các mô hình ngôn ngữ lớn (LLM) mà không xin phép, cũng như tạo ra nội dung mới dựa trên những gì AI "học" được, quay lại cạnh tranh trực tiếp với dịch vụ của báo.
Bên cạnh cáo buộc hack nền tảng, OpenAI còn cho rằng báo đã đánh lừa hệ thống AI của công ty nhằm tạo ra những bằng chứng sai lệch cho vụ kiện. "Họ phải thực hiện hàng chục nghìn lần thử mới tạo ra được kết quả rất bất thường", theo nội dung hồ sơ. "Người bình thường không sử dụng sản phẩm của OpenAI theo cách này".
Nhà phát triển ChatGPT tiếp tục lập luận rằng báo không có quyền sở hữu các sự kiện và ngôn ngữ - những thứ họ cho là cốt lõi. Tuy vậy, công ty không cung cấp nhiều chi tiết chứng minh cho lời tố cáo của mình.
Luật sư phía New York Times không đưa ra bình luận.
Theo Washington Post, các mô hình LLM như ChatGPT hoạt động bằng cách thu thập lượng lớn tài nguyên lấy trên Internet, sau đó phân tích các mối liên hệ, phát triển khả năng dự đoán từ nào sẽ nói tiếp theo trong câu, cho phép chúng bắt chước lời nói của con người. OpenAI, Microsoft và Google nhiều lần từ chối tiết lộ họ dùng dữ liệu gì để đào tạo AI, nhưng các LLM trước đây được chứng minh đã dùng lượng lớn nội dung từ các tổ chức tin tức và danh mục sách.
OpenAI đang gặp hàng loạt rắc rối liên quan đến vấn đề bản quyền những tháng gần đây sau khi các mô hình AI như ChatGPT bùng nổ. Theo Business Insider, các nhà văn như George RR Martin, Sarah Silverman, John Grisham và hàng nghìn người khác đã kiện công ty vì vi phạm bản quyền. Kể từ tháng 8 năm ngoái, ít nhất 583 tổ chức tin tức, trong đó có New York Times, Washington Post và Reuters, cũng đặt trình chặn để ngăn các công ty công nghệ thu thập bài viết.
The Verge đánh giá nếu thành công, vụ kiện sẽ mở đường cho các tổ chức tin tức khác khởi kiện các công ty có mô hình LLM dùng nội dung báo chí. Thực tế, các tác phẩm báo chí do AI tạo ra đang tăng mạnh. Theo số liệu từ NewsGuard, tổ chức ở New York chuyên theo dõi thông tin sai lệch, AI khiến việc sản xuất và lan truyền tin giả lên cấp độ mới khi có thể tạo nội dung sai sự thật về bầu cử, chiến tranh, thiên tai với tốc độ nhanh. Từ tháng 5 đến tháng 11/2023, website chứa tin giả do AI tạo đã tăng 1.000%, từ 49 trang lên hơn 600 trang.
OpenAI hiện hợp tác với một số tổ chức tin tức để trả tiền cho nội dung dùng để huấn luyện AI. Tháng 7/2023, công ty ký kết với Associated Press. Đầu tháng 12 cùng năm, nhà xuất bản Axel Springer, sở hữu Politico và Business Insider, cũng đạt thỏa thuận tương tự với công ty đứng sau ChatGPT.
Bảo Lâm