Meta công khai lấy dữ liệu bài viết Facebook đào tạo AI ở châu Âu
Tận dụng nội dung công khai để phát triển trí tuệ nhân tạo
Ngày 14/4, Meta tuyên bố sẽ sử dụng các bài đăng công khai của người dùng tại châu Âu trên nền tảng Facebook, Instagram và Threads để đào tạo các mô hình AI tạo sinh. Dữ liệu bao gồm bài viết, bình luận từ người dùng từ 18 tuổi trở lên, cũng như những tương tác với công cụ Meta AI.
Theo Meta, việc này nhằm giúp trí tuệ nhân tạo của họ hiểu sâu sắc hơn về ngôn ngữ, văn hóa và đặc điểm xã hội của cộng đồng châu Âu, từ đó cải thiện trải nghiệm và khả năng phục vụ của AI đối với người dùng tại khu vực này.
Người dùng có quyền phản đối
Meta cho biết người dùng sẽ nhận được thông báo trên ứng dụng hoặc email, kèm theo mẫu phản đối nếu không muốn chia sẻ dữ liệu công khai của mình. Công ty cam kết đã đáp ứng đầy đủ các nghĩa vụ pháp lý liên quan đến quyền riêng tư và dữ liệu trước khi triển khai kế hoạch này tại châu Âu.
Meta cho biết người dùng sẽ nhận được thông báo trên ứng dụng hoặc email, kèm theo mẫu phản đối nếu không muốn chia sẻ dữ liệu công khai của mình.
Quá trình thu thập dữ liệu không mới
Trên thực tế, Meta đã sử dụng bài đăng và bình luận công khai trên Facebook và Instagram để huấn luyện AI từ lâu. Một số cuộc điều tra cho thấy dữ liệu của người dùng có thể đã được thu thập từ tận năm 2007. Trong năm 2023, Meta từng xác nhận việc này là một phần trong chiến lược phát triển công nghệ AI của hãng.
Riêng với châu Âu, kế hoạch ban đầu dự kiến bắt đầu từ tháng 6/2024 nhưng bị hoãn do các yêu cầu nghiêm ngặt của luật bảo vệ dữ liệu GDPR. Hiện tại, Meta tuyên bố đã điều chỉnh chính sách để phù hợp với các quy định của khu vực.
Các chuyên gia lo ngại về “cơn khát dữ liệu”
Giới chuyên môn cho rằng việc công khai sử dụng nội dung người dùng cho mục đích huấn luyện AI phản ánh thực tế rằng các công ty công nghệ đang "khát" dữ liệu hơn bao giờ hết. Tạp chí Gizmodo ví hành động của Meta như đưa mọi nội dung vào "máy xay dữ liệu", cho rằng đây là cách gián tiếp tuyên bố: “Nội dung của bạn thuộc về nền tảng”.
“Họ cần nội dung của bạn, chứ không cần chính bạn,” Gizmodo nhận định.
Giới chuyên môn cho rằng việc công khai sử dụng nội dung người dùng cho mục đích huấn luyện AI phản ánh thực tế rằng các công ty công nghệ đang "khát" dữ liệu hơn bao giờ hết.
Tranh cãi về quyền sở hữu trí tuệ
Sự việc của Meta diễn ra trong bối cảnh tranh luận về dữ liệu AI và bản quyền đang nóng lên. Cuối tuần qua, Jack Dorsey – CEO của Block và đồng sáng lập Twitter – bất ngờ kêu gọi xóa bỏ toàn bộ luật sở hữu trí tuệ. Lời kêu gọi được Elon Musk ủng hộ công khai, làm dấy lên lo ngại về việc các công ty AI tìm mọi cách khai thác nguồn dữ liệu bản quyền cho huấn luyện mô hình.
Meta khẳng định minh bạch hơn các đối thủ
Kết thúc thông báo, Meta nhấn mạnh:
“Chúng tôi tự hào vì cách tiếp cận của mình minh bạch hơn nhiều so với các đối thủ trong ngành”.
Tuyên bố này được cho là nhằm phản bác những chỉ trích về cách thu thập và sử dụng dữ liệu người dùng, đồng thời khẳng định vị thế tiên phong của hãng trong việc phát triển trí tuệ nhân tạo minh bạch và có trách nhiệm.