Meta đã yêu cầu một tòa án liên bang của Hoa Kỳ bác bỏ vụ kiện cáo buộc họ đã tải xuống và phân phối trái phép hàng ngàn video khiêu dâm để huấn luyện các hệ thống trí tuệ nhân tạo của mình. Công ty đã nộp một đơn xin bác bỏ vào thứ Hai tại Tòa án Quận Hoa Kỳ cho Khu vực Bắc California, lập luận rằng không có bằng chứng nào cho thấy các mô hình AI của họ chứa hoặc đã được huấn luyện trên tài liệu người lớn có bản quyền. Meta mô tả các cáo buộc này là “vô lý và không có cơ sở,” khẳng định rằng các tuyên bố này hoàn toàn không có cơ sở.
Cáo buộc gốc của Strike 3 Holdings
Khiếu nại ban đầu được nộp vào tháng 7 bởi Strike 3 Holdings, một công ty phim người lớn có trụ sở tại Miami đứng sau các thương hiệu như Vixen, Blacked và Tushy. Công ty đã cáo buộc Meta sử dụng cả địa chỉ IP công ty và địa chỉ IP ẩn để tải xuống gần 2.400 bộ phim của mình kể từ năm 2018. Strike 3 lập luận rằng những lần tải xuống này là một phần của nỗ lực rộng lớn hơn để xây dựng các hệ thống AI đa phương thức có khả năng xử lý dữ liệu hình ảnh và văn bản.
Đặt câu hỏi về quy mô và mô hình tải xuống
Đơn kiện của Meta phản đối logic đằng sau lý thuyết của Strike 3, chỉ ra những mâu thuẫn trong quy mô và kiểu mẫu của các lần tải xuống bị cáo buộc. Theo các tài liệu của tòa án, chỉ có 157 bộ phim của Strike 3 bị cáo buộc đã được tải xuống bằng cách sử dụng địa chỉ IP của Meta trong vòng bảy năm—trung bình khoảng 22 bộ phim mỗi năm trên 47 địa chỉ. Luật sư của Meta, Angela L. Dunning, đã mô tả hoạt động này là “nghèo nàn, không phối hợp” và có khả năng là do “các cá nhân khác nhau” tải xuống nội dung cho mục đích cá nhân chứ không phải nỗ lực phối hợp nào của công ty nhằm thu thập dữ liệu đào tạo cho các hệ thống AI.
Địa chỉ IP gây tranh cãi và thiếu bằng chứng
Đơn kiện cũng thách thức tuyên bố của Strike 3 rằng Meta đã sử dụng hơn 2.500 địa chỉ IP ẩn hoặc của bên thứ ba. Meta lập luận rằng các nguyên đơn đã không xác minh quyền sở hữu của những địa chỉ này và thay vào đó dựa vào các mối tương quan lỏng lẻo. Một trong những dải IP được cho là liên kết với Meta thực tế được đăng ký cho một tổ chức phi lợi nhuận ở Hawaii không có liên quan gì đến công ty, trong khi những dải khác hoàn toàn không có chủ sở hữu xác định. Meta còn cho rằng họ không có kiến thức về hoặc khả năng ngăn chặn bất kỳ lần tải xuống nào được cho là xảy ra, nhấn mạnh rằng họ không thu được lợi ích nào từ chúng và rằng việc giám sát mạng lưới liên tục sẽ vừa khó về mặt kỹ thuật vừa không cần thiết về mặt pháp lý.
Các hệ quả pháp lý và chiến lược
Các chuyên gia pháp lý cho rằng chiến lược bảo vệ của Meta, mặc dù không theo cách thông thường, có thể mang lại sức nặng đáng kể. Dermot McGrath, đồng sáng lập của công ty đầu tư mạo hiểm Ryze Labs, đã nói với Decrypt rằng lựa chọn của Meta để phủ nhận việc sử dụng tài liệu hoàn toàn cho phép họ tránh được những phức tạp trong việc lập luận về việc sử dụng hợp lý hoặc tiết lộ các quy trình đào tạo nội bộ. Theo McGrath, việc thừa nhận rằng dữ liệu như vậy đã được sử dụng sẽ buộc Meta phải biện minh cho việc đưa nó vào và mở hệ thống AI của mình ra sự kiểm tra bên ngoài.
Lỗ hổng tiềm năng cho các trường hợp trong tương lai
McGrath cảnh báo rằng nếu tòa án chấp nhận lập luận bào chữa của Meta, điều này có thể thiết lập một tiền lệ có những hệ quả sâu rộng. Một phán quyết có lợi cho Meta có thể tạo ra một lỗ hổng làm suy yếu các biện pháp bảo vệ bản quyền trong các vụ án liên quan đến AI trong tương lai, khiến việc chứng minh ý định hoặc hướng dẫn của doanh nghiệp trong việc sử dụng dữ liệu trở nên khó khăn hơn. Kết quả là, các công ty có thể trở nên khéo léo hơn trong việc che giấu các phương pháp thu thập dữ liệu của họ.
Cách sử dụng hợp pháp của tài liệu rõ ràng trong AI
Mặc dù có nhiều tranh cãi, các chuyên gia thừa nhận rằng có những lý do hợp lý tại sao các công ty AI có thể xử lý nội dung rõ ràng. Nhiều công ty phát triển các công cụ an toàn và điều chỉnh nhằm phát hiện và chặn nội dung có hại hoặc khiêu dâm. McGrath giải thích rằng các “nhóm đỏ” AI thường đào tạo các bộ lọc an toàn này bằng cách sử dụng các ví dụ rõ ràng, cho phép các hệ thống nhận diện và ngăn chặn việc tạo ra những tài liệu như vậy. “Để xây dựng các bộ lọc an toàn hiệu quả,” ông lưu ý, “bạn cần đào tạo những bộ lọc đó dựa trên các ví dụ về những gì bạn đang cố gắng chặn.”
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Meta yêu cầu bác bỏ vụ kiện bản quyền khiêu dâm liên quan đến cáo buộc đào tạo AI
Meta đã yêu cầu một tòa án liên bang của Hoa Kỳ bác bỏ vụ kiện cáo buộc họ đã tải xuống và phân phối trái phép hàng ngàn video khiêu dâm để huấn luyện các hệ thống trí tuệ nhân tạo của mình. Công ty đã nộp một đơn xin bác bỏ vào thứ Hai tại Tòa án Quận Hoa Kỳ cho Khu vực Bắc California, lập luận rằng không có bằng chứng nào cho thấy các mô hình AI của họ chứa hoặc đã được huấn luyện trên tài liệu người lớn có bản quyền. Meta mô tả các cáo buộc này là “vô lý và không có cơ sở,” khẳng định rằng các tuyên bố này hoàn toàn không có cơ sở.
Cáo buộc gốc của Strike 3 Holdings
Khiếu nại ban đầu được nộp vào tháng 7 bởi Strike 3 Holdings, một công ty phim người lớn có trụ sở tại Miami đứng sau các thương hiệu như Vixen, Blacked và Tushy. Công ty đã cáo buộc Meta sử dụng cả địa chỉ IP công ty và địa chỉ IP ẩn để tải xuống gần 2.400 bộ phim của mình kể từ năm 2018. Strike 3 lập luận rằng những lần tải xuống này là một phần của nỗ lực rộng lớn hơn để xây dựng các hệ thống AI đa phương thức có khả năng xử lý dữ liệu hình ảnh và văn bản.
Đặt câu hỏi về quy mô và mô hình tải xuống
Đơn kiện của Meta phản đối logic đằng sau lý thuyết của Strike 3, chỉ ra những mâu thuẫn trong quy mô và kiểu mẫu của các lần tải xuống bị cáo buộc. Theo các tài liệu của tòa án, chỉ có 157 bộ phim của Strike 3 bị cáo buộc đã được tải xuống bằng cách sử dụng địa chỉ IP của Meta trong vòng bảy năm—trung bình khoảng 22 bộ phim mỗi năm trên 47 địa chỉ. Luật sư của Meta, Angela L. Dunning, đã mô tả hoạt động này là “nghèo nàn, không phối hợp” và có khả năng là do “các cá nhân khác nhau” tải xuống nội dung cho mục đích cá nhân chứ không phải nỗ lực phối hợp nào của công ty nhằm thu thập dữ liệu đào tạo cho các hệ thống AI.
Địa chỉ IP gây tranh cãi và thiếu bằng chứng
Đơn kiện cũng thách thức tuyên bố của Strike 3 rằng Meta đã sử dụng hơn 2.500 địa chỉ IP ẩn hoặc của bên thứ ba. Meta lập luận rằng các nguyên đơn đã không xác minh quyền sở hữu của những địa chỉ này và thay vào đó dựa vào các mối tương quan lỏng lẻo. Một trong những dải IP được cho là liên kết với Meta thực tế được đăng ký cho một tổ chức phi lợi nhuận ở Hawaii không có liên quan gì đến công ty, trong khi những dải khác hoàn toàn không có chủ sở hữu xác định. Meta còn cho rằng họ không có kiến thức về hoặc khả năng ngăn chặn bất kỳ lần tải xuống nào được cho là xảy ra, nhấn mạnh rằng họ không thu được lợi ích nào từ chúng và rằng việc giám sát mạng lưới liên tục sẽ vừa khó về mặt kỹ thuật vừa không cần thiết về mặt pháp lý.
Các hệ quả pháp lý và chiến lược
Các chuyên gia pháp lý cho rằng chiến lược bảo vệ của Meta, mặc dù không theo cách thông thường, có thể mang lại sức nặng đáng kể. Dermot McGrath, đồng sáng lập của công ty đầu tư mạo hiểm Ryze Labs, đã nói với Decrypt rằng lựa chọn của Meta để phủ nhận việc sử dụng tài liệu hoàn toàn cho phép họ tránh được những phức tạp trong việc lập luận về việc sử dụng hợp lý hoặc tiết lộ các quy trình đào tạo nội bộ. Theo McGrath, việc thừa nhận rằng dữ liệu như vậy đã được sử dụng sẽ buộc Meta phải biện minh cho việc đưa nó vào và mở hệ thống AI của mình ra sự kiểm tra bên ngoài.
Lỗ hổng tiềm năng cho các trường hợp trong tương lai
McGrath cảnh báo rằng nếu tòa án chấp nhận lập luận bào chữa của Meta, điều này có thể thiết lập một tiền lệ có những hệ quả sâu rộng. Một phán quyết có lợi cho Meta có thể tạo ra một lỗ hổng làm suy yếu các biện pháp bảo vệ bản quyền trong các vụ án liên quan đến AI trong tương lai, khiến việc chứng minh ý định hoặc hướng dẫn của doanh nghiệp trong việc sử dụng dữ liệu trở nên khó khăn hơn. Kết quả là, các công ty có thể trở nên khéo léo hơn trong việc che giấu các phương pháp thu thập dữ liệu của họ.
Cách sử dụng hợp pháp của tài liệu rõ ràng trong AI
Mặc dù có nhiều tranh cãi, các chuyên gia thừa nhận rằng có những lý do hợp lý tại sao các công ty AI có thể xử lý nội dung rõ ràng. Nhiều công ty phát triển các công cụ an toàn và điều chỉnh nhằm phát hiện và chặn nội dung có hại hoặc khiêu dâm. McGrath giải thích rằng các “nhóm đỏ” AI thường đào tạo các bộ lọc an toàn này bằng cách sử dụng các ví dụ rõ ràng, cho phép các hệ thống nhận diện và ngăn chặn việc tạo ra những tài liệu như vậy. “Để xây dựng các bộ lọc an toàn hiệu quả,” ông lưu ý, “bạn cần đào tạo những bộ lọc đó dựa trên các ví dụ về những gì bạn đang cố gắng chặn.”