Trí thông minh dữ liệu tạo

Copilot của GitHub vướng vào vụ kiện bản quyền nguồn mở đầu tiên

Ngày:

Ý kiến GitHub Copilot, dịch vụ lập trình theo cặp, dựa trên AI của Microsoft, đã cực kỳ phổ biến. Lần đầu tiên Microsoft công bố doanh thu và số lượng đăng ký của GitHub trong báo cáo hàng quý mới nhất của mình.

GitHub hiện có doanh thu định kỳ hàng năm là 1 tỷ đô la, tăng từ mức 200 đến 300 triệu đô la được báo cáo khi được mua lại. Nó hiện tự hào có 90 triệu người dùng hoạt động trên nền tảng, tăng từ 73 triệu vào tháng XNUMX năm ngoái. Phần lớn doanh thu gần đây và lượng người đăng ký tăng vọt có thể được quy cho Copilot. Thật tệ là bữa tiệc có thể sớm kết thúc.

Khi Copilot lần đầu tiên ra mắt, những người thông minh đã lo ngại vì mô hình Học máy (ML) của nó dựa trên Codex của OpenAI; nó bao gồm mã đã được đăng ký bản quyền theo giấy phép nguồn mở này hoặc giấy phép khác. Xét cho cùng, Codex đã được đào tạo trên hàng tỷ dòng mã nguồn có sẵn công khai – bao gồm cả mã trong các kho lưu trữ công khai trên GitHub. Điều đó bao gồm, trong số những thứ khác, tất cả mã của nhiều dự án của Quỹ Apache.

Vì vậy, không có gì ngạc nhiên khi Matthew Butterick, một luật sư, nhà thiết kế và nhà phát triển, thông báo rằng ông đang làm việc với Công ty Luật Joseph Saveri, một công ty luật lớn về vụ kiện tập thể, để điều tra khả năng nộp đơn khiếu nại bản quyền đối với GitHub. Khả năng đó đã trở thành một thực tế.

Vào ngày 3 tháng XNUMX, họ đã đệ đơn kiện tập thể chống lại Microsoft và các đối tác tại Tòa án Quận Hoa Kỳ cho Quận Bắc California. Yêu sách của họ? Copilot là một hệ thống dựa trên AI được đào tạo về truy cập công khai mã nguồn mở được cấp phép [PDF]. Mặc dù GitHub tuyên bố rằng mã mà nó tạo ra cho các lập trình viên không chỉ là bản sao của mã, nhưng trên thực tế, đơn kiện khẳng định, đó chính xác là những gì. “Các bị cáo khẳng định Codex và Copilot không giữ lại các bản sao tài liệu mà họ được đào tạo. Tuy nhiên, trong thực tế, Đầu ra thường là bản sao gần giống mã từ dữ liệu huấn luyện.”

Hơn nữa, “Codex không xác định chủ sở hữu bản quyền đối với Đầu ra này, cũng như bất kỳ ai khác—nó chưa được đào tạo để cung cấp Ghi công. Nó cũng không bao gồm Thông báo Bản quyền cũng như bất kỳ Điều khoản Cấp phép nào được đính kèm với Đầu ra. Đây là do thiết kế — Codex không được mã hóa hoặc đào tạo để tái tạo dữ liệu đó.”

Nói tóm lại, họ cáo buộc Copilot chỉ là một kẻ sao chép vi phạm bản quyền.

Microsoft không thể tranh luận sự thật. Copilot dựa trên mã nguồn mở. Câu hỏi thực sự là liệu hành động của họ có vi phạm bản quyền của mã hay không. Đó có phải là "sử dụng hợp lý" hay là hành vi trộm cắp tài sản trí tuệ? Đó, bạn của tôi, là một câu hỏi phức tạp. Nó sẽ không được giải quyết nhanh chóng. Butterick biết điều này.

“Đây là bước đầu tiên trong một hành trình dài. Theo chúng tôi được biết, đây là vụ kiện tập thể đầu tiên ở Hoa Kỳ thách thức việc đào tạo và đầu ra của các hệ thống AI. Nó sẽ không phải là cuối cùng. Các hệ thống AI không được miễn trừ khỏi luật pháp. Những người tạo ra và vận hành các hệ thống này phải chịu trách nhiệm.”

Tất nhiên, GitHub tuyên bố, “Chúng tôi đã cam kết đổi mới một cách có trách nhiệm với Copilot ngay từ đầu và sẽ tiếp tục phát triển sản phẩm để phục vụ tốt nhất cho các nhà phát triển trên toàn cầu.”

Điều đó không nói lên nhiều, phải không?

Microsoft và OpenAI chưa bình luận gì về vụ kiện. Điều đó sẽ đến trong thời gian. Trường hợp này sẽ không biến mất. Cuối cùng, họ sẽ cần phải giải quyết các khiếu nại. Sau đó, vì tôi thấy không có cơ hội giải quyết vụ việc này ngoài tòa án, nó sẽ bắt đầu hành trình dài chậm chạp thông qua hệ thống luật pháp Hoa Kỳ. Tôi không mong đợi để thấy một câu trả lời dứt khoát trong thập kỷ này.

Trong khi chờ đợi, các nhà lãnh đạo nguồn mở vẫn đang xem xét tất cả các nhánh của vụ kiện này. Simon Phipps, cựu chiến binh Sáng kiến ​​Nguồn mở (OSI) đã đề cập trên Mastodon rằng ông nghĩ “điều duy nhất an toàn là kết luận tại thời điểm này về Copilot là sự không chắc chắn về mặt pháp lý khiến nó không phù hợp để sử dụng trong các dự án nguồn mở".

Tổ chức Bảo tồn Tự do Phần mềm (SFC) giải thích rằng trong khi “vấn đề là nghiêm trọng và quan trọng,” nó không đơn giản. Ví dụ, một nguyên tắc quan trọng của vấn đề giấy phép nguồn mở là “Việc thực thi hướng tới cộng đồng không bao giờ được ưu tiên lợi ích tài chính”. Về bản chất, một vụ kiện tập thể có xu hướng liên quan đến bồi thường tài chính.

SFC hy vọng các nguyên đơn sẽ “tán thành các nguyên tắc này. Chúng tôi chia sẻ sự thất vọng và tức giận của bạn rằng GitHub của Microsoft vẫn tiếp tục vi phạm và việc Microsoft và GitHub từ chối làm việc với cộng đồng liên quan đến hoạt động chống FOSS tích cực của họ và vi phạm giấy phép chưa từng có. Tuy nhiên, cấp phép FOSS chủ yếu không phải là về các mô hình kinh doanh, hoặc phục hồi tài chính. Các hành động của GitHub với Copilot chủ yếu gây khó chịu vì họ tìm cách phá hoại hệ thống copyleft được thiết kế đặc biệt để đảm bảo rằng người dùng, nhà phát triển và người tiêu dùng đều có quyền bình đẳng.”

Những mối nguy hiểm cũng có khả năng lớn đối với người dùng Copilot. Nếu vụ kiện chống lại GitHub thắng, mọi đoạn mã cuối cùng mà bạn tạo ra bằng cách sử dụng nó có thể phải tuân theo nhiều loại giấy phép nguồn mở. Nếu điều đó không làm bạn sợ, hãy nói chuyện với luật sư của công ty bạn. Bạn có thể nhận thấy rằng chúng sẽ chuyển sang màu trắng khi chúng tập trung vào nó.

Không có sai lầm về nó. Vụ kiện này – thắng, thua hoặc hòa – sẽ thay đổi cách chúng ta sử dụng phần mềm mã nguồn mở và AI/ML. Thật vậy, nó có khả năng thay đổi toàn bộ thế giới công nghệ. Đợi đã, chúng ta sẽ có một chuyến đi khó khăn. ®

tại chỗ_img

Tin tức mới nhất

tại chỗ_img