copilot vs插件使用方法,copilot插件怎么离线使用

copilot vs插件使用方法,copilot插件怎么离线使用

从githubcopilotinvestigation中选择

作者: Matthew Butterick

机器心编译

编辑:小蛋,张莹

Copilot是开源社区的“寄生虫”吗?

作为开发人员,GitHub Copilot也许可以在不提问的情况下使用开放源代码。

但是,当Copilot逐渐消失整个开源社区时,你会有什么感觉?

最近,程序员Matthew Butterick在个人博客上呼吁Copilot,宣布进行诉讼调查:

2022年6月,我写了关于GitHub Copilot的法律问题。 开放源代码许可证的处理尤其不当。 最近,我进行了下一步。 重新激活加州律师资格,与Joseph Saveri律师事务所优秀的集体诉讼律师Joseph Saveri、Cadio Zirpoli、Travis Manfredi合作开展新项目——。 正在调查GitHub Copilot违反了对开放源代码作者和最终用户的法律义务

GitHub Copilot是微软经过一年的技术预览后于2022年6月正式发布的产品。 Copilot是Visual Studio和其他IDE插件,用于根据在编辑器中输入的内容生成所谓的“建议”。

那么,Copilot与传统的自动完成功能有什么不同?

Copilot由编解码器支持。 这是由OpenAI开发并得到微软许可的AI系统。

Copilot根据用户输入的文本prompt提供建议,一般可用于小建议,但微软强调Copilot可以建议更大的代码块,例如整个函数主体。

但是,其基础的AI系统Codex是如何训练的呢? 据OpenAI介绍,Codex接受了包含GitHub上的代码的“数千万公共资源库”的培训。 微软自己含糊地描述为“数十亿行的公共代码”。 但是,Copilot研究者Eddie Aftandilian在最近的播客中证实了Copilot是“在GitHub上的公共资源库中被训练的”。

Copilot有什么问题吗?

作者Matthew Butterick认为,无论是培训还是使用,Copilot都存在法律问题。

训练中的法律问题

大多数开源包在许可证下分发,赋予用户一定的权利,并承担一定的义务。 这些许可证的合法实现方法是作者用他们的代码声明他们的版权。

因此,想要使用开源软件的人必须选择是遵守许可证规定的义务,还是使用属于“许可证例外”的代码。

微软和OpenAI承认,Copilot和Codex在GitHub上公开的repo开源软件中进行了培训。 那么,他们选择了哪条路呢?

如果微软和OpenAI选择在每个repo的开源许可证下使用这些repo,则需要发布大量的attri­bu­tion,因为它们几乎是所有开源许可证的最低要求。 但是,现在什么也看不见attri­bu­tion。

因此,微软和OpenAI必须找到“合理使用”的理由。 GitHub前首席执行官NATFriedman在Copilot的技术预览会上表示:“用公开数据训练系统是合理的使用。 \” \”

事实真的如他所说吗? 这是法律问题,不是谁说都行的事。 当然,微软、OpenAI和其他研究机构支持“合理使用”的论点。 Nat Fried­man进一步断言,存在着“机器学习社区广泛依赖”“合理使用”方面的“法理”。 但是软件自由保护组织不同意他的意见,要求微软提供支持其立场的证据。 SFC负责人明确了以下事项。

我们于2021年6月私下询问了Fried­man和其他微软、GitHub的代表,要求他们为GitHub的公开法律立场提供可靠的法律参考……但他们没有提供任何东西。

为什么微软不能为他们的立场提供法律依据? 因为SFC是正确的。 他们没有根据。 一些法院已经考虑了相关问题,但目前没有直接解决AI训练“合理使用”问题的美国判例。 此外,涉及“合理使用”的案例也平衡了多个因素。 即使法院最终裁定某些类型的AI培训“合理使用”,其他类型的培训也可能被排除。 到今天为止,我们不知道Copi­lot或Codex在这个范围内是什么位置。 微软和OpenAI也不知道。

使用中的法律问题

目前还不能说“合理使用”最终将如何应用于AI培训。 但是我们知道这个发现对Copi­lot用户完全没有影响。 为什么? 因为他们只是用Copi­lot发出代码。 那么,这部分代码的版权和许可状态是什么样的呢?

2021年,Nat Fredman声称,Copilot的输出属于操作者,就像使用编译器一样。 但是,Copilot为疏忽大意的人设置了新的陷阱。

微软将Copilot的输出描述为一系列代码“提案”。 微软在这些建议中“不主张任何权利”。 但微软对由此生成的代码的准确性、安全性或扩展的知识产权问题不做任何保证。 如果你接受了Copilot的建议,这一切都将是你的问题。

你必须对你的代码的安全性和质量负责。 使用GitHub Copilot生成的代码时,建议采取与使用其他任何人编写的代码相同的预防措施,包括严格测试、IP扫描和安全漏洞跟踪。

这些推荐代码有什么问题? 正如Copilot用户已经指出的那样,Copilot有可能被引导从可识别的repo一字不差地复制代码。 在此期间,德克萨斯农工大学的Tim Davis教授给出了很多例子,说明Copilot逐字复制了他的代码。

显然,使用此代码将产生遵守许可证的义务。 但是根据Copilot的设计,用户看不到代码的来源、作者、许可证等信息,如何保护呢?

作者Matthew Butterick认为,Copilot的二维码搜索方法是烟雾弹,目的是掩盖肮脏的真相。 Copilot只是一个连接大量开源代码的方便的替代接口。 因此,Copilot用户可能要承担代码原作者授予的许可义务。 在这样的背景下,Nat fredman主张Copilot的操作“……就像编译器一样”。 因为编译器改变了代码的形式,但不会注入新的知识产权属性。 公平地说,微软对此没有异议。 他们只是把它填成了一个小字。

Copilot对开源社区意味着什么?

Matthew Butterick指出,通过提供Copilot作为大量开源代码的替代接口,微软所做的不仅仅是切断开源作者和用户之间的法律关系。 微软可以说正在建造新的“围墙花园”。 那会阻止程序员发现传统的开源社区,或者至少消除了所有这样做的动机。

随着时间的推移,这个过程会使这些社区变得贫弱。 用户的注意力和参与度逐渐转移到Copilot的围墙花园,远离开源项目本身——,远离source repo、issue track­er、邮件列表、dis­cus­sion board。 这种能量的变化对开源来说是痛苦而永久的损失。

微软首席执行官Scott Guthrie最近表示,尽管微软首席执行官Satyanadella收购GitHub时做出了“GitHub仍然是一个开放平台”的乐观承诺,但微软

Matthew Butterick说,他们并不是无缘无故地对GitHub提起诉讼。 他认为,发布开源软件的一大好处是“人”。 以我们工作的用户、测试者、贡献者的社区为中心。 “我们的社区帮助我们不需要以独特的方式改进软件,使工作变得有趣。”

Copilot在开源软件中引入了更多“自私”的接口:只给我想要的东西! 使用Copilot,开源用户不需要知道是谁编写了软件,不需要与社区进行交互,也不需要做出任何贡献。

另外,Matthew Butterick警告说,开源作者必须注意我们的工作隐藏在一个名为Copilot的大型代码库中。 就像农场里的奶牛一样,Copilot想把我们变成开采资源的生产者。

“即使是奶牛,食物和住所也可以从交易中得到,但Copilot对我们的个人项目没有任何贡献。 \” \”

Matthew Butterick认为,Copilot围墙花园与开源对立,存在危害。 因此,这也是GitHub被微软收购之前所代表的所有背叛。 如果你出生于2005年,你会记得GitHub的声誉是基于为开源开发者提供好东西和培养开源社区。 相比之下,Copilot是这种想法的多重疯狂翻转。

换个角度看,你可能是Copilot的粉丝,认为AI是未来。 首先,这里反对的不是一般的人工智能辅助编程工具,而是微软对Copilot的具体选择。 对开放源代码开发者更友好的Copilot版本——可以容易地想象例如参与者是自愿的或编码人员付费地贡献了训练语料库。 尽管现在声称非常喜欢开源,微软似乎并没有选择这些选项。 其次,如果您发现Copilot有价值,很大程度上取决于底层开源培训数据的质量。 Copilot从开源项目中获取生命的最直接影响是恶化Copilot。

Matthew Butterick说:“第一次写Copilot时,‘我不担心对开源的影响。 “短期内,我还不担心。 但是当我回顾将近25年的开源之旅时,我意识到我错过了更大的形象。 毕竟,开源不是一个固定的群体。 这是一种不断成长、不断变化的集体智慧,不断被新鲜思想更新。 我们为彼此设定了新的标准和挑战,提高了我们对成果的期待。

在这个盛大的炼金术中,Copilot闯入了。 目标是将开源能源据为己有。 无需深入研究微软在开源中的曲折历程,就能了解Copilot的本质——寄生虫。

在无法弥补对开源的损害之前,必须测试Copilot的合法性。 这就是我想主张的理由。 \” \”

原文链接: https://githubcopilotinvestigation.com/# what-is-github-copilot

相关推荐

自考从报名到毕业的流程,自学考试从报名到毕业的全部流程

什么是自考简单来说就是自己学习,自己考试。作为成人学历教育中含金量最高的学历提升方式...