Warning: file_get_contents(): SSL operation failed with code 1. OpenSSL Error messages: error:14090086:SSL routines:ssl3_get_server_certificate:certificate verify failed in /home/wwwroot/travigators.com/wp-includes/functions.php on line 3363

Warning: file_get_contents(): Failed to enable crypto in /home/wwwroot/travigators.com/wp-includes/functions.php on line 3363

Warning: file_get_contents(https://www.travigators.com/wp-content/themes/ink-context-blog/images/default-header-image-ink.jpg): failed to open stream: operation failed in /home/wwwroot/travigators.com/wp-includes/functions.php on line 3363

是“合理使用”还是“侵犯版权”?大英百科全书起诉 OpenAI 或改革行业规则 大英百科全书及其子公司韦氏词典最近在曼哈顿联邦法院起诉 OpenAI,指控这家人工智能 (AI) 巨头滥用参考资料来训练人工智能模型。该诉讼的核心问题是,OpenAI 未经授权使用大约 10 万篇大英百科全书文章来训练人工智能,是否应被视为“合理使用”或被禁止的“版权侵权”。业内人士指出,本案远远超出了人工智能版权纠纷的范围。大英百科全书正在向人工智能时代的“源头秩序”发起反击,从传统的版权侵权到新型的商标、版权纠纷,从训练数据的“输入端”到生成内容的“输出端”,各方都在争论“合理使用”的界限。在人工智能模型的学习(数据输入)阶段获取数据构成版权侵权。据路透社报道,大英百科全书在 3 月 13 日提交的投诉中表示,OpenAI 使用了大英百科全书约 10 万篇在线文章、百科全书和词典条目来训练其聊天机器人 ChatGPT 如何回答用户问题。抄袭活动是“系统性的、大规模的”。投诉称,ChatGPT“搭便车”大英百科全书的高质量、可信内容,并将后者内容的价值无偿转移给 OpenAI。 OpenAI 发言人对 3 月 16 日的诉讼作出回应称:“我们的人工智能模型旨在推动创新,他们的训练基于公开数据并遵守‘合理使用’原则。”这是AI行业针对版权诉讼的标准防御框架,该公司表示认为将受版权保护的内容转换为训练数据是“然而,本案的独特之处在于人工智能所使用的大英百科全书内容的性质。这与普通的人工智能信息、网页或新闻页面不同。百科全书条目和词典定义经过严格的编译、审查和更新过程,以确保其唯一性和可靠性。这是具有稳定商业价值的版权产品。当人工智能模型吸收这些类型的“高ca结构化知识体系”而不是来自互联网的分散信息时,限制值得注意的是,大英百科全书并没有被动等待侵权发生,投诉称该公司在2024年11月主动联系OpenAI探讨授权合作的可能性,但OpenAI尽管与其他类似出版商有授权协议,但“没有认真考虑授权”。s。事实上,当前的一些学术研究表明,在人工智能生成时代,数据“不再局限于静态内容,而是渗透到人工智能生命周期的各个阶段,从构成模型参数的训练样本,到驱动现实世界部署的文字和结果。“入口”不再涵盖数据在模型中继续发挥作用的整个过程。大英百科全书提起的诉讼就触及了这个核心矛盾。即使训练阶段的复制品被认为是“转化”,如果这些内容在模型制作过程中不断被重复使用,权利人的控制权该如何保障?人工智能“记忆”的再现引发批评,训练阶段的争议是否还能在“转化使用”下讨论,大英百科全书提出的“输出阶段”指控将OpenAI推入传统复制者的禁区。侵权复制。大英百科全书在周三的投诉中包含了详细的比较证据,指责ChatGPT在回应用户请求时制作了与原作“字面”相同或非常相似的内容。“ChatGPT复制了原告受版权保护的内容的语言、含义和信息,并将其重新包装以供消费者使用。”诉讼称:“ChatGPT 没有添加任何新的语言、含义或信息”。OpenAI 也是一种人工智能,通过生成相关内容的摘要来“蚕食”大英百科全书的网络流量。这是当前人工智能版权诉讼中最具争议的核心问题。该模型是“抽象学习”还是在特定条件下“记忆”复制原始文本?当用户输入“给我大英百科全书有关教育的文章”时,它会生成由ChatGPT 与原始版本几乎相同,在这种情况下,AI 不再被动地“学习”知识。ge,但积极“服务”受版权保护的源材料。从数据保护的角度来看,这种现象揭示了一个深刻的困境。当数据包含在模型的训练中时,其存在形式从独立且可区分的任务彻底改变为分布式且难以跟踪的参数和权重。大英百科全书证实 OpenAI 使用了大约 100,000 篇文章,但指出“复制的真实程度只有 OpenAI 自己知道”。这种信息不对称自然使权利人在维护自己的权利时处于弱势地位。一些提出禁令和赔偿要求的媒体分析师认为,大英百科全书诉 OpenAI 案中最显着的创新是商标和来源归属,而不是版权。诉状称,OpenAI不仅暗示其有权复制大英百科全书的内容,而且还以不当方式暗示其有权复制大英百科全书的内容。引用《大英百科全书》中人工智能生成的“幻觉”信息,将事实不准确的陈述归咎于这个拥有250多年历史的权威知识机构。这涉及版权法之外的深层次问题,例如人工智能时代如何保护“来源的真实性”和“商标签名的权威性”。内容对于百科全书、词典等知识品牌来说固然重要,但真正缺少的是长期被社会认可的可信来源的身份。如果AI生成了带有大英百科全书名称的错误内容,不仅会损害特定条目的点击量,还会损害品牌所代表的知识权威。西方媒体报道称,这起诉讼是针对一家科技公司未经许可使用培训材料而提出的版权索赔。他指出,这是公众的回应。众多维权行动之一由人工智能系统发起。大英百科全书去年对人工智能初创公司 Perplexity AI 提起了类似的版权诉讼,目前该案仍在审理中。业内人士表示,该诉讼是继大英百科全书起诉Perplexity AI之后,传统知识机构对AI时代“源头秩序”的一次重大反击。 OpenAI 声称进行了“合理使用”辩护,但该诉讼可能会合并为纽约南区的多区诉讼(MDL),并将与《纽约时报》和其他诉讼一起审理。最终裁决可能会重塑整个人工智能行业的规则。 《大英百科全书》在诉状中称,法院命令禁止 OpenAI 侵权,并要求 OpenAI 支付一笔金额不详的赔偿。目前,无论此案未来结果如何,人工智能的发展不应该以牺牲为代价,这一基本共识已经形成。“原产地秩序”的消解,数据保护也必须适应AI时代的技术特征。 □大市明治
(编辑:何欣)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

作者

相关文章

智库:全球能源转型投资达2.3万亿美元

在全球地缘政治复杂、宏观经济充满挑战的时代,...

读出全部

让我们逐渐让急救用品更容易找到和使用。

近年来,自动体外除颤器(AED)在公共场所变...

读出全部

高科技带来伟大成就

机器人不仅能“记忆”食物并送出,还能把蜜饯山...

读出全部

3月26日,国内黄金期货下跌0.28%。

中国经济网北京3月26日讯:今日上海期货交易...

读出全部