August 2025
AI训练与著作合理使用:美国Anthropic案裁决的启示
美国联邦加州北区地方法院2025年6月就多名作家控告AI新创公司Anthropic PBC,(下称「Anthropic公司」)案
[1]
,对Anthropic公司提出的合理使用即决判决声请做出一项具有指标意义的裁决(order on fair use),认定将书籍用于训练生成式AI,属于著作之合理使用(fair use),故不构成著作权侵害。
一、事实概述
被告Anthropic公司是由OpenAI公司前研发副总裁Dario Amodei等人在2021年1月创立,其核心价值是希望打造出人类不会恐慌的AI [2] 。Anthropic公司的生成式AI产品名为Claude,擅长编写程式码和文本推理 [3] 。
Anthropic公司透过建立一个旨在收纳「世界上所有的书」的中央图书馆(a central library of “all the books in the world”),以训练大型语言模型(Large Language Model,下称「LLM」),藉此提升Claude的性能。除了从盗版网站下载数百万本书籍电子档外,Anthropic公司亦购买纸本书籍、拆除装订、逐页扫描成电子档,并将所有书籍电子档编入资料库后,丢弃原纸本书籍。即使部份书籍不再用于训练LLM,Anthropic公司仍将其永久保留于资料库内。
原告为三位作家,指控Anthropic公司在未经授权下,复制、储存并将其书籍用于训练LLM,已构成著作权之侵害。对此,被告Anthropic公司则抗辩其行为属著作之合理使用,并声请法院对此争点做成即决判决。
二、法院见解
法院将此案的争点分为三个部分进行审理,并得出不同的结论:
(一) 将合法购得之书籍用于训练LLM,属于著作之合理使用
法院认为Anthropic公司虽然涉及复制原著作,但其目的并非向使用者揭露或替代原著作内容,而是将其作为训练LLM的资料,使其得以创造出与原著作不同的新内容。此种「转化性使用」与原著作的典型用途完全不同。法院同时指出,著作权法旨在保护创作本身,而非压抑其他文风类似的创作,因此,即使 Claude 作出的回应文风可能与原作相似,也未取代原著作在市场上的地位。
(二) 将购得的书籍编入资料库,属于著作之合理使用
法院认为Anthropic公司购买纸本书籍后,即拥有对该书籍的完整处分权。将书籍格式由纸本转为电子档,目的仅在于节省储存空间并提升检索便利性,与书籍本身之创作性无关。此外,Anthropic 公司在格式转换后销毁了原纸本,并未额外增加副本数量。因此,此种使用行为亦属「转化性使用」,且未侵害著作权法赋予原告的排他权利。
(三) 将自盗版网站下载的书籍编入资料库,不属于著作之合理使用
法院认为,Anthropic公司无法证明自盗版网站下载,而非购买或以其他合法方式取得该等书籍,系合理且必要,且Anthropic公司自盗版网站下载该等得以购买方式取得之书籍,已经取代该等书籍原先之市场需求,本身即构成著作权侵害,不因嗣后合理使用该等书籍(即用于训练LLM)而有不同。
三、Anthropic案裁决的启示
本案明确划定生成式AI开发过程中,著作合理使用的重要界线。法院认为,将著作用于训练LLM,使其学习文风而非直接揭露原著作内容,具有「转化性」而属合理使用。然而,若著作来源本身不合法,即便后续被用于训练LLM,仍构成著作权侵害。
本判决具有指标意义,其给予企业一个的重要启示:在进行生成式AI开发时,应在资料取得初期就建立完整的纪录,并厘清资料来源的合法性,可以有效降低著作权侵害之法律风险。
[1] Andrea Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417-WHA (N.D. Cal.).
[2] 数位时代,〈OpenAI「7叛徒」成立的Anthropic,创业宗旨是什么?Claude 3跟ChatGPT有什么不同?〉,网址:https://www.bnext.com.tw/article/78601/anthropic-startup,最后浏览日:2025年8月29日。
[3] 巨亨网,〈更强、更快!Anthropic推出新模型「Claude 3.5 Sonnet」 力压OpenAI〉,网址:https://news.cnyes.com/news/id/5608748,最后浏览日:2025年8月29日。
一、事实概述
被告Anthropic公司是由OpenAI公司前研发副总裁Dario Amodei等人在2021年1月创立,其核心价值是希望打造出人类不会恐慌的AI [2] 。Anthropic公司的生成式AI产品名为Claude,擅长编写程式码和文本推理 [3] 。
Anthropic公司透过建立一个旨在收纳「世界上所有的书」的中央图书馆(a central library of “all the books in the world”),以训练大型语言模型(Large Language Model,下称「LLM」),藉此提升Claude的性能。除了从盗版网站下载数百万本书籍电子档外,Anthropic公司亦购买纸本书籍、拆除装订、逐页扫描成电子档,并将所有书籍电子档编入资料库后,丢弃原纸本书籍。即使部份书籍不再用于训练LLM,Anthropic公司仍将其永久保留于资料库内。
原告为三位作家,指控Anthropic公司在未经授权下,复制、储存并将其书籍用于训练LLM,已构成著作权之侵害。对此,被告Anthropic公司则抗辩其行为属著作之合理使用,并声请法院对此争点做成即决判决。
二、法院见解
法院将此案的争点分为三个部分进行审理,并得出不同的结论:
(一) 将合法购得之书籍用于训练LLM,属于著作之合理使用
法院认为Anthropic公司虽然涉及复制原著作,但其目的并非向使用者揭露或替代原著作内容,而是将其作为训练LLM的资料,使其得以创造出与原著作不同的新内容。此种「转化性使用」与原著作的典型用途完全不同。法院同时指出,著作权法旨在保护创作本身,而非压抑其他文风类似的创作,因此,即使 Claude 作出的回应文风可能与原作相似,也未取代原著作在市场上的地位。
(二) 将购得的书籍编入资料库,属于著作之合理使用
法院认为Anthropic公司购买纸本书籍后,即拥有对该书籍的完整处分权。将书籍格式由纸本转为电子档,目的仅在于节省储存空间并提升检索便利性,与书籍本身之创作性无关。此外,Anthropic 公司在格式转换后销毁了原纸本,并未额外增加副本数量。因此,此种使用行为亦属「转化性使用」,且未侵害著作权法赋予原告的排他权利。
(三) 将自盗版网站下载的书籍编入资料库,不属于著作之合理使用
法院认为,Anthropic公司无法证明自盗版网站下载,而非购买或以其他合法方式取得该等书籍,系合理且必要,且Anthropic公司自盗版网站下载该等得以购买方式取得之书籍,已经取代该等书籍原先之市场需求,本身即构成著作权侵害,不因嗣后合理使用该等书籍(即用于训练LLM)而有不同。
三、Anthropic案裁决的启示
本案明确划定生成式AI开发过程中,著作合理使用的重要界线。法院认为,将著作用于训练LLM,使其学习文风而非直接揭露原著作内容,具有「转化性」而属合理使用。然而,若著作来源本身不合法,即便后续被用于训练LLM,仍构成著作权侵害。
本判决具有指标意义,其给予企业一个的重要启示:在进行生成式AI开发时,应在资料取得初期就建立完整的纪录,并厘清资料来源的合法性,可以有效降低著作权侵害之法律风险。
[1] Andrea Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417-WHA (N.D. Cal.).
[2] 数位时代,〈OpenAI「7叛徒」成立的Anthropic,创业宗旨是什么?Claude 3跟ChatGPT有什么不同?〉,网址:https://www.bnext.com.tw/article/78601/anthropic-startup,最后浏览日:2025年8月29日。
[3] 巨亨网,〈更强、更快!Anthropic推出新模型「Claude 3.5 Sonnet」 力压OpenAI〉,网址:https://news.cnyes.com/news/id/5608748,最后浏览日:2025年8月29日。