September 2025
美國著作權局關於「著作權與AI」報告三部曲
第三部分:生成式AI的訓練
美國著作權局(U.S. Copyright Office)於2025年5月發布關於「著作權與AI」報告三部曲的第三部分,探討「生成式AI的訓練」(Generative AI Training)」議題。這份報告是基於美國著作權局先前於 2023 年 8 月發布的徵詢意見書(Notice of Inquiry, NOI)與各方回覆所彙編而成。NOI廣泛徵集意見後,引發了業界、學界與創作者之間一場深刻且意見分岐的辯論。這場辯論的核心,體現了兩大重要價值的權衡拉鋸,如天秤的兩端,一端是「技術創新的迫切需求」,另一端則是「創作者的著作權保障」。 本所前已介紹第一部分與第二部分報告,本文將接續介紹第三部分報告之內容與建議,並提出對我國之啟示。
一、技術背景概述:生成式 AI 模型如何訓練?
在進一步探討著作權與AI模型訓練的議題前,需要先了解生成式AI模型訓練的基礎技術原理:
1. 機器學習與神經網路
生成式 AI 模型並非透過人類制定的程式規則來運作,而是透過機器學習的過程,從海量訓練資料中「學習」出統計模式與關係。此過程由神經網路完成,神經網路是一種複雜的數學函數,由數十億個「參數」或「權重」組成。在訓練階段,這些權重會持續反覆調整,以提升模型效能。最終形成的模型,其本質就是由這些從資料中「學習」到的模式權重。
2. 訓練資料
生成式 AI 的表現優劣,高度取決於訓練資料的數量、品質與用途。首先,在數量上,模型通常需要數以百萬或數十億筆作品作為基礎,資料的規模與模型表現能力有直接相關。資料常見來源包括網路公開資料、授權資料、或開發者自有的使用者資料。需注意的是,「公開可得」並不等同於「授權合法」,這是引發著作權爭議的關鍵點之一。無論原始資料來源為何,通常都需經過編纂(curation),以利於訓練。「編纂」包括資料的過濾、清理與彙整。這些步驟不僅影響模型最終效能,也涉及高度的著作權與授權爭議。
3. 訓練過程
部分NOI回覆意見將訓練階段區分成「前訓練階段」(pre-training)與「後訓練階段」(post-training)。前者是生成式 AI 展現其核心進階能力的關鍵,在此階段,模型會接觸大量的文本或其他資料,並學習預測下一個「token」(詞元)。透過對數十億個範例的重複學習,模型最終學會語言、圖像或聲音等背後的潛在模式。
4.記憶與部署
生成式 AI 在訓練過程中可能出現「記憶化」現象,即模型輸出與訓練資料高度相似,甚至逐字重現。業者如 OpenAI等開發商主張模型內部僅存有統計參數與權重,不包含原始資料的「副本」。不過,部分NOI回覆意見指出質疑,主張若模型確實能生成與原作高度相似的內容,其實質效果等同於對特定作品的「記憶」。學界則折衷地認為,模型學到的模式可以抽象也可以具體。當學習到的模式達到高度具體時,則可能產生「記憶化」現象。雖然記憶化可能有助於提升模型的實用性,但由於輸出的內容可能與訓練資料極為相似,從而引發實質的侵權疑慮。
二、構成「形式侵權」之探討
美國著作權法賦予著作權人重製、發行、公開表演、公開展示及製作衍生作品等多項專屬權利。要構成形式侵權(prima facie infringement),必須滿足兩個要件:一是權利人擁有有效著作權,二是發生對於著作中原創性要素的複製。生成式 AI 的開發與使用若涉及受著作權保護之作品,即可能在下列核心環節中構成形式侵權:
1. 資料蒐集與編纂:
AI訓練的第一步,是獲取和準備資料。這個過程的必要行為,如資料的下載、在不同儲存媒介間的轉移等,直接涉及對著作權人「重製權」的侵害。多數意見認為,在這個資料取得與編纂階段所進行的複製行為,確實構成重製權的侵害。
2. 訓練過程:
AI模型的訓練過程涉及對資料的多次複製與處理,結果可能導致模型權重中含有訓練資料的複製品。因此,即使後續複製模型權重的人並未參與訓練,也可能構成「形式侵權」。如前所述,模型可能會有「記憶」訓練範例的現象,若模型能在未經外部提示的情況下,生成實質相似的訓練範例,則表示該表達形式已以某種方式存在於模型權重中。
法院對於模型權重是否侵權的案件有不同見解。在Andersen v. Stability AI [1] 案中,即使被告僅下載而未參與模型之訓練,法院仍以「該模型中已保留了複製品或受保護的要素」,而認為本件構成著作權之侵害。美國著作權局同意該法院之見解,並指出:欲判斷模型之權重是否涉及著作權之侵害,需視該模型是否保留或記住原作品中「實質受保護」的表達。
3. RAG(檢索增強生成;Retrieval-Augmented Generation):
RAG是一種能即時檢索外部資料並將其納入回應的技術。在複製或擷取外部來源資料的過程中,可能涉及重製權之侵害。
4. 輸出行為:
當生成式 AI 輸出的內容與原作品實質相似或幾乎相同時,即可能涉及重製權的侵害。若輸出是對原作進行修改或演繹,則可能侵害改作權,甚至依使用情境,還可能涉及公開展示權或公開演出權。
有鑑於上述AI模型訓練的各環節都可能構成著作權的形式侵害,主要的法律爭點便集中於這些行為是否適用「合理使用(Fair Use)」原則的豁免範疇。
三、從合理使用的角度分析 AI 模型訓練行為
合理使用是美國著作權法中的一項核心衡平原則,允許在特定情況下,未經授權使用受著作權法保護的作品。在美國著作權法下,法院會透過四個法定要件的綜合評估來判斷使用行為是否符合合理使用:
1. 使用的目的和性質(Purpose and Character of the Use;
2. 受著作權保護作品的性質(Nature of the Copyrighted Work);
3. 所使用的程度,以及其在整體著作中所佔的重要性(Amount and Substantiality of the Portion Used);
4. 使用對於該類著作的潛在市場或價值所造成的影響(Effect of the Use upon the Potential Market)。
(一)要件一:使用的目的和性質:
法院在此要件下,主要衡量轉化性(Transformativeness)與商業性(Commerciality)兩大因素。
1.「轉化性」:
轉化性的核心在於新作品是否僅取代原作,還是添加新內容而改變原作既有的表達、內涵或欲傳遞之訊息。轉化的程度越高,越可能被認為屬於合理使用。
美國著作權局認為,將大型且多樣化的資料集用於訓練生成式 AI 基礎模型,通常具有「轉化性」,不過個別案例中轉化性程度不一。由於生成式 AI 模型的目的可能同時具備轉化性與非轉化性,開發者在訓練與部署時若能入若干限制(例如拒絕生成特定著作權片段)將會對此要件的評估產生正面影響。
2. 「商業性」:
此因素探討未支付費用使用受保護作品來獲取經濟利益是否公允。美國著作權局指出,判斷標準並非僅取決於營利與否,而應視該使用是否實質服務於商業目的。
(二)要件二:受著作權保護之作品性質
此要件旨在區分不同類型著作受保護的程度。事實或功能性作品(如新聞報導)被認定為「合理使用」的可能性較高,而高度創意作品(如小說、歌曲或繪畫)被認定為合理使用的可能性較低。
(三)要件三:所使用的程度,以及其在整體著作中所佔的重要性
美國法院在衡量此因素時,並非單純計算數量,更會考量所使用內容的品質與重要性。即便僅複製著作一小部分,若該部分是作品的「核心」,也可能被認定為非合理使用。
在 Sony v. Connectix [2] 和 Sega v. Accolade [3] 等經典案例中,美國法院曾將「向公眾提供的資訊量」視為重要考量。法院認為,儘管為了滿足功能性需求而完整複製遊戲機系統,但因被告「最終提供給大眾的產品並沒有包含受著作權保護的內容」,因此使用程度的重要性被降低。
(四)要件四:對潛在市場的影響
此要件通常被認為是合理使用判斷中最重要的因素,主要包括下列三種損失:
1. 銷量損失:
若 AI 模型能產出與原作品幾乎相同或高度相似的內容,並在市場上流通,消費者可能選擇不再購買原版作品,直接導致著作權人的銷量損失。
2. 市場稀釋:
「市場稀釋」意指即使AI產出的內容不直接複製特定作品,但其龐大的生成量與相似風格會對該作品的市場形成競爭。舉例而言,當大量AI生成的言情小說或音樂湧入市場,將與人類創作之作品形成競爭,稀釋銷量與授權金,降低創作者的創作誘因,對同類型作品的市場危害甚鉅。
3. 授權機會之損失:
實際或潛在授權市場中的收益損失,也構成市場損害。許多產業主張,為AI訓練提供授權是可行的商業模式,新聞媒體和音樂產業均已有實際的授權案例。然而,現有的授權模式可能無法滿足AI所需的大量數據,且成本過高、所有權分散等問題,將導致全面授權難以實現。
美國著作權局折衷地認為,當授權市場確實存在或有發展可能時,未經授權的使用傾向被認為屬「非合理使用」;惟若授權障礙無法克服而導致授權市場無法運作,因作品本身並無授權管道,則即使屬未經授權的使用,也可能被認為「屬於合理使用」。
4. 公共利益:
許多NOI回覆意見認為,未經授權的生成式 AI 訓練能促進公共利益,如OpenAI主張生成式 AI能促進人類的創造力,Meta更於訴訟中指出,在 Llama 基礎上開發的平台能將「拯救生命的服務與技術推向市場」。惟美國著作權局認為,對於 AI 訓練的益處,並無法帶來足以改變合理使用界線的決定性優勢。
四、AI 模型訓練「授權」的可行性
若 AI 訓練過程中,使用受著作權保護作品被認定非屬合理使用,開發者即須向著作權人取得授權。以下將探討 AI 訓練內容授權的可行性、挑戰以及不同授權模式。
美國著作權局針對當前局面提出建議:政府應暫時不干預,允許並鼓勵自願授權市場持續發展。儘管在特定領域,對於AI訓練的自願授權仍存在所有權分散、議價成本高等執行上的困境,但是報告指出樂觀趨勢,即直接與集體的自願授權協議在過去幾年間已積極發展並不斷完善。這個發展證明,透過市場機制達成 AI 訓練所需的授權,是可行且具潛力的解決方案。因此,著作權局認為應給予市場足夠空間,讓其自我調節,而非過早祭出政府強制介入措施。
五、美國著作權局之態度
美國著作權局在全面分析生成式AI的技術原理、現行法律適用與市場動態後,對AI的著作權議題採取下列立場及建議:
1. 現行法律框架具備足夠彈性:
美國著作權局認為,美國現行的法律框架,尤其是「合理使用」這項具備高度彈性的原則,已足夠因應當前 AI 模型訓練帶來的法律挑戰,現階段不及於進行大規模立法修訂。
2. AI 訓練的合法性應採取「個案判斷」模式:
美國著作權局強調,AI 訓練是否合法,必須採取個案判斷模式,不能一概而論。是否構成合理使用,取決於多項因素的綜合評估:具有強大輸出控制機制的非商業研究模型,較可能屬於合理使用;而以盜版內容訓練,進而產生與原著作競爭的商業模型,則較可能構成侵權。判斷的關鍵因素包括AI開發者使用了哪些作品、資料來源為何、訓練目的為何,以及對於最終輸出內容的控制程度。
3. 支持市場導向的「自願授權」解決方案:
美國著作權局明確傾向於市場化解決方案,建議應讓自願授權市場成熟,並認為近來不斷增加的直接與集體授權交易,正是市場有能力運作且能有效解決訓練資料需求與著作權保護間矛盾的有力佐證。
此份報告清晰地反映美國著作權局謹慎觀察、鼓勵市場調節,並堅持既有合理使用原則的核心態度。
[1] Andersen v. Stability AI Ltd., 744 F. Supp. 3d 956, 982–84 (N.D. Cal. 2024).
[2] Sony Comput. Entm’t v. Connectix, 203 F.3d 596, 606 (9th Cir. 2000)
[3] Sega v. Accolade, 977 F.2d 1510, 1526–27 (9th Cir. 1992)
一、技術背景概述:生成式 AI 模型如何訓練?
在進一步探討著作權與AI模型訓練的議題前,需要先了解生成式AI模型訓練的基礎技術原理:
1. 機器學習與神經網路
生成式 AI 模型並非透過人類制定的程式規則來運作,而是透過機器學習的過程,從海量訓練資料中「學習」出統計模式與關係。此過程由神經網路完成,神經網路是一種複雜的數學函數,由數十億個「參數」或「權重」組成。在訓練階段,這些權重會持續反覆調整,以提升模型效能。最終形成的模型,其本質就是由這些從資料中「學習」到的模式權重。
2. 訓練資料
生成式 AI 的表現優劣,高度取決於訓練資料的數量、品質與用途。首先,在數量上,模型通常需要數以百萬或數十億筆作品作為基礎,資料的規模與模型表現能力有直接相關。資料常見來源包括網路公開資料、授權資料、或開發者自有的使用者資料。需注意的是,「公開可得」並不等同於「授權合法」,這是引發著作權爭議的關鍵點之一。無論原始資料來源為何,通常都需經過編纂(curation),以利於訓練。「編纂」包括資料的過濾、清理與彙整。這些步驟不僅影響模型最終效能,也涉及高度的著作權與授權爭議。
3. 訓練過程
部分NOI回覆意見將訓練階段區分成「前訓練階段」(pre-training)與「後訓練階段」(post-training)。前者是生成式 AI 展現其核心進階能力的關鍵,在此階段,模型會接觸大量的文本或其他資料,並學習預測下一個「token」(詞元)。透過對數十億個範例的重複學習,模型最終學會語言、圖像或聲音等背後的潛在模式。
4.記憶與部署
生成式 AI 在訓練過程中可能出現「記憶化」現象,即模型輸出與訓練資料高度相似,甚至逐字重現。業者如 OpenAI等開發商主張模型內部僅存有統計參數與權重,不包含原始資料的「副本」。不過,部分NOI回覆意見指出質疑,主張若模型確實能生成與原作高度相似的內容,其實質效果等同於對特定作品的「記憶」。學界則折衷地認為,模型學到的模式可以抽象也可以具體。當學習到的模式達到高度具體時,則可能產生「記憶化」現象。雖然記憶化可能有助於提升模型的實用性,但由於輸出的內容可能與訓練資料極為相似,從而引發實質的侵權疑慮。
二、構成「形式侵權」之探討
美國著作權法賦予著作權人重製、發行、公開表演、公開展示及製作衍生作品等多項專屬權利。要構成形式侵權(prima facie infringement),必須滿足兩個要件:一是權利人擁有有效著作權,二是發生對於著作中原創性要素的複製。生成式 AI 的開發與使用若涉及受著作權保護之作品,即可能在下列核心環節中構成形式侵權:
1. 資料蒐集與編纂:
AI訓練的第一步,是獲取和準備資料。這個過程的必要行為,如資料的下載、在不同儲存媒介間的轉移等,直接涉及對著作權人「重製權」的侵害。多數意見認為,在這個資料取得與編纂階段所進行的複製行為,確實構成重製權的侵害。
2. 訓練過程:
AI模型的訓練過程涉及對資料的多次複製與處理,結果可能導致模型權重中含有訓練資料的複製品。因此,即使後續複製模型權重的人並未參與訓練,也可能構成「形式侵權」。如前所述,模型可能會有「記憶」訓練範例的現象,若模型能在未經外部提示的情況下,生成實質相似的訓練範例,則表示該表達形式已以某種方式存在於模型權重中。
法院對於模型權重是否侵權的案件有不同見解。在Andersen v. Stability AI [1] 案中,即使被告僅下載而未參與模型之訓練,法院仍以「該模型中已保留了複製品或受保護的要素」,而認為本件構成著作權之侵害。美國著作權局同意該法院之見解,並指出:欲判斷模型之權重是否涉及著作權之侵害,需視該模型是否保留或記住原作品中「實質受保護」的表達。
3. RAG(檢索增強生成;Retrieval-Augmented Generation):
RAG是一種能即時檢索外部資料並將其納入回應的技術。在複製或擷取外部來源資料的過程中,可能涉及重製權之侵害。
4. 輸出行為:
當生成式 AI 輸出的內容與原作品實質相似或幾乎相同時,即可能涉及重製權的侵害。若輸出是對原作進行修改或演繹,則可能侵害改作權,甚至依使用情境,還可能涉及公開展示權或公開演出權。
有鑑於上述AI模型訓練的各環節都可能構成著作權的形式侵害,主要的法律爭點便集中於這些行為是否適用「合理使用(Fair Use)」原則的豁免範疇。
三、從合理使用的角度分析 AI 模型訓練行為
合理使用是美國著作權法中的一項核心衡平原則,允許在特定情況下,未經授權使用受著作權法保護的作品。在美國著作權法下,法院會透過四個法定要件的綜合評估來判斷使用行為是否符合合理使用:
1. 使用的目的和性質(Purpose and Character of the Use;
2. 受著作權保護作品的性質(Nature of the Copyrighted Work);
3. 所使用的程度,以及其在整體著作中所佔的重要性(Amount and Substantiality of the Portion Used);
4. 使用對於該類著作的潛在市場或價值所造成的影響(Effect of the Use upon the Potential Market)。
(一)要件一:使用的目的和性質:
法院在此要件下,主要衡量轉化性(Transformativeness)與商業性(Commerciality)兩大因素。
1.「轉化性」:
轉化性的核心在於新作品是否僅取代原作,還是添加新內容而改變原作既有的表達、內涵或欲傳遞之訊息。轉化的程度越高,越可能被認為屬於合理使用。
美國著作權局認為,將大型且多樣化的資料集用於訓練生成式 AI 基礎模型,通常具有「轉化性」,不過個別案例中轉化性程度不一。由於生成式 AI 模型的目的可能同時具備轉化性與非轉化性,開發者在訓練與部署時若能入若干限制(例如拒絕生成特定著作權片段)將會對此要件的評估產生正面影響。
2. 「商業性」:
此因素探討未支付費用使用受保護作品來獲取經濟利益是否公允。美國著作權局指出,判斷標準並非僅取決於營利與否,而應視該使用是否實質服務於商業目的。
(二)要件二:受著作權保護之作品性質
此要件旨在區分不同類型著作受保護的程度。事實或功能性作品(如新聞報導)被認定為「合理使用」的可能性較高,而高度創意作品(如小說、歌曲或繪畫)被認定為合理使用的可能性較低。
(三)要件三:所使用的程度,以及其在整體著作中所佔的重要性
美國法院在衡量此因素時,並非單純計算數量,更會考量所使用內容的品質與重要性。即便僅複製著作一小部分,若該部分是作品的「核心」,也可能被認定為非合理使用。
在 Sony v. Connectix [2] 和 Sega v. Accolade [3] 等經典案例中,美國法院曾將「向公眾提供的資訊量」視為重要考量。法院認為,儘管為了滿足功能性需求而完整複製遊戲機系統,但因被告「最終提供給大眾的產品並沒有包含受著作權保護的內容」,因此使用程度的重要性被降低。
(四)要件四:對潛在市場的影響
此要件通常被認為是合理使用判斷中最重要的因素,主要包括下列三種損失:
1. 銷量損失:
若 AI 模型能產出與原作品幾乎相同或高度相似的內容,並在市場上流通,消費者可能選擇不再購買原版作品,直接導致著作權人的銷量損失。
2. 市場稀釋:
「市場稀釋」意指即使AI產出的內容不直接複製特定作品,但其龐大的生成量與相似風格會對該作品的市場形成競爭。舉例而言,當大量AI生成的言情小說或音樂湧入市場,將與人類創作之作品形成競爭,稀釋銷量與授權金,降低創作者的創作誘因,對同類型作品的市場危害甚鉅。
3. 授權機會之損失:
實際或潛在授權市場中的收益損失,也構成市場損害。許多產業主張,為AI訓練提供授權是可行的商業模式,新聞媒體和音樂產業均已有實際的授權案例。然而,現有的授權模式可能無法滿足AI所需的大量數據,且成本過高、所有權分散等問題,將導致全面授權難以實現。
美國著作權局折衷地認為,當授權市場確實存在或有發展可能時,未經授權的使用傾向被認為屬「非合理使用」;惟若授權障礙無法克服而導致授權市場無法運作,因作品本身並無授權管道,則即使屬未經授權的使用,也可能被認為「屬於合理使用」。
4. 公共利益:
許多NOI回覆意見認為,未經授權的生成式 AI 訓練能促進公共利益,如OpenAI主張生成式 AI能促進人類的創造力,Meta更於訴訟中指出,在 Llama 基礎上開發的平台能將「拯救生命的服務與技術推向市場」。惟美國著作權局認為,對於 AI 訓練的益處,並無法帶來足以改變合理使用界線的決定性優勢。
四、AI 模型訓練「授權」的可行性
若 AI 訓練過程中,使用受著作權保護作品被認定非屬合理使用,開發者即須向著作權人取得授權。以下將探討 AI 訓練內容授權的可行性、挑戰以及不同授權模式。
模式 | 內容分析 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
自願授權 | 1. 直接授權:由個別著作權人與使用者(如AI開發者)之間,直接協商並授權。 |
1. 自願授權的可行性: 代表科技產業之評論者認為,要為 AI 訓練取得海量且多樣化的版權內容,成本高昂且行政上極為困難;惟,代表創作者的評論者主張,授權費用是必要的商業成本,以「太昂貴」為藉口規避授權並不合理。 2. 是否能提供實質的補償能力: 代表科技產業之評論者認為,由於AI訓練數據量極大,即使總版權費用高昂,分攤到每個創作者身上的授權金仍微不足道,不符合成本效益;代表創作者的評論者則主張,雖單筆授權金額不高,但能藉此激發創作者創作新作品,且AI公司可透過未來收益分成之方式取代傳統授權金。 3. 集體授權可能之法律上障礙: 部分評論者指出,著作權人聯合協商集體授權,可能引發反托拉斯(反壟斷)問題。為避免後續疑慮,有認為應針對「AI訓練之集體授權問題」於反托拉斯法中提供豁免制度。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2. 集體授權:透過第三方組織(通常稱為「集體管理組織」)來進行的授權模式。著作權人將其作品的授權權利交由這些組織管理,由組織代表多位權利人與使用者(如 AI 開發者)進行協商與授權。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
法定授權 | 1. 強制授權:由法律建立的授權制度,允許使用者無須徵得著作權人之同意即可使用其作品,但必須遵循監管要求並支付法定授權金。 |
1. 優點: 免除個別磋商之需求,可解決高額交易成本之問題。 2. 缺點: (1) 削弱著作權人控制其作品使用與發布的權利:此制度可能剝奪著作權人選擇合作夥伴、決定作品如何使用以及協商報酬的自由。 (2) 高昂的行政成本:雖此制度能減低交易成本,惟建立此架構需龐大之行政體系,須付出高昂成本。 (3) 無法跟上技術發展:此制度趨於僵化,難以跟上生成式 AI 技術的快速發展,最終可能同時傷害著作權人與 AI 開發者。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2. 擴張性集體授權:由集體管理組織代表,在自由市場就特定類別全部受著作權保護之作品,針對特定用途進行授權與外部協商。為取得此類授權,集體管理組織通常須證明其代表該類作品中相當數量的著作權人。 |
1. 優點: 結合自願授權的靈活性以及強制授權的廣泛性,能降低交易成本。 2. 缺點: 部分評論者認為此制度存在與強制授權相類似之缺點,且因規模過大而產生執行上的困難。 |
美國著作權局針對當前局面提出建議:政府應暫時不干預,允許並鼓勵自願授權市場持續發展。儘管在特定領域,對於AI訓練的自願授權仍存在所有權分散、議價成本高等執行上的困境,但是報告指出樂觀趨勢,即直接與集體的自願授權協議在過去幾年間已積極發展並不斷完善。這個發展證明,透過市場機制達成 AI 訓練所需的授權,是可行且具潛力的解決方案。因此,著作權局認為應給予市場足夠空間,讓其自我調節,而非過早祭出政府強制介入措施。
五、美國著作權局之態度
美國著作權局在全面分析生成式AI的技術原理、現行法律適用與市場動態後,對AI的著作權議題採取下列立場及建議:
1. 現行法律框架具備足夠彈性:
美國著作權局認為,美國現行的法律框架,尤其是「合理使用」這項具備高度彈性的原則,已足夠因應當前 AI 模型訓練帶來的法律挑戰,現階段不及於進行大規模立法修訂。
2. AI 訓練的合法性應採取「個案判斷」模式:
美國著作權局強調,AI 訓練是否合法,必須採取個案判斷模式,不能一概而論。是否構成合理使用,取決於多項因素的綜合評估:具有強大輸出控制機制的非商業研究模型,較可能屬於合理使用;而以盜版內容訓練,進而產生與原著作競爭的商業模型,則較可能構成侵權。判斷的關鍵因素包括AI開發者使用了哪些作品、資料來源為何、訓練目的為何,以及對於最終輸出內容的控制程度。
3. 支持市場導向的「自願授權」解決方案:
美國著作權局明確傾向於市場化解決方案,建議應讓自願授權市場成熟,並認為近來不斷增加的直接與集體授權交易,正是市場有能力運作且能有效解決訓練資料需求與著作權保護間矛盾的有力佐證。
此份報告清晰地反映美國著作權局謹慎觀察、鼓勵市場調節,並堅持既有合理使用原則的核心態度。
[1] Andersen v. Stability AI Ltd., 744 F. Supp. 3d 956, 982–84 (N.D. Cal. 2024).
[2] Sony Comput. Entm’t v. Connectix, 203 F.3d 596, 606 (9th Cir. 2000)
[3] Sega v. Accolade, 977 F.2d 1510, 1526–27 (9th Cir. 1992)