生成式人工智能(Artificial Inteligence Generated Content)是人工智能領域的重要分支,,一種基于算法和模型生成文本、圖片、聲音、視頻、代碼等內容的技術,不同于傳統A!的分析功能,生成式A1能學習并生成具有邏輜的新內容。不同于傳統的人工智能僅對輸入數據進行處理和分析,生成式人工智能可以學習并模擬事物的內在規律,根據用戶的輸入資料生成具有邏轄性和連貫性的新內容。這一技術的核心依托于多模態模型,能針對用戶需求實現異構數據的生成式輸出。
生成模型的基礎理論最早在20世紀50年代至80年代確立,這一時期主要集中于概率模型等生成理論算法的研究。1950年代的馬爾可夫鏈(Markov Chains)和1970年代的隱馬爾可夫模型(Hidden Markov Models, HMM)為生成式模型奠定了理論基礎。
隨著計算能力的提升和海量數據的應用,生成式AI進入了以大語言模型(LLMs)為主的階段。2018年,OpenAl發布了GPT(Generative Pre-trained Transformer)模型,通過大規模數據的預訓練和自回歸生成能力,推動了自然語言生成的顯著進展。
2022年底,ChatGPT正式上線并迅速普及:標志著生成式AI進入大規模商業化應用階段。ChatGPT基于GPT-3.5,能進行自然流暢的對話,廣泛應用于教育、客戶服務等領域。ChatGPT的成功激勵了其他科技公司加快生成式AI應用的開發。
2014年,lan Goodfellow等人提出了生成對抗網絡(GAN),標志著生成式人工智能的關鍵突破。GAN通過生成器和判別器的對抗訓練,能夠生成高度真實的圖像和數據,是現代生成式AI的重要模型之一。
2020年,OpenAl發布了GPT-3,具備1750億參數,是當時規模最大的語言模型。GPT-3具備強大的自然語言理解和生成能力,廣泛應用于對話、寫作等任務。同年,OpenAl發布了DALL-E,展示了生成式AI在圖像生成領域的多模態能力。
伴隨生成式AI的廣泛應用,各國開始制定政策和行業標準,確保生成式AI技術的安全合規。2024年,聯合國科技大會上發布了生成式AI的應用安全測試標準,中國工信部和網信辦等也相繼出臺了生成式AI服務的管理辦法,規范行業發展。