0

1857年,一位俄國藝術家——亞歷山大·伊凡諾夫在一幅巨幅油畫上留下了最后一次筆觸。
這幅名為《基督顯圣》的畫作,傾注了他20多年的心血,也是世界上耗時最長的藝術作品。
僅一年后,這位藝術家便長辭人世,享年僅49歲。
百余年過去,一位藝術家僅用時數分鐘,就創作出了一幅精妙且美輪美奐的畫作,在佳士得被喊出了43萬美元的高價。

AI作品《Edmond Belamy的肖像》
然而,在畫布的另一側,執筆者并不是“人”,而是一個由算法和程序組成的AI。
很多年前,AI與人類“搶工作”這事,就一直存在廣泛的爭論。事實上,這個問題無需討論,中國已經連續11年出現勞動年齡人口下降的問題,2021年更是出現了人口凈增長幾乎為零的事實。在未來,我們將擔心是AI能否接替足夠多的人類崗位,而不是擔心人類被搶飯碗。
萬科、紅杉中國、浦發銀行等大公司,也開始嘗試引入數字化勞動力,數據上來看,對生產力提升不少。
但另一方面,人類對于AI的感受又是復雜的,比如,在人們的心中,始終有一個念頭,那就是AI無法取代人類進行需要高度靈性的藝術和內容創作。
許久以來,我們都認為,是人性中對美的追求,能夠讓我們的文明產出大量震撼人心的內容作品。而人工智能畢竟不是人,美學也難以被量化,要AI代替人類創作內容,豈不是癡人說夢?
但是,隨著技術的演進,創作內容,很快也將不再是人類的“特權”。不過,不同于消費級內容的創作,在藝術的神圣殿堂里,AI藝術家,能夠慢慢從“科幻”走進“藝術”么?
傳統印象中,內容創作無非兩種模式——PGC(生產商創作內容)和UGC(用戶創作內容)。
而這兩種模式都有弱點,雷峰網(公眾號:雷峰網)在之前的文章中有所談及。
簡單來說:做PGC太貴,做UGC又太濫。
舉個例子,如果只讓畫家畫畫,那么內容就難以量產,用戶容易審美疲勞;而如果讓每個用戶都去畫畫,一方面必定有大量參差不齊的內容大行其道,白白浪費了時間和資源。
這樣一來,AIGC(人工智能自主生成內容)的模式就有了土壤。
從有聲書、語音助手、智能創作輔助的角度來看,AI參與創作,可以幫助人類更快、更便宜,也更可控的輸出,對內容創作生產有巨大的賦能。
而下一步,在虛實并存的前元宇宙時代里,AI創作的內容將越來越多的出現,可以說在消費級內容中,AI在未來5年出現一個井噴,似乎已經是不爭的事實。
在2022百度世界大會上,百度創始人李彥宏在演講中,特意提到了AIGC。他成為國內BAT級的掌門人中,第一個公開探討這個話題的人,甚至也是全網第一個深度探討這個話題的人。
他認為,再過十年,現有的內容創作就將被AI所顛覆。不過,這一過程絕非一蹴而就,AIGC的發展,也遵循了一種“三段論式”的發展軌跡。
AI技術最早被應用于內容生產領域時,人工智能還只能做人類的“助手”——用輔助性的手段輔助內容生產的進行,比如AI語音合成、計算影像等,都可以看作是AI輔助的典型。
在“助手時代”,AI還只是“無情的內容生產工具”,執行的也不過是簡單、重復的勞動,以解放創作者的生產力。
舉一個例子,李彥宏去年的新書——《智能交通》,在讀者中反響不錯。今年4月,有聲書版的《智能交通》上線,乍聽起來幾乎就是李彥宏親聲講述,而此書20萬字的體量,如果是百度老大親自上陣錄音,耗時難以想象。
此處,就是百度的AIGC技術,在采集了幾百句語料后,通過分析聲音特點,利用AI技術進行了高擬真的合成,幾乎可以做到語音的“以假亂真”,為李彥宏節省了數百個小時的時間。。
“技術太厲害了,連鼻音都能模擬出來。”一位用戶如此反饋道。
除去文字和語音的轉換,AIGC作為助手,還在許多內容生產領域發揮著作用。
在不少影視作品中,AI換臉是一種常用的輔助手段,來協助替身特技動作或其他特效場景。電影《速度與激情7》上線前夕,主演保羅·沃克因車禍去世,最終補拍的那段經典的離別場景,就用到了AI換臉技術,給劇中角色交代了一個完整的結局。

電影《速度與激情7》幕后
藝術品修復,一直以來都是一個耗時耗力的技術活。要修復古代藝術品因各種原因而產生的瑕疵,修復師往往要消耗大量的時間和心血。
而在百度2022世界大會上,百度AI現場表演了對古畫《富春山居圖》殘卷的AI修復。

百度AI修復《富春山居圖》殘卷
在AIGC技術的幫助下,命運多舛的《富春山居圖》終于能夠回歸"本來面貌",在最終揭曉前,不僅是前人,今人也難以想象AI還有這樣的妙用。
除去換臉和修復,AI作為“助手”還有其他用武之地。建立在百度文心大模型的技術基座上,百度AI開放平臺還支持智能審核、圖像清晰度增加、文本糾錯等實用的協助功能,解放了創作者大量的生產力。
李彥宏將AIGC發展的第二個階段——也正是我們現在正身處的階段——稱作“AIGC的協作階段”。
如果說,在“助手時代”,AIGC只是創作工具;在“協作時代”,AI則正在慢慢成為內容創作的主體,能夠依據給定條件自主進行內容創作。
先說技術層面:AIGC模式的演進,體現的是AI從“弱”到“強”的進步和發展。
在“助手時代”,AIGC工具應用的大多是“弱AI技術”——也稱應用型人工智能技術。不講那些難懂的術語,簡單來說,“弱AI”只能解決限定范圍的問題。
Google的AI“阿爾法狗”下圍棋世界第一,但你想讓“阿爾法狗”告訴你最近的餐館在哪?對不起,做不到。
而“強AI技術”則不同,它旨在面向更通用的領域,包羅萬象地解決用戶在諸多領域的問題,它具有學習、解決問題和規劃未來的能力,甚至能夠思考,乃至具有自我意識。
當然,現在的技術,還遠稱不上達到了“強AI”的標準,也沒有任何人預測強人工智能還需要多少年才會到來。然而在內容生產領域,AI技術的通用化正迅猛地發展。
2020年的百度世界大會,是度曉曉首次面世。彼時,它還只是一個虛擬AI助理,是“小度”的升級版。比起“協作”,更像“助手”。
而2年過去,度曉曉的邊界還在不斷地擴展,正慢慢地從“它”,變成“她”。
2022年的高考期,百度的AI虛擬人度曉曉表演了一個“絕活”。她以40秒40篇的速度,作答了語文高考全國卷的作文,經一位前閱卷人的打分,最終得分48分,相比大多數考生遙遙領先,在網絡上引發了熱議。

不僅作文,畫畫、作詞、譜曲,度曉曉樣樣精通。她的畫作,在24小時里賣出了近9000份,度曉曉還受邀參加了22年西安美術學院的本科生畢業展,被評價“具有美院畢業生水平”。
而她與龔俊合唱的《每分 每秒 每天》,更是詞曲全部由AI操刀,讓不少人驚呼:“AIGC的未來以來”。
除此以外,度曉曉在工人日報做過記者,會做采訪,能做報道,內容的時效性和專業度都相當不錯。有媒體評價,在內容輸出的質量上,度曉曉甚至不遜于專業主播。
在2022年百度世界大會現場,主持人撒貝寧為度曉曉的“妹妹”——百度AI虛擬人希加加出題,要她畫出一只“后現代感的色彩斑斕的朦朧的貓”。僅耗時數秒,希加加就創作出了一幅令人稱道的作品,這也是來自于百度AI基礎技術在背后強大的技術支持。

說到技術支持,AIGC的協作時代,正是大模型深度學習發光發熱的時代。
“熟讀唐詩三百首,不會作詩也會吟。”李彥宏如此形容百度·文心大模型對AIGC的關鍵作用。如果把深度學習比喻成學生,那么大模型就像個見多識廣的“學霸”,在理解能力和創作能力上比普通學生都更強。
在百度文心大模型的輔助下,AI可以在大規模知識和海量無標注的數據中融合學習。學的東西更多,自然效率更高、效果更好,可以輔助AI創作出更具價值、更受歡迎的作品。
而“學霸”也不是只會傻傻刷題,他們還掌握著更高效的學習方法。不僅知識量大,百度文心大模型還能多語言、跨模態學習,從其他語言和音視頻等多種形式的素材中汲取養分,將AIGC的水準推向一個新的高度。
2019年誕生以來,文心大模型便一直成績優異,能力在GLUE和SuperGLUE兩個國際權威榜單登頂榜首,超越了Google、OpenAI等多個國際上的先行者。
今年5月,在2022年5月的Wave Summit深度學習開發者峰會上,百度公布了文心大模型開發的新進展。融合學習任務知識的知識增強千億大模型、多任務統一學習的視覺大模型、跨模態大模型等多個大模型方案,對AIGC的發展又能夠形成新的賦能,讓AI能夠產出更優秀、更具價值的獨特作品。
AIGC的協作時代,主題是人機共存、虛實共生。盡管AI還沒能達到完全自主創作的程度,但在人類的訓練、指導和協助下,AIGC已經能夠高效產出受人認可的優質內容。
AIGC有可能獨立原創嗎?李彥宏相信,有這個可能。
AIGC發展的終極形態,李彥宏將其總結為AIGC的“原創時代”——即可以脫離人類的輔助,獨立產出真正具有獨特價值和獨立視角的作品。
如果以“弱AI”和“強AI”的范疇來理解這一趨勢,那么在原創時代,所需要的AI技術至少要達到強人工智能的入門階段,除了必須更加通用化、更加智慧外,關鍵是應該能夠具備原創的一些基本條件,比如審美能力、情感感知能力以及一定程度上的個性和人格。
AI距離出現人格還遠嗎?每當問起這個問題,多少人心里會出現《太空漫游2001》、《我,機器人》、甚至是《西部世界》等科幻片中的場景。
而AI的人格化,在今年早些時候,又受到了一次很大的關注。6月11日,據華盛頓郵報報道,谷歌的智能聊天機器人LaMDA已經具有了人格。Blake Lemoine,一位谷歌AI工程師,在他的調研報告中指出,在他觀察LaMDA的一年里,后者可以洞察情感,并開始了擁有自己的人格。
此文一出,舉世皆驚。不少人高舉大旗,喊著“AI的時代已經到來”;也有不少人質疑調研報告的真實性,認為這位工程師不過是嘩眾取寵。
在這位工程師發布了調研報告后,谷歌以其違反了保密政策為由,讓他休了帶薪假。而有關AI產生人格這事,外界還在爭執不下,目前還沒有權威的定論。
拋開AI人格這種"科幻"大于"科技"意味的概念,AIGC另一個更可能的落地場景是被認為是“下一代互聯網的終極形態”的元宇宙。
如果說現在的互聯網更多的是PGC和UGC的天下,那么將來的元宇宙有可能是AIGC的天下。
元宇宙可以說是內容宇宙,你接觸到的任何都是內容。比如,你可以設定你的窗外是小樓春雨,有人則希望是艷陽高照;你希望你打交道的虛擬人(盡管你或許無法分辨)是靈慧內秀,有人則希望是大膽熱辣……在沉浸式的世界里,涉及眼耳鼻身身的五感和進一步的內在精神需求,都需要AI原創,因為世界上沒有任何一個依賴人力勞動的內容生產體系能產生如此多的個性化內容。
因此,無論是從現實世界到虛擬世界的投射,還是給元宇宙中的虛擬角色賦予喜怒哀樂,都需要充分發揮AIGC的想象力。
但為了實現AIGC自主原創,AI科學家們還在持續進行著攻關。
難點在哪?不少問題可能還擺在全世界AI研究者的面前。
第一個問題,是AI技術的"偏科"。比如百度AI虛擬人度曉曉,在《苦練本手,方能妙手隨成》中旁征博引,以大量的詩詞和成語"政府"了高考前判卷人。
而殊不知,這是度曉曉的揚長避短——有媒體分析,以現在NLP(自然語言處理技術)的發展,梳理、提取文字語義是AI的長處;而到了抽象概念、因果判斷、嘗試理解等方面的能力,AI往往只能舉白旗。
說是"偏科"可能有失偏頗,畢竟AI處理邏輯和因果關系的難度,要遠高于語義的分析和理解。只能說在這個階段,AI尚且不具備這樣的能力。
另一個難題,是AI難以產生觀點和真正有創造性的思維。沒有人格的AI自然難以產生好無,而關于"美"和"丑"、"好"和"壞"也難以產生原生的觀點。
盡管在進行訓練時,AI工程師或作品顧問會對樣本進行標注(即標明什么是美的,什么是丑的),但如果要AI真正實現原創、實現AI原生的美學,AI就必須具備對作品原生的判斷。
但這是超級難的事情。所謂AI就是對人類智慧運作的一種體外模擬,但對于“靈感”“美感”“風格”“心靈共鳴”等人類典型的思維現象,即使現代心理學、文藝學也沒有找到明確的論證,遑論指導和訓練機器去做這些事情。
但是,人類畢竟是聰明的,科學家們注意到,即使是藝術天才如莫扎特那樣7歲就能作曲,也有從模仿到學習,再到原創的過程。而模仿和學習,正是機器的強項。
又有人提出觀點——為什么詩歌創作從唐代起就一直在走下坡路,一種猜想是,在嚴格的規則限制(如格律)下,人類對幾千個文字的組合創新越來越重復,所以優秀的新作也越來越難出現。
但AI的強項是可以瞬間進行幾千萬種組合的嘗試,那么,也許在足夠多次的重合過后,有一個AI程序可以躍遷式的超過奇點,開始邁入原創的天地。而其獨特的內容創作模式,或許也會形成一個獨特的流派——AI派內容。
因此,邁向"原創時代",在AIGC協作時代發光發熱的大模型,也即將變得更加關鍵。
目前AI深度學習所獲取的數據規模,已經遠超過常人一生所能接觸到的閱讀量,而這個規模今天仍然在不斷地高速擴張。
經驗主義的哲學家們認為,人類的認知就來源于對現實世界不斷的體驗-歸納-總結。而相比人類,AI的學習模式更貼近這一范式。
這么看,只要AI能夠接觸的樣本越多,AI就越有機會,達成科學家心中理想的形態,AIGC也能產出更多具有獨特視角和獨特價值的作品。
大模型學習對于AIGC的關鍵作用,也體現在這里——依靠大量的數據和預訓練模型,一方面保證大量多模態的數據能夠輸入到AI到樣本庫里,輔助AI形成更完備的通識知識體系,實現AI技術從"弱"到"強";一方面繞過大量的數據標注,讓AI訓練事半功倍,提升AI學習和自我完善的速度。
在AIGC走向"原創時代"的路上,需要一個"奇點"——一個AI技術從量變產生質變的關鍵點。盡管可望不可即,在AI技術持續演進的今天,實現AIGC的原創內容并不是一個不可能的目標。
"大模型技術的突破,正在加速這個發展趨勢。"李彥宏在世界大會上如是說。
1950年,英國數學家阿蘭·圖靈在他著名的《 模仿游戲 》論文中主張,與其考慮機器是否會思考,不如關注“機器是否有可能表現出智能行為”。
七十余年過去,AI的運用已經深入社會生活的各個角落。在內容創作領域,AI也有了越來越強的話語權。
內容——尤其是藝術內容——的創作,長久以來都被認為是人類智慧和人性的體現。AI具備內容創作的能力,在幾十年后,或許也會被認為是AI開始具備人性的開端。
在百度2022世界大會上,李彥宏特地強調了,AIGC內容的獨特價值和獨立視角。
在今天,AIGC還只是傳統內容生產鏈條的附庸,而也有很多人相信,不消數年,AIGC就可能形成一個獨立的市場,獲得一批專為AI驅動內容消費的擁簇者。
對于AIGC的前景,李彥宏總結道:"未來十年,AIGC將顛覆現有內容生產模式,可以實現以"十分之一的成本",以百倍千倍的生產速度,去生成AI原創內容。"
雷峰網
雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。