5月18日,已發布大模型“天工”的昆侖萬維在其官方公眾號上發布了其CEO方漢對生成式AI的觀點。
方漢認為,生成式AI的瓶頸在于數據層面,數據門檻仍然非常高,而大模型未來的商業模式無非是降本增效。對于行業來說,需要盡快擁抱大模型,做自己行業的專有大模型,并特意表示“不建議游戲行業使用AIGC,更應關注如何用AIGC技術提高游戲性”。此外,他看好多模態在大模型工程上的前景。
以下為方漢第一人稱敘述的精華觀點。
生成式AI的瓶頸與潛能
從數據與技術兩個角度來看,我認為老技術沒有壁壘。現在所有的新技術都在踴躍出現。我觀察到,目前各種論文、所有最創新的研究是在讀博士生開展的,目前所有基于大模型的創新都是在讀博士甚至碩士做出來的,很多技術迭代非常快,誰跑得更快,誰就有機會。
老的數據門檻仍然非常高,所有大模型都需要行業數據。我們知道,行業數據都是被各個行業巨頭所壟斷的,這種數據有一個問題,它是老的格式數據,如何把老的數據盡快轉化為大模型能夠處理的新數據,這對于各行各業都是一個關鍵的問題。
舉個例子,OpenAI的機密其實是它如何處理數據。例如,用大模型控制前線美軍小隊完成一個戰斗任務,而且這個戰斗任務持續幾個小時,非常復雜,為什么能做這件事情,因為美軍有一個習慣,會把每次戰斗做非常詳細的Report,大量的Report是非常好的行業數據,能夠模擬人類做決策。
而行業數據普遍存在的問題是什么?很多行業數據往往只有條件和結果,沒有過程。這導致了大模型只能背結果,它不知道如何達到這個結果,缺乏過程。所有的行業,如果要把過程給補上,這項工作是非常痛苦的,但是這項工作不得不做。
因此,我認為行業大模型的價值其實不在于做大模型本身,數據層面反而是一個特別苦、特別臟的活,所有的行業都要走一遍這個過程。
至于大模型未來的商業模式,太陽底下無新事,無外乎是降本增效。
行業如何落地大模型?
對于行業而言,我認為可以盡快擁抱大模型,做自己行業的專有大模型。
例如,醫療行業,我覺得分兩種公司,一種是現在它有很多專有的行業數據,這個是必須的;
另外,如果沒有專有數據,那么有一個藍海,英文行業數據的知識遷移通過大模型來實現目前非常容易,這對中小公司創業很有幫助。
我對游戲行業比較熟悉,我非常不建議用AIGC在游戲行業的2B應用。我覺得,所有人更應該關注的是如何用AIGC技術提高游戲性,這個得到的回報永遠是最大的。
看好多模態在大模型工程上的前景
人類所有的智慧絕大部分是用文字記錄,現在多模態的圖像、視頻包含人類智慧的含量特別少。大家平時在短視頻平臺看到的內容大部分是娛樂八卦信息,有多少智慧在里面?含量是非常少的。
我的觀點,多模態大模型不會增加對人類智慧的應用,大模型研發到末期了,人類的高質量的語料快用完了。行業現在只是想辦法把這些高質量的文字砸出更多的價值。
但是從工程角度來說,圖片跟視頻這種多模態大模型應用上就特別有價值。我們做多模態大模型,能夠挖掘出來更多目前文本大模型不具備的一些工程能力,但是在人類智慧上,進步沒有那么大。
但我們不用追求形式上的完美,有可能它本來就是不完美的。我是核物理專業,我了解愛因斯坦包括楊振寧最后的工作,都是把集中基本力統計起來,但并不妨礙我們做出各種各樣花里胡哨的工程上的應用。所以,我很看好多模態大模型在工程上的前景,但我不認為它們能夠帶來大模型在智慧上的躍進。
最后,大模型領域的創業者,一定要尋找用戶的剛需,快速挖到自己的第一桶金,要快速迭代、不斷試錯,不要只鉆一個方向。
獨特思考,快速失敗。
(文章來源:新京報)
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。



