當“生成式人工智能”成為科技圈的熱門話題,大家在關注各種新奇應用的同時,也開始注意到,作為這些應用背后支撐的“算力”變得至關重要。
對于那些算力要求高的設備來說,加塊更強的顯卡就能解決問題。但手機就不一樣了,它空間小、耗電量也要控制,想要在不聯網的情況下,直接在手機上實現生成式人工智能,難度就高多了。
旗艦芯片AI大比拼,中端市場策略各不同
最近,聯發科和高通都發布了新一代的旗艦芯片,都不約而同地強調了手機本地AI能力的提升。
比如聯發科,新出的天璣9300芯片里,集成了第七代AI處理器APU 790,專門為生成式AI設計。它的整數和浮點運算能力是上一代的兩倍,但功耗卻降低了45%。APU 790還內置了硬件級的生成式AI引擎,能更快、更安全地進行AI計算,特別適合Transformer模型。
官方數據顯示,它的處理速度是上一代的8倍,一秒鐘就能生成一張圖片。而且,聯發科還開發了一種叫做混合精度INT4量化的技術,結合內存硬件壓縮技術NeuroPilot Compression,能更有效地利用內存帶寬,減少AI大模型對手機內存的占用,支持手機運行最高可達330億參數的AI大語言模型。
新芯片的發布,讓手機在硬件上有了支持生成式AI的基礎。不過,搭載這些旗艦芯片的手機,價格通常也比較高。根據IDC的數據,2023年第三季度,國內3500元以上的手機,出貨量只占33%。
也就是說,就算所有的高端手機都支持端側生成式AI,也只有大約三分之一的用戶能體驗到這個功能。而價格更親民的中端機市場,暫時還享受不到這種升級。要知道,2500~3499元價位的手機,銷量占比也達到了19%,而且還在不斷增長。
如何讓更多人體驗到生成式人工智能,而不是只有高端手機才能“獨享”,是擺在手機廠商和芯片供應商面前的一個重要問題。高通面向下一代中高端產品推出的第三代驍龍7,并沒有特別強調AI功能的進步,主要的提升還是在CPU、GPU性能和能耗方面。
而聯發科,從天璣8000系列開始,就一直把中高端機型作為其擴大市場份額的關鍵。他們芯片的更新速度更快,也更注重與手機品牌的合作。最新發布的天璣8300,也在同級別產品中率先支持生成式AI,最高支持100億參數的AI大語言模型。
這款芯片集成了聯發科AI處理器APU 780,搭載生成式AI引擎,整數和浮點運算的性能是上一代的2倍,支持Transformer算子加速和混合精度INT4量化技術,AI綜合性能是上一代的3.3倍,可以流暢運行手機端的生成式AI應用。
據聯發科無線通信事業部副總經理李彥輯透露,小米成為了首個借助其芯片能力實現端側生成式AI應用的手機廠商。
小米集團總裁、Redmi品牌總經理盧偉冰也表示:“Redmi手機將會全球首發搭載天璣8300-Ultra芯片,該機在性能調度、系統應用和硬件底層能力開發方面,均會應用到新一代人工智能技術。” 剛剛發布的Redmi K70E就是盧偉冰所說的首款支持端側生成式人工智能的手機產品。
從云端到手機端,我們能期待什么?
雖然產品和應用都有了,但提到大模型這項技術,很多人還是覺得它離自己很遠。原因就在于,具體的應用場景還不夠豐富,大家感受不到大模型帶來的實際好處。
值得高興的是,手機端的大模型應用正在加速普及。目前,包括、小米、vivo等手機廠商,都已經將大模型在手機端的應用提上了日程。比如,語音助手與大模型的結合,很多都已經到了內部測試甚至公開測試階段。
一位業內人士告訴我:“大模型的加入,可以讓智能語音助手跳出原有的‘機械問答’模式,對用戶指令的理解能力和解決問題的能力都會增強。但這只是第一步,下一步在端側生成式人工智能落地后,像‘圖生文’‘文生圖’‘圖生圖’等更高級的應用,都有望在手機端實現,從而讓語音助手開始展現出創造力。”
從長遠來看,大模型和端側生成式人工智能,確實有可能為智能手機等設備帶來更多有趣、實用的功能。但我在體驗了現階段手機端的大模型應用后,覺得現在只能說是“未來可期”,還不能說是“立即革新”。
說實話,當前手機里的大模型應用,更多只是個噱頭。能夠感受到的“智能升級”非常有限。雖然語音助手能聽懂、回答的問題更多了,甚至可以進行一些簡單的邏輯思考,但與領先的Chat GPT相比,還有很大的差距。
如果從AI繪圖應用來說,手機端面臨的挑戰也不少。比如算力方面,目前主流的Stable Diffusion經過測試,至少需要RTX 3070以上級別的顯卡,才能獲得比較流暢的體驗。而且,它的上手門檻也不低,因為AI繪畫往往需要選擇合適的學習模型,并在繪畫中不斷提出新要求、調整畫面,才能最終獲得一張質量還不錯的圖片。
Stable Diffusion這樣經過不斷改良的工具尚且如此,手機端的部署就會是更大的問題。如果只是通過文字描述生成圖片,那對于普通用戶來說,最多是嘗鮮一下。新鮮勁兒一過,立馬就變成了冷門技能,大模型應用就會重蹈當年智能語音助手的覆轍,爆火之后市場慢慢冷卻下來。
因此,端側大模型應用,也需要找到高頻場景進行適配。李彥輯認為,“性能調度”將是一個很好的切入點。“大模型不光可以學習傳統的文字、圖片資料,它也可以學習用戶習慣,進而具備應用場景的自適應切換能力,”他提到。
具體來說,就是擺脫傳統的固定算法調度邏輯,讓AI更多地參與其中。比如,用戶在使用手機處理社交信息、玩游戲、刷短視頻時,對手機性能的需求是不同的。過去,手機系統往往是依靠應用來做反向適配,打游戲調用高頻率大核心提高性能、文字聊天和待機使用小核心保持續航,這種調度能力是非常固定的。
智能手機具備端側AI能力后,就能將性能調度這件事變得更加主動,可以根據當前的場景需求進行實時優化,而非照本宣科地進行軟件和策略層面的適配。
我認為,與聊天、AI繪圖等看似創新的應用體驗相比,能夠對既有的高頻場景進行精準賦能,才是端側大模型短期內能夠創造體驗價值的關鍵所在。無論是影像、性能表現上的優化,還是對屏幕、揚聲器等硬件的實時智能調節,都能帶給用戶更明顯的體驗升級。
假設有一天,通過端側大模型結合用戶習慣、應用感知得到的數據進行學習,利用對軟硬件層面的綜合調度,讓智能手機的續航可以再提升20%甚至50%,誰還會說它只是個“噱頭”呢?
標簽:
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

