今年以來(lái),“AI手機(jī)”“大模型進(jìn)手機(jī)”幾乎成了各家旗艦發(fā)布會(huì)的高頻詞。對(duì)不少消費(fèi)者來(lái)說(shuō),新一代手機(jī)除了要跑得更快、拍得更清晰,更重要的是各種AI能力能不能隨時(shí)可用,又盡量少把數(shù)據(jù)往云端傳,保護(hù)個(gè)人隱私安全,這也讓“端側(cè)AI”逐漸從幕后走到臺(tái)前。
在這樣的背景下,聯(lián)發(fā)科最新旗艦移動(dòng)平臺(tái)天璣9500,把端側(cè)AI放在了更核心的位置。通過(guò)全新的雙NPU架構(gòu),它試圖讓更多大模型推理直接在本地完成,在算力、功耗與隱私之間尋找一個(gè)新的平衡點(diǎn)。

在架構(gòu)上,天璣9500內(nèi)部集成了一顆主打高性能的 NPU 990,以及一顆面向日常常駐任務(wù)的能效型 NPU。高性能 NPU 990 在標(biāo)桿測(cè)試中的得分突破一萬(wàn)五千分,相比上一代算力提升超過(guò)一倍,主要用來(lái)應(yīng)對(duì)諸如4K分辨率文生圖、多模態(tài)內(nèi)容理解等重負(fù)載AI任務(wù),需要瞬時(shí)爆發(fā)力的工作更多交給它來(lái)完成。
另一顆能效型 NPU 則更像是“值班常駐”的角色。它采用存算一體等新架構(gòu)設(shè)計(jì),在同等場(chǎng)景下的運(yùn)行功耗相比傳統(tǒng)NPU進(jìn)一步降低,再疊加臺(tái)積電第三代3nm工藝,讓平臺(tái)在NPU峰值功耗上也較上一代有明顯下降。這意味著,在實(shí)時(shí)字幕、AI翻譯、場(chǎng)景識(shí)別這類可能長(zhǎng)時(shí)間開啟的功能下,手機(jī)發(fā)熱和續(xù)航壓力都能被控制在更可接受的范圍內(nèi)。

面向生成式AI場(chǎng)景,天璣9500集成了新一代生成式AI引擎 2.0,并適配 BitNet 1.58bit 等低比特大模型推理方案,通過(guò)在硬件電路和內(nèi)存壓縮上的針對(duì)性優(yōu)化,在同等性能下可以顯著壓低峰值功耗。對(duì)于普通用戶來(lái)說(shuō),這種優(yōu)化帶來(lái)的直觀感受,一方面是手機(jī)在本地生成一張4K分辨率的AI圖片,出圖速度可以控制在十秒左右;另一方面,則是在手機(jī)同時(shí)運(yùn)行多項(xiàng)AI服務(wù)時(shí),更不容易出現(xiàn)機(jī)身發(fā)熱、掉電過(guò)快的問(wèn)題,對(duì)被頻繁提及的“AI手機(jī)續(xù)航焦慮”給出了一種較為直接的答案。
當(dāng)算力和能效鋪好之后,更關(guān)鍵的問(wèn)題是端側(cè)AI到底能帶來(lái)什么具體體驗(yàn)。聯(lián)發(fā)科給出的典型場(chǎng)景之一,是把“長(zhǎng)內(nèi)容處理”放在本機(jī)完成:針對(duì)萬(wàn)字級(jí)文章或接近一小時(shí)的錄音,手機(jī)可以在無(wú)需聯(lián)網(wǎng)的情況下完成摘要和要點(diǎn)提煉,敏感內(nèi)容全程保留在本地存儲(chǔ);對(duì)于一些過(guò)去高度依賴云端的文生圖任務(wù),也能在本地完成高分辨率出圖,不再完全受網(wǎng)絡(luò)狀況限制