韩国av不卡_日本美女久久久_少妇88av_国产黑丝在线视频_色花堂视频_天天想夜夜爽

幣圈網

與國產AI分裂 NVIDIA最強AI顯卡GB300強化FP4:能效暴增50倍

本站8月29日消息,NVIDIA日前發布了2季度財報,業績依然暴漲,新一代AI顯卡Blackwell系列中的最強者GB300今年4季度也會正式上市,下下代的Rubin有6款產品正在推進。

GB300的詳細規格可以參考之前的文章,這里要來看一個可能影響中美AI技術的變化,那就是在算法選擇上,國產的AI跟NVIDIA已經有了分裂,前者選擇的是UE8M0 FP8,而在Blackwell上NVIDIA強化的是NVFP4標準。

UE8M0 FP8這幾天引爆了國產算力行業,這是Deepseek 3.1正式問世時DS官方公布的消息,稱UE8M0 FP8已經全面適配即將發布的新一代國產AI芯片。

雖然沒有特指哪家廠商,但是華為昇騰、摩爾線程、礪算科技、芯原科技、海光科技等廠商的新一代算力芯片幾乎都會支持這個標準。

相比之前國產AI算力芯片主要采用FP16 INT8的算法標準,UE8M0 FP8帶來的好處很多,性能是之前的2-3倍,并且大幅降低顯存壓力,還能降低功耗,具體就要看各大廠商的實現了。

那作為AI一哥的NVIDIA呢?相比國內AI領域率先有DS這種模型廠商來協同算法標準的情況,NVIDIA這幾年一直以算力芯片上游廠商的身份來推動標準,FP64、FP32、FP16、INT8、FP8等標準都是支持的,而在Blackwell架構上,NVIDIA也支持FP4、MXFP4這兩種標準,但重點推的是NVFP4,它跟E2M1 FP4結構差不多,但精度幾乎沒有多少損失。

NVFP4標準的優點有哪些?首先來看性能上的,GB300的稠密性能大幅提升了50%而來到15PFlops,要知道它跟GB200基本架構可沒什么變化。

50%的性能提升或許不夠驚人,那再來看看精度變化。

與FP8的基準相比,NVFP4在DS 0528的模型精度上幾乎持平,大部分落后不到1個百分點,AIME 2024中甚至還領先了2個百分點。

在內存使用上,NVFP4與FP16相比占用減少了3.5倍,相比FP8也減少了1.8倍,而GB300顯卡HBM容量也從GB200的186GB提升到了288GB,同樣的NVL72機柜中,系統的總內存容量可達40TB,能支持3000億參數的大模型。

第三個優勢則是在能效上,GB300在NVFP4的支持下,每Token的能量消耗只有0.2J,GB200則是0.4J,H100架構的H100是10J,相比之下提升了50倍的能效。

簡單來說,NVIDIA這次主導的NVFP4算法標準性能提升了50%,精度比FP8幾乎沒有損失,內存占用大幅減少2-3倍,能效則是50倍提升。

考慮到NVIDIA的影響力,NVFP4顯然會成為前沿大模型廣泛使用的算法標準,國內大廠應該也會大規模使用。

但在國產AI芯片上,UE8M0 FP8也已經成為新一代AI芯片的標準,盡管它還不能超越NVIDIA的CUDA生態,但是這顯然也是國產AI軟件及硬件領域的一次重大協同,同樣有機會殺出重圍,或許也能打造出自己的優勢范圍呢,一切都有可能。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 99色在线观看 | 天天操国产| 亚洲欧美综合在线观看 | aaa特级毛片| 少妇久久久久久久 | 亚洲欧美一二三 | 99国产视频| 精品久久久久久久久久久aⅴ | 伊人网在线视频观看 | 久操伊人| www在线| 日韩精品一区二区三区视频 | 国产一区在线免费 | 99视频免费| 2018天天操 | 久久久久久影视 | 日韩欧美在线观看视频 | 日韩一级网站 | 欧美乱妇狂野欧美视频 | 欧美三级视频在线观看 | 精品美女久久 | 亚洲综合网在线 | 日韩少妇精品 | 在线观看一区二区三区视频 | 久久福利一区 | 日韩黄色小视频 | 欧美在线国产 | 成人免费区一区二区三区 | 夜夜操天天爽 | 一区二区欧美日韩 | 伊人在线视频观看 | 色拍拍视频 | 国产精品美女久久久久久 | 97超碰国产在线 | 亚洲视频一二区 | 成年人免费网站在线观看 | 91免费福利视频 | 精品综合久久 | 一区二区亚洲 | 亚洲成人av免费观看 | 国产男女在线 |