高級圖形處理器在進行推廣時通常比較多個低級別性能指標。例如Imagination PowerVR GPU比較常用的比較指標為GFLOPS (測量計算吞吐量) ,每秒三角形生成數量(測量幾何吞吐量),每秒像素數填充和每秒紋理數(測量填充率) 。
除了這些較為傳統的指標,企業開始按照產品中所包含的內核數量來說明架構已經較為常見。盡管按照既定狀況來說,內核數量的含義已經被GPU市場曲解。也就是說,這個詞語具有延展性,經過一段時間這個詞語在反映常見功能方面已經有所更新。我來說明內核數量的常見意義。
什么是內核?
這要依據實際情況而定。內核數量的意義在以前是表示處理器前端的數量。內核并不復雜,前端的作用是調度執行線程。幾乎所有高級GPU都已經簡化設計,在計算資源前端設置多個調度器和相關調度邏輯,執行預訂的任務。
每個調度器跟蹤數個需要執行的線程,在單個時鐘周期中運行單個程序的單一指令。單個指令指標的作用是在一組算資源上運行程序,不考慮線程數量或者計算資源的共享方式,這是內核的通常定義。
但是,我們也用這個內核來說明Series5 SGX GPU的整個狀況。例如在SGX544MP3中,共有SGX544MP3的3個完整例程—可以復用所有GPU資源,我們稱之為MP3配置,或者叫3核 GPU。
多核的誤區
因此,隨著高級移動系統中CPU內核數量迅速增加, GPU廠商要表達的信息是GPU也是多核設計,我們的許多競爭對手將獨立的ALU流水線視作內核以強調其優勢。但這些ALU流水線不能實現完全獨立的相互調度,這些流水線與SIMD模式中的流水線一樣每個時鐘周期運行同一指令。并未出現我們所指的獨立前端或獨立指令指針,但盡管如此市場依然稱其為一個內核。
我們按照同樣的方式從基本的構建模塊---統一著色器集群(Unified Shading Cluster,USC)到獨立流水線來說明PowerVR Rogue,來看一下如何計算內核數量。
PowerVR Rogue USC
Rogue的架構是由多個模塊構建而成,這些模塊稱為統一著色器集群,簡稱USC。我們擴展這個架構來滿足客戶對GPU的需求,以支持系統級芯片及專門的細分市場,我們將數個USC以及其他相關資源連接在一起后集成在整個GPU IP上。
打開USC,您會發現用于分析數據并得出結果的是數個ALU流水線。我們并行設置這些流水線,每個USC設置16個流水線。這樣設置的原因是,圖像呈并行處理,其中多個相關的數據,通常是矢量或像素同時運行。事實上,高級像素著色的屬性驅動相關像素是并行的,因此有必要同時運行這些高級像素。
標量SIMD執行和矢量低效
USC的關鍵屬性是按照標量模式處理數據。也就是說對于給定的工作項目,例如一個象素,USC不是在同一時鐘周期內的同一獨立管道上同時執行紅、綠、藍和透明度的矢量。相反, USC在一個時鐘周期內執行一個紅色組件,接下來執行藍色組件,以此類推,直到執行完所有組件。為實現矢量基準單位的峰值吞吐量,標量SIMD單元并行處理多個工作項目。例如,每個時鐘周期內處理一個像素的4-wide矢量的峰值吞吐量相當于4-wide 標量SIMD單元,可在每個時鐘周期內處理四個像素。
表面上看這兩種方法的吞吐量相同。但是,高級GPU負載通常由使用許多不同數據寬度的數據組成。例如,通常顏色數據寬度為4 ( ARGB ),而紋理坐標的數據寬度通常為2 ( UV),還有許多標量實例( 1個組件)處理,如典型的光照計算一樣。
在光照計算中,如果數據處理沒有填滿整個矢量寬度時,就會浪費矢量處理器寶貴的計算資源。在標量架構中,正執行的運算采用一種運算類型,在同一時間運行一個組件,并行處理同一任務。例如著色處理中完全由標量處理組成,在4-wide矢量架構中執行25%的任務,而在標量SIMD架構中本應執行100%的任務。
多個低功耗ALU!
我們再來說說USC并行任務中的獨立流水線。共有16個流水線,每個流水線內部實際上存在數個執行任務的ALU。即2個FP32 ALU,2個FP16 ALU,以及1個專用函數ALU 。
為什么使用專用FP16 ALU?主要是為了節省功耗同時也是為了提高性能。與FP32 ALU相比,簡化ALU邏輯復雜度可以較低功耗執行FP16指令組,同時可執行更多的運算,在每個時鐘周期實現更高的吞吐量。稍后您就會明白。
在高級圖像渲染中以較低精度計算可能需要耗費較多時間,而APIs Rogue力求在所有通用圖形中支持混合精度運算,其中包括Direct3D 11,以及更常見的OpenGL ES2和ES3 APIs。在嵌入式圖形運算中沒有構建混合精度計算流水線是個錯誤,原因是執行混合精度工作量會造成功率放大。
性能和功能
各個ALU的功能并不一樣,我們來看一下每個ALU的作用,以便了解其性能:
PowerVR Series6, Series6XT和Series6XE中的FP32 ALU能夠在每個時鐘周期執行2浮點運算。每個USC即每個時鐘周期的64 FLOP峰值。
PowerVR Series6 GPU內共有最多8個統一著色集群( USC )
PowerVR Series6 GPU中的FP16 ALU能夠在能夠在每個時鐘周期執行最高3浮點運算,我們在Series6XE和Series6XT 改進了FP16 ALU可在每個時鐘周期執行最高4浮點運算。按照不同的產品和系列,每個USC在每個時鐘周期執行高達128浮點運算。升級型Series6XE和Series6XT更為靈活,執行流水線部分運算的編譯器更為容易。
PowerVR Series6XT GPU內共有最多8個Unified Shading Clusters( USC )
最后來說一下具有專用功能的ALU,ALU可處理更復雜的算法和三角運算,如正弦、余弦、對數、倒數和親和數、標量運算。按照這些運算的性質,設置了ALU輸出精度和性能。
增強ALU內核配置
現在,我已經說明從構建USC塊到利用16個并行管道執行任務來說明Rogue計算架構,各個管道有較大的專用計算資源,我們按照競爭對手的方式來說明內核。每個USC包括:32 FP32 ALU內核,高達64個FP16 ALU內核、16 個USC專用函數ALU內核。
按照同樣的方式將Rogue與市場競爭產品比對,ALU內核這個術語很重要,我們希望大家盡可能按這條思路來解釋內核。
最后,請記住,Imagination根據不同的產品Series6, Series6XT和Series6XE設置1對多的USC。以下為兩個實例:
PowerVR G6230: 兩個Series6 USC-64 FP32 ALU內核,每個時鐘周期執行高達128 FLOP – 64 FP16 ALU 內核,每個時鐘周期執行高達192 FLOP。也就是按照600MHz的頻率執行高達115.2 FP16 GFLOPS及高達76.8 FP32 GFLOPS。
PowerVR GX6650: 六個Series6XT USC-192 FP32 ALU內核,每個時鐘周期執行高達384 FLOP –384FP16 ALU 內核,每個時鐘周期執行高達786 FLOP。也就是按照600MHz的頻率執行高達460.8FP16 GFLOPS及高達230.4 FP32 GFLOPS。
這才是真正的內核比較參數!
相關文章
- 15-03-18三星n900t怎么root方法介紹
- 15-03-18聯想A7600自定義聯系人鈴聲和頭像方法
- 15-03-18索尼Xperia Z4又曝機身渲染圖 傳于今年9月發布
- 15-03-18三星或將推出新系列 Galaxy H7/H1曝光
- 15-03-17我的世界安卓版修改器怎么用
最新最熱相關資源
我的世界手機版俠盜獵車手js存檔類型:安卓數據包大小:1.6M
下載我的世界(Minecraft - Pocket Edition)類型:模擬經營大小:12.9M
下載我的世界手機版自由之鄉存檔類型:安卓數據包大小:3.8M
下載
我的世界(Minecraft - Pocket Edition)類型:模擬經營大小:12.9M
下載我的世界手機版幻戰血城存檔類型:安卓數據包大小:3.9M
下載我的世界手機版被塵封的世界類型:安卓數據包大小:456KB
下載
文章排行
安卓蘋果應用推薦
便娘收藏類型:益智休閑大小:17M
下載幸運樂園類型:益智休閑大小:18.8M
下載金屬轉輪類型:動作冒險大小:20M
下載蘭博基尼Urus遨游迪拜模擬器手機版(City Drive Urus)類型:模擬經營大小:71.6M
下載菇菇逃脫游戲(なめよん)類型:益智休閑大小:60.9M
下載音樂世界Cytus2類型:益智休閑大小:1.52G
下載
萬萬沒想到之大皇帝iPhone/ipad版類型:策略棋牌大小:165M
下載Pool Break 3D桌球iphone/ipad版類型:體育游戲大小:8.4M
下載食人魚3DD iphone版類型:動作游戲大小:60.9M
下載Jelly Defense果凍塔防iphone/ipad版類型:策略游戲大小:298M
下載Munch Time午餐時間iphone/ipad版類型:休閑益智大小:23.8M
下載Tiny Troopers小小部隊iphone/ipad破解版類型:射擊游戲大小:48.1M
下載
最新文章
第五人格新監管者漁女-第五人格人物介紹第五人格新監管者漁女-第五人格人物介紹
陰陽師善神什么時候出 善神上線時間介紹陰陽師善神什么時候出 善神上線時間介紹
云頂之弈11.7更新內容有哪些 云頂之弈11.7版云頂之弈11.7更新內容有哪些 云頂之弈11.7版
忘川風華錄李清照什么時候出 最新天級角色李忘川風華錄李清照什么時候出 最新天級角色李
原神尤拉什么時候出 原神尤拉上線時間介紹原神尤拉什么時候出 原神尤拉上線時間介紹
云頂之弈11.6更新內容有哪些 云頂之弈11.6版云頂之弈11.6更新內容有哪些 云頂之弈11.6版
原神1.5版本什么時候更新 原神1.5版本時間原神1.5版本什么時候更新 原神1.5版本時間
原神尤拉什么時候出 尤拉上線時間介紹原神尤拉什么時候出 尤拉上線時間介紹