多的計算單元和超長的流水線,但只有非常簡單的控制邏輯並省去了各種高速緩存。不像是cpu不僅被緩存占據了大量空間,還要有複雜的控制邏輯和優化電路,相比之下計算能力只是cpu很小的一部分。
林奇當即翻開腦海深處的記憶宮殿裡批量掃描的晶片設計書籍,仔細翻開gpu部分,原先的10-20%的計算單元一下子被提升至80-90%占比。
原先cpu也確實有強大的alu(算術運算單元),能夠在很少的時鐘周期完成算術運算,想雙精度浮點運算的加減乘數,都只需要幾個始終周期而已,而cpu的時鐘周期,已經到了幾g赫茲的恐怖地步,也就是一秒內的運算周期,是十的九次方級別。
理想總是很美好,這也是林奇痴迷cpu的關鍵點。
然而,相比較起來,gpu則基於大規模吞吐量來設計,alu模塊極多而緩存極少,甚至緩存的作用只是為了管理線程而服務,如果多個線程需要一個數據,那麼緩存便會合併這些訪問,然後再去訪問儲存數據。
世面上的cpu再多核也不會超過兩位數,每個核都有足夠大的緩存和足夠多的數字和邏輯運算單元,並輔助有很多加速分支判斷甚至更複雜的邏輯判斷的硬體。、
而gpu的核數遠超,像是nvidia fermi便有512個核。
每個核擁有的緩存大小相對小,數字邏輯運算單元也少而簡單。
因此比起擅長邏輯控制串行運算,更加通用的cpu而言,gpu反而擅長大規模的並發計算。
應用場景也更為苛刻——密碼破解、圖像處理,並行計算這些。
所以才成為礦機之源。
哎!
林奇忍不住嘆息。
他還是先入為主了!
就如同油車和電車,曾經林奇也無比瞧不起電車,絕對它沒有油門的轟鳴,一點都沒有機械美感,可直到他正式開上這麼一回,才明白到零延時的電門響應與單踏板控制是多麼順滑的事情。
cpu的工作是傻乎乎,是計算量大而沒有半點計算含量,就單純的重複計算。
就好比如果有一個工作要上億次計算簡單的加減乘除一樣,而這些計算相互間獨立沒有規律,那麼一群小學生的效率,絕對比一位大教授來的迅捷。
想到這裡,林奇也不禁大罵自己傻乎乎地拍了拍腦門!
法術不就是這種應用場景?
他之前到底是豬油蒙了心還是哪裡想不開。
多快好省,人海戰術,這麼簡單的原理他都忘了?
就好比他曾經還無比奇怪,以為密碼破解器是攻破軟體的深層邏輯,直接編譯出內在的密碼,後來才知道,所謂破解不過是用無數常用的密碼去碾壓一會。
因此這種「ppnn13%dkstfeb.1st」(娉娉裊裊十三餘,豆蔻梢頭二月初)才能夠扛得起各種破解打擊。
gpu這種簡單而精簡重複的架構,反而方便他開發複製。
最初gpu的設計出現之基,便是為了視頻遊戲而生,乃至後來也都是為了視頻與遊戲市場而不斷升級。
它們最初為了解決的問題,都是對三維遊戲裡的海量數據進行相同操作,諸如對每個頂點進行坐標變換,然後根據同樣的光照模型計算顏色。
這不就是法術數據進行重複的計算,不斷收斂到精準?
慢慢地,林奇整個心神都沉浸了下來,開始翻閱著gpu構架的書籍,重新梳理起自己新的處理器設計藍圖。
夢想照進現實,僅僅一步之遙。
第315章 法術儀式