提高AI模型數(shù)據(jù)吞吐量 芯動(dòng)力發(fā)明神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方案
- 來(lái)源:互聯(lián)網(wǎng)
- |
- 2021-11-02
- |
- 0 條評(píng)論
- |
- |
- T小字 T大字
【嘉勤點(diǎn)評(píng)】芯動(dòng)力發(fā)明的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)及讀取方案,在系統(tǒng)初始化時(shí)就將神經(jīng)網(wǎng)絡(luò)首層的權(quán)值固化在靜態(tài)隨機(jī)存取存儲(chǔ)器的靜態(tài)內(nèi)存中,有利于解決循環(huán)緩存上溢和下溢的問(wèn)題,從而使芯片達(dá)到較優(yōu)的吞吐量,也可以降低芯片的功耗和成本。
隨著AI芯片的計(jì)算能力越來(lái)越強(qiáng),以及神經(jīng)網(wǎng)絡(luò)模型越來(lái)越深,AI處理器在進(jìn)行訓(xùn)練或推理時(shí),需要讀取大量的權(quán)值數(shù)據(jù)用于計(jì)算,而大量的數(shù)據(jù)吞吐,無(wú)疑會(huì)降低AI芯片的運(yùn)算能力。
為了降低芯片的功耗和成本,相關(guān)人員在神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方面做了深度研究,目前主流的存儲(chǔ)方案有高速DDR(雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器)結(jié)合Cache緩存或者采用超大容量的SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器),進(jìn)一步還有采用乒乓緩存的方案。
然而,上述方案仍然存在種種弊端,比如傳輸帶寬大、存儲(chǔ)占用空間大或者難以使芯片的吞吐量達(dá)到較優(yōu)狀態(tài),導(dǎo)致芯片的功耗和成本居高不下。
為此,芯動(dòng)力在2021年5月7日申請(qǐng)了一項(xiàng)名為“神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方法、讀取方法及相關(guān)設(shè)備”的發(fā)明專利(申請(qǐng)?zhí)枺?02110498031.4),申請(qǐng)人為珠海市芯動(dòng)力科技有限公司。
根據(jù)該專利目前公開(kāi)的相關(guān)資料,讓我們一起來(lái)看看這項(xiàng)技術(shù)方案吧。
首先,讓我們來(lái)看看目前現(xiàn)有技術(shù)中的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)和讀取方案是怎么樣的,如上圖所示,在神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方面,現(xiàn)有技術(shù)提出了高速DDR存儲(chǔ)結(jié)合L2Cache(二級(jí)緩存)的方案。神經(jīng)網(wǎng)絡(luò)各層的權(quán)值存儲(chǔ)在DDR中,處理器在計(jì)算時(shí),通過(guò)高速DDR接口把待處理的權(quán)值加載到Cache中,但是,在處理器計(jì)算能力越強(qiáng)的情況下,該方案所需的DDR傳輸帶寬也就越大,不利于降低芯片的功耗和成本。
為此,上圖為該專利中發(fā)明的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)和讀取架構(gòu)的示意圖,該架構(gòu)包括:處理器、小容量的SRAM、DDR和DMA控制器。其中,SRAM被劃分靜態(tài)內(nèi)存和循環(huán)緩存兩塊存儲(chǔ)區(qū),靜態(tài)內(nèi)存用于固化神經(jīng)網(wǎng)絡(luò)中的出現(xiàn)下溢的層,循環(huán)緩存用于預(yù)取和存儲(chǔ)神經(jīng)網(wǎng)絡(luò)中未出現(xiàn)下溢的層。
DMA控制器用于從DDR中讀取神經(jīng)網(wǎng)絡(luò)權(quán)值并向循環(huán)緩存中寫(xiě)入讀取的權(quán)值,處理器用于從靜態(tài)內(nèi)存或循環(huán)緩存中讀取權(quán)值以進(jìn)行計(jì)算,比如GEMM(通用矩陣乘)運(yùn)算等。
在該結(jié)構(gòu)中,會(huì)把出現(xiàn)緩存下溢的神經(jīng)網(wǎng)絡(luò)層的取值固化到靜態(tài)內(nèi)存中,有利于解決循環(huán)緩存下溢的問(wèn)題,當(dāng)神經(jīng)網(wǎng)絡(luò)各層中不存在出現(xiàn)下溢的層時(shí),將獲取到的對(duì)應(yīng)權(quán)值累積長(zhǎng)度的最大值設(shè)定為循環(huán)緩存的最大存儲(chǔ)空間,從而有利于解決循環(huán)緩存上溢的問(wèn)題。并能夠以較小的SRAM空間和較低的DDR傳輸帶寬達(dá)到芯片較優(yōu)的吞吐量,以降低芯片的功耗和成本。
最后,上圖為這種神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方法的流程示意圖,DMA控制器在系統(tǒng)初始化時(shí)將神經(jīng)網(wǎng)絡(luò)首層的權(quán)值固化在靜態(tài)隨機(jī)存取存儲(chǔ)器的靜態(tài)內(nèi)存中,并獲取靜態(tài)隨機(jī)存取存儲(chǔ)器的循環(huán)緩存中神經(jīng)網(wǎng)絡(luò)各層的權(quán)值累積長(zhǎng)度,將根據(jù)權(quán)值累計(jì)長(zhǎng)度將各層中的目標(biāo)層的權(quán)值固化在靜態(tài)內(nèi)存中。
DMA控制器執(zhí)行下一次獲取權(quán)值累積長(zhǎng)度的操作,重復(fù)執(zhí)行多次獲取權(quán)值累積長(zhǎng)度的操作,直至各層中不存在目標(biāo)層。此時(shí),DMA控制器會(huì)根據(jù)各層中不存在目標(biāo)層時(shí)對(duì)應(yīng)的權(quán)值累積長(zhǎng)度設(shè)定循環(huán)緩存的大小。
以上就是芯動(dòng)力發(fā)明的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)及讀取方法,該方案在系統(tǒng)初始化時(shí)就將神經(jīng)網(wǎng)絡(luò)首層的權(quán)值固化在靜態(tài)隨機(jī)存取存儲(chǔ)器的靜態(tài)內(nèi)存中,有利于解決循環(huán)緩存上溢和下溢的問(wèn)題,從而使芯片達(dá)到較優(yōu)的吞吐量,也可以降低芯片的功耗和成本。
(holly)
,齊翔騰達(dá)股票,廣州豐胸伊麗莎白典范,泰達(dá)足球 http://www.cityruyi.com/lm-2/lm-3/1469.html- 標(biāo)簽:,宮廷生男生女表,sw 047,優(yōu)界網(wǎng)
- 編輯:李娜
- 相關(guān)文章
-
提高AI模型數(shù)據(jù)吞吐量 芯動(dòng)力發(fā)明神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)方案
【嘉勤點(diǎn)評(píng)】芯動(dòng)力發(fā)明的神經(jīng)網(wǎng)絡(luò)權(quán)值存儲(chǔ)及讀取方案,在系統(tǒng)初始化時(shí)就將神經(jīng)網(wǎng)絡(luò)首層的權(quán)值固化在靜態(tài)隨機(jī)存取存儲(chǔ)器的…
-
WiFi芯片漲價(jià)20%?聯(lián)發(fā)科:不評(píng)論價(jià)格
圖源:AFP 在供不應(yīng)求的市況之下,近日傳出聯(lián)發(fā)科10月將調(diào)漲WiFi芯片產(chǎn)品20%,對(duì)此,聯(lián)發(fā)科回應(yīng)稱,不評(píng)論價(jià)格。 據(jù)臺(tái)媒“中央社…
- 愛(ài)德萬(wàn)宣布收購(gòu)美國(guó)測(cè)試設(shè)備供應(yīng)商R&D Altanova
- 指標(biāo)分析師:電視面板價(jià)格12月或明年初止穩(wěn)反彈
- 榮耀擊敗小米?
- 雅創(chuàng)電子:貢獻(xiàn)中國(guó)芯力量,國(guó)產(chǎn)芯替代加速
- 賦予應(yīng)用場(chǎng)景“看”的能力 深視光點(diǎn)3D機(jī)器視覺(jué)芯片研發(fā)之路