一年一度Hot Chips大會一向是微處理器設(shè)計(jì)師的重要聚會之一。在今年的活動上,圍繞在處理器設(shè)計(jì)師的熱門話題就是機(jī)器學(xué)習(xí)(ML),反映出一場為新的AI工作負(fù)載打造新興處理器架構(gòu)的競賽正熱烈展開。此外,隨著薪資飆漲,讓新創(chuàng)公司、大型芯片供應(yīng)商及其客戶之間,開始陷于深度學(xué)習(xí)專業(yè)工程師的搶人大作戰(zhàn)。
新創(chuàng)公司Esperanto Technologies Inc.最近聘請了兩位來自特斯拉(Tesla)自動駕駛(Autopilot)部門的資深工程經(jīng)理。David Glasco和Dan Bailey將加入Esperanto,帶領(lǐng)高階RISC-V核心和處理器工程團(tuán)隊(duì),負(fù)責(zé)深度學(xué)習(xí)和通用處理器開發(fā)任務(wù)。
新創(chuàng)公司Tachyum在Hot Chips大會介紹為其處理器擘劃的長遠(yuǎn)目標(biāo)——但也相當(dāng)接近其競爭對手Esperanto。該公司將介紹一系列據(jù)稱性能更勝英特爾(Intel) Xeon的16-64核心SoC,以及一款水冷式64核心版本,支持用于人工智能(AI)的32 GBytes HBM3,預(yù)計(jì)在明年出樣。
賽靈思(Xilinx)將描述其75W FPGA,采用板載18x27 MAC數(shù)組、382Mbits SRAM和64GB DRAM,能以8位整數(shù)運(yùn)算提供20TOPS運(yùn)算效能,用于推論作業(yè)。此外,該公司還將介紹其首款Everest加速器,這款7nm芯片采用組織成不同數(shù)據(jù)流的向量核心,可用于AI、5G和其他處理器密集型任務(wù),預(yù)計(jì)可在今年投片。
此外,Xilinx在上個月收購的中國新創(chuàng)公司深鑒科技(DeePhi Tech),將介紹其最新版的AI核心和軟件優(yōu)化細(xì)節(jié)。在Hot Chips大會上,Xilinx顯示目前至少擁有三種獨(dú)立的AI架構(gòu),得以與英特爾的FPGA部門(已經(jīng)取得微軟數(shù)據(jù)中心訂單)競爭。
在移動領(lǐng)域,Arm將深入探索其新的機(jī)器學(xué)習(xí)核心。這款GHz級的機(jī)器學(xué)習(xí)(ML)核心承諾可在卷積網(wǎng)絡(luò)上支持4TOPS,以及在7nm打造的2.5mm2芯片上實(shí)現(xiàn)3 TOPS/W性能。Google和三星(Samsung)將討論包括AI硬件的應(yīng)用處理器。
此外,新創(chuàng)公司Mythic則介紹其內(nèi)存處理器(processor-in-memory;PIM)架構(gòu)。這種新興的架構(gòu)據(jù)稱明年可望為嵌入式推論任務(wù)提供高階GPU性能。Nvidia則將為客戶提供其開放源碼的深度學(xué)習(xí)加速器,以及用于在云端訓(xùn)練模型的GPU服務(wù)器。
針對日益熱門的AI領(lǐng)域,Esperanto最近從特斯拉挖角了兩名自動駕駛?cè)瞬拧avid Glasco曾經(jīng)是特斯拉自動駕駛SoC的架構(gòu)與設(shè)計(jì)主管,將在Esperanto擔(dān)任工程副總裁。而原先負(fù)責(zé)自動駛硬件電路設(shè)計(jì)的Dan Bailey則擔(dān)任Esperanto的資深工程總監(jiān)。
今年,特斯拉似乎不斷地流失高階人才。除了因?yàn)樘厮估鼇戆阎匦姆旁谏a(chǎn)新車型,同時,今年3月一場可能使用自動駕駛模式釀禍的意外也還在調(diào)查中。今年4月,英特爾也挖角了特斯拉前資深芯片設(shè)計(jì)師Jim Keller。
Tachyum將服務(wù)器軟件移植至其專有的高階SoC(來源:Hot Chips)
新加入Esperanto的兩位工程師都擁有十分資深的芯片設(shè)計(jì)背景。在加入特斯拉之前,Glasco曾任AMD服務(wù)器SoC資深總監(jiān),還曾經(jīng)在Nvidia任職超過12年。Bailey在加入特斯拉之前曾經(jīng)是AMD資深研究員,深入研究過從Digital Equipment的Alpha之后的各種處理器。
去年11月,Esperanto在RISC-V大會上首度亮相。當(dāng)時,Esperanto首席執(zhí)行官Dave表示,該公司正在開發(fā)兩款RISC-V核心和兩款SoC,其中至少有一款將采用7nm技術(shù)工藝。搭載Maxion核心的16核心芯片瞄準(zhǔn)單線程性能,而使用Minion核心的4,096核心芯片則在每顆核心中加進(jìn)了一個向量單元,旨在實(shí)現(xiàn)最佳的每瓦性能。