AI效率260倍CPU:阿里雙11大規(guī)模部署NVIDIA GPU
一年一度的雙11、雙12購(gòu)物狂歡都已經(jīng)過(guò)去,而在蘇州舉辦的GTC CHINA 2019大會(huì)上,NVIDIA和阿里巴巴共同透露了一個(gè)小“秘密”—;—;原來(lái),雙11 2684億元?jiǎng)?chuàng)紀(jì)錄成交額的背后,離不開NVIDIA GPU的大規(guī)模部署。
阿里巴巴異構(gòu)計(jì)算總監(jiān)徐凌杰表示,每天有超過(guò)1億購(gòu)物者在阿里網(wǎng)站上瀏覽數(shù)十億種商品,在購(gòu)物高峰日,阿里的系統(tǒng)每秒需要處理數(shù)十萬(wàn)個(gè)查詢,而能夠保證了這一切都能正常運(yùn)行,正是AI 的功勞。
阿里引入了NVIDIA加速計(jì)算平臺(tái),大規(guī)模部署先進(jìn)的AI技術(shù),包括Tesla T4 GPU、cuBLAS運(yùn)算庫(kù)、自定義混合精度、推理加速軟件等,通過(guò)其直觀的搜索功能和可靠的推薦,能夠支持比過(guò)去復(fù)雜6倍的模型,從而使點(diǎn)擊率提高10%。
據(jù)悉,相比于CPU,Tesla T4將最大模型的吞吐量提高了100倍,能夠?yàn)榘⒗飶V泛、深入的推薦模型提供加速,每秒可處理780個(gè)查詢,而基于CPU的推理每秒只能處理3個(gè),效率差了足足260倍。
對(duì)電商來(lái)說(shuō),推薦系統(tǒng)是至關(guān)重要的應(yīng)用程序,可以向用戶展示與其喜好相匹配的商品,從而提高點(diǎn)擊率,而點(diǎn)擊率的每一次小幅提高,都會(huì)直接影響用戶的體驗(yàn)和商家的營(yíng)收。使用能夠?qū)崟r(shí)大規(guī)模運(yùn)行的先進(jìn)推薦系統(tǒng)模型使點(diǎn)擊率提高10%,目前這只能通過(guò)GPU實(shí)現(xiàn)。
據(jù)介紹,阿里使用NVIDIA GPU支持資源分配、模型量化和圖變換三項(xiàng)優(yōu)化策略,從而提高吞吐量和響應(yīng)性,還部署NVIDIA GPU為各類系統(tǒng)提速,包括自動(dòng)廣告橫幅生成、廣告推薦、幫助識(shí)別假冒產(chǎn)品的圖像處理、語(yǔ)言翻譯、語(yǔ)音識(shí)別等系統(tǒng)。
除了阿里云,百度、字節(jié)跳動(dòng)、滴滴、快手、美團(tuán)點(diǎn)評(píng)、平安科技、搜狗、騰訊、小米等中國(guó)科技巨頭的云服務(wù)也都部署著NVIDIA GPU。