阿里巴巴NPU人工智慧晶片AI晶片登場,平頭哥半導體掏出一把「含光800」「玄鐵910」高效能處理器

阿里巴巴第一顆AI晶片登場,平頭哥半導體掏出一把「含光800」寶劍

阿里巴巴集團2018年發表的半導體公司「平頭哥」嗎?相隔一年,今(25日)終於推出首款人工智慧推理晶片「含光800」,晶片由「阿里巴巴達摩院」(Alibaba DAMO Academy)旗下的平頭哥所研發。

阿里巴巴集團年度技術盛會「杭州雲棲大會」正式開幕,一開始,阿里巴巴就立刻發布名為「含光800」的高效能神經網路晶片,這家雲端巨頭跳下來自主研發AI晶片,讓外界格外好奇應用屬性,阿里巴巴也揭開面紗,強調這顆晶片硬體架構除自行研發,演算法更是專門為阿里巴巴生態系統如零售和物流等應用所設計的。

為何叫「含光800」?阿里巴巴解釋,這沿襲阿里巴巴的命名傳統,取字神兵寶劍,含光是上古三大神劍之一,含而不露、光而不耀,正如含光晶片「無形卻有強勁的算力」作用方式。平哥頭7月發表的第一款處理器命名為玄鐵910。

含光AI晶片效能:電商智慧推薦時間縮短12倍

「含光800」已應用在阿里巴巴內部,主要支援集團旗下電商平台,例如產品搜尋、自動翻譯、個人化產品推薦、廣告以及智慧客戶服務等。但阿里巴巴集團CTO兼阿里雲智能總裁張建鋒也說,「現在含光800能支持集團目前業務及一些新興事業的發展,並提升資源使用效益。下一步就能為客戶提供晶片先進算力,讓客戶隨時隨地享受高效的運算服務。」

阿里巴巴舉電商平台淘寶為例,過去系統需耗費一小時對每天新增的十億張海量圖片進行識別分類,之後再給數億消費者提供個人化的搜尋和推薦服務。在「含光800」支援下,系統僅需五分鐘就可完成此過程。

阿里巴巴也給出含光800晶片的效能數據,引用ResNet-50測試資料顯示,「含光800」單晶片效能最高可達78,563 IPS,效能功耗比至500 IPS/W,強調以上兩種效能均超出業界平均水平。

「這是阿里巴巴第一次有了自己的硬體架構,結合了阿里的算法到晶片裡面」張建鋒強調,阿里巴巴與其他硬體公司相比的最大優勢在擁有自己的演算法與軟體,更有互聯網公司的研發效率,由設計、驗證到量產只花一年半的時間。

中國自給率目標4成,玄鐵處理器RISC-V架構登場

平頭哥也將與全球晶片研發商合作,建構一套全面從「端到雲」(Edge-to-cloud)的晶片生態系統。

今年7月,平頭哥也首度發表第一款基於RISC-V開源指令集架構的「玄鐵910」高效能處理器,針對運算能力具高要求的網路相關應用,如人工智慧應用、網路通訊、閘道技術、自動駕駛、邊緣伺服器等。

阿里巴巴強調,「玄鐵910」處理器的特定代碼計畫將向全球開發人員開放,以利他們更快速地進行晶片原型設計,這也是中國積極提高半導體自給率下,全國力拚40%自給率的重要一步。

還「平頭頭」名稱是怎麼來的嗎?這是2018年創辦人馬雲發想的,原來,中國對非洲草原動物蜜獾取了外號叫平頭哥。蜜獾頭上短毛平滑,但性情兇狠,身形瘦小卻可以獵食對象比自己體型大數倍的野兔、蛇、豪豬及鱷魚,被稱為「最無所畏懼的動物」,馬雲取其名希望平頭哥半導體能有蜜獾「不怕」的精神,奮勇向前。

【杭州直擊】重磅宣布!阿里巴巴推出號稱最強AI推論晶片含光800,淘寶用來分類10億張圖片只需5分鐘

走過20個年頭的阿里巴巴集團今天在杭州舉辦第10屆的雲棲技術大會,阿里巴巴集團CTO兼阿里雲智能總裁張建鋒在開場演講中,重磅發布了阿里巴巴第一款自行研發的AI推論晶片含光800,也正式推出了採用含光800晶片的雲端AI服務,可供企業直接租用。

阿里巴巴去年成立了達摩院半導體晶片公司平頭哥,先前已推出了RISC-V架構晶片玄鐵910,以及SoC單晶片平臺無劍,這次發表的含光則是一款神經網絡晶片NPU(Neural Processor Unit)。

阿里巴巴集團解釋,平頭哥產品命名多取自神兵寶劍。「含光」是上古三大神劍之一,含而不露,光而不耀,要用來比喻含光晶片可提供無形卻強勁的算力。

張建鋒表示,含光800是全球最高效能的AI推論晶片,在效能上,以業界慣用的ResNet-50測試,含光800單晶片效能最高可以達78,563IPS(Images per second),等於每秒可以處理7萬8千多張圖片,若用功耗比來看,則可提供500IPS/W。

阿里巴巴內部應用已經開始採用含光800晶片,主要用在支援阿里巴巴集團旗下電商平臺,例如產品搜尋、自動翻譯、個人化產品推薦、廣告以及智慧客戶服務等需強大算力的功能,試圖用來改善消費者的購物體驗。

張建鋒以阿里巴巴電商平臺淘寶的購物圖片搜索App「拍立淘」為例,他提到,拍立淘的圖片庫每天會增加10億張圖片,過去,需要耗費1小時,才能對每天新增的這10億張圖片進行識別與分類,作為使用者個人化的搜尋和推薦服務之用。改用含光800晶片後,AI系統只要5分鐘就可完成一樣的事情。

阿里巴巴也秀出含光晶片與業界主流AI晶片,甚至列出與GPU產品的比較,也宣稱,含光的推論性能遠高於業界產品,不過,阿里巴巴沒有揭露是與哪些廠牌的哪幾款產品比較。

含光800與業界主流AI晶片的效能比較表

另一個例子是杭州主城區的交通監視影片分析,阿里巴巴宣稱,過去需要40張GPU卡,可提供300ms延遲的回應速度,改用含光 NPU晶片後,只需4張專用卡,回應速度也快了一倍,只需要150ms。

阿里巴巴推出首款NPU人工智慧晶片「含光800」,加強雲端運算能力

去年的雲棲大會上,阿里巴巴正式宣布成立晶片公司「平頭哥半導體有限公司」,正式跨入晶片製造行列。一年後的今天,平頭哥團隊驗收初步成果的日子到來了。今天,達摩院院長張建鋒在杭州雲棲大會現場展示了含光800——阿里巴巴第一顆自研的高效能神經網路晶片,該晶片能大幅提升透過機器學習來完成任務的速度。

含光之名,源自中國上古三大神劍之一「含光劍」,該劍含而不露,光而不耀。目前「含光800」已應用在阿里巴巴內部,並主要用於支援集團旗下電商平台,例如產品搜尋、自動翻譯、個人化產品推薦、廣告以及智慧客戶服務等需要強大算力的功能,以進一步完整消費者的購物體驗。

含光800針對深度學習中使用的大量權重參數和張量數據,透過獨特設計處理技術,大大減低了I/O 需求和數據的搬移,NPU 同時深度優化了卷積、矩陣乘、向量計算和各種函數,有效解決晶片性能瓶頸問題。

阿里巴巴集團CTO兼阿里雲智能總裁張建鋒表示:「推出『含光800』是阿里巴巴在技術創新里程上的一個重要進展。透過加強運算能力,『含光800』能支持集團目前業務及一些新興事業的發展,並提升資源使用效益。不久將來,我們希望通過雲端為客戶提供由我們晶片所支援的更先進的算力,讓他們能隨時隨地享受高效的運算服務。」

阿里雲致力通過提供領先的技術基礎設施,賦能不同規模企業並縮小技術鴻溝,最終在全球實現科技普惠。

「含光800」NPU是基於阿里雲自主研發的硬體架構、並優化了專門為阿里巴巴生態系統如零售和物流等應用所設計的演算法,目前已在測試中展示出了卓越效能。業界權威ResNet-50測試資料顯示,「含光800」單晶片效能最高可達78,563 IPS,效能功耗比至500 IPS/W。以上兩種效能均超出業界平均水平,顯示「含光800」兼具世界一流的運算能力和運算效率。

以阿里巴巴電商平台淘寶為例。過去系統需耗費一小時對每天新增的十億張海量圖片進行識別分類,之後再給數億消費者提供個人化的搜尋和推薦服務。現在「含光800」支援下,系統僅需五分鐘就可完成此過程。

平頭哥致力於雲上和端側的晶片研發及創新工作。同時,平頭哥與全球晶片研發商合作,建構一套全面從「端到雲」(Edge-to-cloud)的晶片生態系統。今年7月,平頭哥首發基於RISC-V開源指令集架構的「玄鐵910」高效能處理器,滿足對運算能力具高要求的互聯網相關應用,例如人工智慧應用、網路通訊、閘道技術、自動駕駛、邊緣伺服器等。「玄鐵910」處理器的特定代碼計畫將向全球開發人員開放,以利他們更快速地進行晶片原型設計。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏
Forums  ›  📰新聞  ›  中國