0
本文作者: 呂倩 | 2017-09-13 17:57 |
科幻小說《三體》里,世界上最快的計算機,運算速度達到100萬億次。而如今的機器計算力,已達到500萬億次,阿里云高性能計算研發(fā)負責人何萬青博士表示,由此可見,科學幻想在機器計算方面,已經是很落后的了。
現(xiàn)實世界中,高速發(fā)展的計算力正推動著人工智能產業(yè)更大規(guī)模地爆發(fā)。
9月12日,阿里云異構計算家族首次亮相,推出全新一代異構加速平臺——涵蓋GPU、FPGA在內等6款異構實例,可滿足從圖形渲染到高性能計算及人工智能等復雜應用的計算需求。特別是在人工智能領域,可將深度學習成本縮減一半,大幅降低人工智能計算門檻;而基于阿里云異構平臺的全新高性能計算實例E-HPC,可一鍵部署獲得媲美大型超算集群環(huán)境的“云上超算中心”。
這是繼企業(yè)級ECS家族全線升級后,阿里云再次在企業(yè)級市場推出專業(yè)服務,將異構計算的使能領域從人工智能擴大到更廣的計算需求領域。
據雷鋒網了解,新品具備更強的并行能力和多場景支持,不僅全力支撐人工智能計算力升級需求,也為圖形計算、生命科學、材料力學、分子動力學等科研計算領域提供普惠計算能力。
而此番推出的異構計算加速平臺,阿里云異構計算負責人張獻濤對雷鋒網表示,主要為了進一步完善人工智能產業(yè)生態(tài),滿足更多客戶的核心業(yè)務需求。
1、
阿里云此次推出適用于深度學習在線推理(Inference)的GPU實例GN5i,采用了英偉達 Pascal架構P4圖形處理器,提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力??筛鶕疃葘W習計算力的要求,進行GPU實例的“Scale-out”水平擴容或“Scale-up”垂直變配,分鐘級即可完成實例的創(chuàng)建。阿里云內部人士透露,下半年,還將推出搭載目前性能最強GPU V100的高性能GPU實例,大幅提升深度學習的處理效率。
據阿里云高級技術專家龍欣介紹,在面向AI深度學習在線推理場景時,GN5i實例依托專有推理型GPU和阿里云高性能SSD云存儲和OSS存儲服務,在滿足數據處理IO的基礎上,時延最低可達微秒級;另外,GN5i可一鍵部署TensorFlow、Caffe等主流深度學習框架,提供智能調度、自動運維、實時擴容等服務,有效降低人工智能在線服務成本50%以上。
作為異構計算近些年來的新寵,功耗低、實時性強的FPGA普遍被業(yè)界看好,提供云上基于FPGA的高效靈活場景化并行計算能力,已成為公共云的基礎服務。
2017年初,阿里云推出基于英特爾Arria 10芯片的FPGA計算實例,已幫助大量用戶通過自定義加速算法,實現(xiàn)云上FPGA加速業(yè)務的一鍵部署、快速研發(fā)和彈性伸縮,有效提升了人工智能及深度學習的效率,為企業(yè)節(jié)省成本。
而此次發(fā)布的F2實例基于賽靈思Xilinx KU115器件,提供145萬邏輯門電路,單實例的單精度浮點計算性能可達1.5TFlops。隨著集成英特爾(F1)和賽靈思(F2)芯片的FPGA計算實例相繼面世,阿里云率先完成對主流FPGA方案的全覆蓋,成為全球FPGA領域產品線最全、場景最多的公共云服務商。再加上阿里云業(yè)已推出的FPGA鏡像市場,可幫助用戶完成更多定制化FPGA加速方案,提高特定業(yè)務和算法的效率。
相比GPU和CPU,F(xiàn)PGA更適合非標數據位寬的人工智能、金融分析、基因匹配、物聯(lián)網數據庫等領域。
龍欣對雷鋒網表示,阿里云針對非標準位寬場景做了大幅優(yōu)化,以物聯(lián)網時序數據庫為例,F(xiàn)2的處理效率可比CPU高30倍,為用戶大幅降低硬件加速時間和成本?!鞍⒗镌葡M峁┮粋€彈性、完善的FPGA開發(fā)環(huán)境,幫助用戶縮短開發(fā)周期,并以最低的成本、最大的靈活度在云端快速搭建完整的硬件加速服務?!褒埿辣硎?。
2、
針對傳統(tǒng)對高性能計算有強烈需求的高??蒲袡C構和企業(yè)用戶,阿里云異構計算家族推出了彈性高性能計算實例E-HPC,這也是中國首個公共云上的HPC as a Service產品。
E-HPC基于阿里云異構計算平臺在高性能虛擬化、并行計算、低延遲網絡和HPC軟件棧等方面的特性,幫助生命科學,氣象預報,石油勘探,工業(yè)設計和航空航天等領域的客戶,快速獲得高性能計算集群計算能力、調度能力和軟件能力,按需組建自己的“云上超算中心”,并可實現(xiàn)一鍵部署和彈性伸縮。
“如果把傳統(tǒng)超算中心比作‘珠穆朗瑪峰’,那么阿里云的E-HPC則是將高性能計算做更普惠的覆蓋,成為高性能計算的‘青藏高原’。” 阿里云資深專家何萬青打比喻稱。
實際上,阿里巴巴集團內部很多業(yè)務是通過異構計算取得非常好的計算加速效果,比如拍立淘、以圖搜圖、商品分類等,這些解決方案正通過阿里云對外輸出;再加上阿里云基礎設施在25G網絡、第三代分布式存儲、遍布全球的13個區(qū)域的數據中心及高可用骨干網等方面的不斷創(chuàng)新,可為人工智能提供高性能、彈性伸縮和業(yè)務永續(xù)的加速引擎。
除了產品層面,阿里云還提供了全方位的人工智能產業(yè)服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術服務,這些技術正通過阿里云ET為客戶服務。過去一年,阿里云推出ET城市大腦、ET工業(yè)大腦、ET醫(yī)療大腦等行業(yè)垂直的人工智能系統(tǒng),將人工智能技術落地到產業(yè)中去。
一直以來,HPC市場都是相比封閉的,由傳統(tǒng)高校研發(fā)、運用、測試。在將這一傳統(tǒng)技術由線下搬到線上時,必然將會遇到諸多困難。對于這一點,何萬青對雷鋒網表示,放眼國際,很多原本做超算軟件的公司,如今都轉變?yōu)槌惴展?,提供了所謂的“云連接”。但此“云連接”之下,究竟使用的是專用集群還是其他公有云,你是看不見的。
況且,何萬青表示,這個世界永遠是新的生產關系和新的活躍的進取的人,活水攪動死水。足夠積極得應對,才能把產業(yè)、行業(yè)做起來。
張獻濤則補充稱,云有自己的特點——彈性、多樣性——絕大部分數據中心有自己的特殊架構設計和自己獨特的使用方法。阿里云所具備的彈性和靈活性,是可以與傳統(tǒng)超算中心進行差異化競爭的一個主要優(yōu)勢。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。