如果問你英偉達是做什么的,你的第一反應是否是顯卡?從“顯卡大廠”到“AI霸主”,英偉達已走過了27個年頭。該公司官網的“名片”為:GPU(圖形處理器)的發明者,也是人工智能計算的引領者。
12月15日—12月19日,英偉達為期5天的GTC中國線上大會正式召開,探索英偉達技術如何在AI、圖形計算、智慧醫療、機器人等領域帶來突破性進展,并為各行各業帶來變革。期間,英偉達各類產品線的技術專家在“閉門會議”上的發言都帶來了哪些干貨?
架構創新助力計算效率提升
黃氏定律預測GPU將推動AI性能實現逐年翻倍,而黃氏定律的核心是架構創新。“英偉達更多的是依靠架構上的創新,從而使GPU發展速度和性能提升呈現幾倍、甚至幾十倍的結果。”英偉達區中國工程和解決方案高級總監賴俊杰如是說道。
全新的英偉達 Ampere GPU架構可以為AI、數據科學以及高性能計算等提供6倍的性能提升。而基于英偉達Ampere架構的首款產品A100 Tensor Core GPU則是全球最大的7nm處理器,擁有超過540億個晶體管。
據賴俊杰介紹,英偉達A100結合了第三代Tensor Core、結構化疏松技術、新的多實例GPU功能和第三代 NVLink 高速互聯技術等關鍵性技術,使得A100能夠在各種規模的計算上提供前所未有的加速。
其中,英偉達第三代Tensor Core引入了TF32精度,一方面,它有足夠的動態范圍和精度,能夠保證網絡在訓練的時候沒有任何精度損失; 另一方面,它能夠利用Tensor Core架構大大加速神經網絡相關的一些計算性能。
在剛剛過去的10月,英偉達發布了A100 80GB版本,與A100 GPU區別主要體現在內存方面。據了解,A100 80GB的版本采用了HBM2e版本的內存,并且它的容量能夠達到20GB,其顯存帶寬超過2TB。采用A100 80GB版本的DGX服務器,其顯存總容量可以達到640GB。
何為未來的網絡架構
英偉達亞太區網絡市場開發高級總監宋慶春指出,“英偉達剛剛發布的NDR InfiniBand產品充分體現了未來的網絡架構,即軟件定義、硬件加速、云原生、網絡計算的網絡。”
在NDR產品發布以后,世界上有了第一款400Gb/s的端到端網絡解決方案。而且在英偉達的NDR產品上面,實現了網絡通信中最難的 AllReduce和 All2All集合通信硬件卸載,解決了行業的痛點。
憑借NDR產品,可在3個Hop內達到超過百萬臺的服務器互連,E級和Z級系統Ready,SHARP的網絡計算能力提升32倍。
“NDR是一個完全的SDN的網絡,在網絡內其所有的操作都可由軟件進行控制。同時,在管理上面實現了Cyber AI管理。將AI和網絡管理整合在一起,可以讓網絡管理員主動預防網絡故障、規避故障的發生,而不是等到網絡故障發生以后被動的找問題。”宋慶春說道。
據悉,英偉達上個月宣布推出英偉達 Mellanox 400G InfiniBand產品,其是第7代的InfiniBand產品,利用100Gb/s的PAM4 Serdes技術, 實現了400Gb/s的單端口傳輸帶寬, 是上一代產品的兩倍, 同時通過添加更多、更強大的加速引擎,實現了更強大的計算和通信能力。
Jetson平臺助AI落地
Jetson是英偉達的自主機器平臺,截至目前,該平臺已在全球擁有70萬開發者,而且這個數字每一天還在增長當中。
對于Jetson受歡迎的原因,英偉達亞太區開發者發展總監李銘指出,我們在Jetson平臺上一直致力于打造一套相對來說上手容易、而且功能豐富的SDK,也就是JetPack。
JetPack版本已經從當初的JetPack 1.0到了現在的4.4版本,現在最新推出的4.4.1版本可以支持TS1、TS2、Nano等。
“Jetson的理念就是給大家一個非常合適、各種工具齊備的平臺。Jetson的算力選擇也非常豐富,這樣在產品化落地階段中,各個階段都可以幫到大家。”李銘表示。
英偉達在今年下半年推出的新品是Jetson Nano 2GB,把之前Nano產品向更加入門的方向又推進一步,適用于學生、教育工作者和機器人愛好者。其接口非常豐富,常規的USB、HDMI接口都有,且算力充沛,共有0.5T算力。
據悉,Jetson Nano 2GB 開發者套件由英偉達 JetPack SDK提供支持,英偉達JetPack SDK隨附英偉達容器運行時及完整的Linux軟件開發環境。因此,開發者可以將他們的 Jetson應用程序及其所有依賴項打包到一個可以在任何部署環境下運作的容器中。它還由 英偉達CUDA-X加速計算堆棧提供支持。
標簽: 英偉達