NVIDIA DGX A100 là hệ thống phổ thông cho tất cả các AI workload, cung cấp mật độ tính toán, hiệu suất và tính linh hoạt chưa từng có trong hệ thống AI 5 petaFLOPS đầu tiên trên thế giới. NVIDIA DGX A100 có bộ tăng tốc tiền tiến nhất thế giới, đó là GPU NVIDIA A100 Tensor Core dựa trên kiến trúc Ampere, cho phép các đơn vị hợp nhất Training, Inference và Analytics thành một cơ sở hạ tầng AI thống nhất, dễ triển khai, bao gồm quyền truy cập trực tiếp vào cộng đồng các chuyên gia AI của NVIDIA
Những ưu điểm của hệ thống DGX A100
DGX A100 mang lại những ưu điểm trên 04 building-block cần yếu của một trung tâm dữ liệu AI.
Hệ thống phổ quát cho mọi AI workload
NVIDIA DGX A100 là hệ thống phổ thông cho tất cả các cơ sở hạ tầng AI, từ phân tách (analytics), đào tạo (training) đến suy luận (inference). Nó đóng gói mật độ cao các compute với hiệu suất xử lý AI lên đến 5 petaFLOPS trong một khung máy 6U, thay thế một tháp cơ sở hạ tầng chỉ bằng một nền tảng cho mọi AI workload.
DGXperts: Tích hợp quyền truy vấn cập vào cộng đồng chuyên nghiệp AI
NVIDIA DGXperts là một nhóm toàn cầu gồm hơn 14.000 chuyên gia và lập trình viên thông hiểu AI, những người đã có nhiều kinh nghiệm trong thập kỷ qua để giúp bạn tối đa hóa giá trị của khoản đầu tư cho hệ thống DGX của mình.
thời kì nhanh nhất để giải quyết bài toán và dự án AI của bạn
DGX A100 là hệ thống AI trước nhất trên thế giới được xây dựng trên GPU NVIDIA A100 Tensor Core. Tích hợp 8 GPU A100, hệ thống cung cấp khả năng tăng tốc chưa từng có và được tối ưu hóa hoàn toàn cho phần mềm NVIDIA CUDA-X™ và các lớp biện pháp end-to-end cho trung tâm dữ liệu NVIDIA.
Khả năng mở rộng cho trọng tâm dữ liệu chưa từng có
mở mang trọng điểm dữ liệu AI khi dữ liệu và bài toán bùng nổ là một đề xuất không tránh khỏi. NVIDIA DGX A100 tích hợp Mellanox ConnectX-6 VPI HDR InfiniBand/Ethernet network adapters với 450GB/s băng thông hai chiều cao nhất. Đây là một trong nhiều tính năng giúp DGX A100 trở thành khối xây dựng nền tảng cho các cụm AI lớn như NVIDIA DGX SuperPOD – môt bản thiết kế Enterpise cho cơ sở hạ tầng AI có thể mở mang.
>>> Xem thêm: r550 dell
Một số so sánh về đổi thay hiệu năng xử lý
phân tách
PageRank – phân tích nhanh hơn tức thị nắm bắt sâu sắc đẹp hơn để đẩy mạnh phát triển AI.
Máy chủ 3000x CPU so với 4x DGX A100. Tập dữ liệu thu thập chung đã được xuất bản: 128 tỷ edges, 2.6TB dữ liệu graph.
tập huấn
NLP: BERT-Large – đào tạo nhanh hơn cho phép khai triển các mô hình AI tiền tiến nhất.
BERT Pre-Training Throughput sử dụng PyTorch bao gồm (2/3) giai đoạn 1 và (1/3) giai đoạn 2. Giai đoạn 1 Seq Len = 128, giai đoạn 2 Seq Len = 512. V100: DGX-1 với 8x V100 sử dụng độ xác thực FP32. DGX A100: DGX A100 với 8x A100 sử dụng độ chuẩn xác TF32.
Suy luận
Peak Compute – Suy luận nhanh hơn làm tăng ROI phê duyệt việc sử dụng hệ thống tối đa.
Máy chủ CPU: 2x Intel Platinum 8280 sử dụng INT8. DGX A100: DGX A100 với 8x A100 sử dụng INT8 với Structural Sparsity.
KHÁM PHÁ CÁC THÀNH PHẦN MẠNH MẼ CỦA DGX A100
GPU NVIDIA A100 8 x VỚI TỔNG BỘ NHỚ GPU 320GB, 12 NVLinks / GPU, Bi-directional Bandwidth GPU-to-GPU 600 GB/s
6X NVIDIA NVSWITCH 4,8 TB/s
4.8 TB/s Bi-directional Bandwidth, gấp 2 lần NVSwitch thế hệ trước
9x MELLANOX CONNECTX-6 Giao diện MẠNG 200Gb/s MẠNG 450 GB/s
450 GB/s Peak Bi-directional Bandwidth
2x 64-CORE AMD CPU, 1TB SYSTEM MEMORY
Gấp 3.2 lần số core, để chạy cho hồ hết các job AI nặng vật nài nhất
15TB GEN4 NVME SSD
25GB/s Peak Bandwidth, nhanh hơn 2x so với NVME SSD Gen3
Công nghệ bên trong NVidia DGX A100
NVIDIA A100 – Tensor Core GPU
GPU NVIDIA A100 Tensor Core mang đến khả năng tăng tốc chưa từng có cho AI, phân tích dữ liệu và tính toán hiệu năng cao (HPC) để giải quyết các thách thức điện toán khó khăn nhất của thế giới. Với NVIDIA Tensor Cores thế hệ thứ ba mang lại hiệu suất vượt trội, GPU A100 có thể mở mang hiệu quả lên đến hàng nghìn hoặc, với Multi-Instance GPU, được phân chia thành 7x GPU nhỏ hơn, chuyên dụng để tăng tốc cho các workload ở mọi kích thước
Multi-Instance GPU (MIG)
Với MIG, tám GPU A100 trong DGX A100 có thể được cấu hình thành tối đa 56 phiên bản GPU, mỗi GPU được cách ly hoàn toàn với bộ nhớ băng thông cao, bộ nhớ cache và lõi tính toán. Điều này cho phép quản trị viên GPU kích thước ăn nhập với chất lượng dịch vụ (QoS) được đảm bảo cho nhiều khối lượng công tác.
NVLink thế hệ tiếp theo và NVSwitch
Thế hệ thứ ba của NVIDIA ® NVLink ™ trong DGX A100 tăng gấp đôi băng thông trực tiếp từ GPU đến GPU lên 600 gigabyte mỗi giây (GB / s), cao hơn gần 10 lần so với PCIe Gen4. DGX A100 cũng có NVIDIA NVSwitch ™ thế hệ tiếp theo, nhanh gấp 2 lần so với thế hệ trước.
Mellanox ConnectX-6 VPI HDR InfiniBand
DGX A100 có bộ điều hợp Mellanox ConnectX-6 VPI HDR InfiniBand / Ethernet mới nhất, mỗi bộ chạy với tốc độ 200 gigabit mỗi giây (Gb / s) để tạo ra một loại vải tốc độ cao cho khối lượng công việc AI quy mô lớn.
Tối ưu hóa software stack
DGX A100 tích hợp ngăn xếp phần mềm DGX đã được thí nghiệm và tối ưu hóa, bao gồm hệ điều hành cơ sở được điều chỉnh bằng AI, tất cả phần mềm hệ thống cấp thiết và các áp dụng được tăng tốc GPU, các mô hình được huấn luyện trước và hơn thế nữa từ NGC ™ .
>>> Xem thêm: dell R650xs
© Copyright 2011-2013 iSoftco®, All rights reserved Văn phòng công ty: P.16/706, Tòa nhà Thành Công, 57 Láng Hạ, phường Thành Công, quận Ba Đình, Hà Nội Tel: (84-4) 37 875018;(84-4) 3555 8604 | Fax: (84-4) 37 875017 | E-Mail: cho24h@isoftco.com |