CSYS-GPU-6700
กลุ่มวินแคนโว
ประสิทธิภาพสูง (คอร์ i/อัลตร้า)
1x DDR5 SO-DIMM, ออนบอร์ด LPDDR5
| มีจำหน่าย: | |
|---|---|
| ปริมาณ: | |
CSYS-GPU-6700 เป็นระบบคอมพิวเตอร์ PCIe GPU แบบติดตั้งบนแร็คความหนาแน่นสูงขนาด 2U ที่พัฒนาและจัดหาโดย Vincanwo Group โดยอิสระ ซึ่งสร้างขึ้นบนสถาปัตยกรรมฮาร์ดแวร์เซิร์ฟเวอร์ระดับองค์กรของ Intel และได้รับการปรับแต่งอย่างเต็มที่เพื่อรองรับ NVIDIA H200 Tensor Core GPU ตำแหน่งสำหรับปริมาณงานการประมวลผลแบบขนานที่มีประสิทธิภาพสูง เซิร์ฟเวอร์ GPU ในตัวนี้สร้างความสมดุลระหว่างการใช้พื้นที่แร็ค การกระจายความร้อน ความสามารถในการขยาย และประสิทธิภาพที่ยั่งยืน โดยกำหนดเป้าหมายไปที่การฝึกอบรม AI ระดับองค์กร การอนุมานโมเดลภาษาขนาดใหญ่ (LLM) การจำลองทางวิทยาศาสตร์ ไดนามิกของไหลในการคำนวณที่มีความแม่นยำสูง (CFD) การวิเคราะห์ข้อมูลขนาดใหญ่ และสถานการณ์การประมวลผลคู่แบบดิจิทัล
การใช้ฟอร์มแฟคเตอร์แชสซีแร็ค 2U มาตรฐานที่สอดคล้องกับข้อกำหนดตู้ศูนย์ข้อมูลสากล ระบบใช้ประโยชน์จากมาเธอร์บอร์ดเซิร์ฟเวอร์ ระบบย่อยการจ่ายพลังงาน และระบบนิเวศเฟิร์มแวร์แพลตฟอร์มที่ผ่านการตรวจสอบแล้วของ Intel ช่วยขจัดความเสี่ยงด้านความเข้ากันได้ระหว่างฮาร์ดแวร์โฮสต์ x86 และตัวเร่งความเร็ว NVIDIA H200 ในขณะที่มอบความน่าเชื่อถือในการดำเนินงานระยะยาวสำหรับการดำเนินงานศูนย์ข้อมูลแบบไม่หยุดยั้งตลอด 24 ชั่วโมงทุกวัน
แพลตฟอร์มการประมวลผลทั้งหมดใช้มาเธอร์บอร์ดเซิร์ฟเวอร์ x86 ระดับองค์กรของ Intel พร้อมด้วยโปรเซสเซอร์ Intel Xeon ที่ปรับขนาดได้แบบซ็อกเก็ตคู่เป็นคอร์ประมวลผลส่วนกลาง เมนบอร์ดมีช่องทางขยายความเร็วสูง PCIe 5.0 เต็มรูปแบบ ซึ่งสนับสนุนโดย CPU Intel Xeon ซึ่งตรงกับความต้องการแบนด์วิธเต็มรูปแบบของ GPU รุ่น NVIDIA H200 PCIe เพื่อหลีกเลี่ยงปัญหาคอขวด I/O ระหว่างหน่วยความจำ CPU โฮสต์และหน่วยความจำแบนด์วิธสูง GPU (HBM3e)
ฮับตัวควบคุมแพลตฟอร์ม Intel แบบรวม (PCH) ให้การส่งสัญญาณที่เสถียร ฟังก์ชันการจัดการระยะไกลระดับองค์กร (มาตรฐาน Intel AMT/IPMI 2.0) การตรวจสอบข้อผิดพลาดของฮาร์ดแวร์ และการบำรุงรักษาระยะไกลนอกย่านความถี่ ช่วยให้ผู้ปฏิบัติงานศูนย์ข้อมูลสามารถควบคุมพลังงาน วินิจฉัยฮาร์ดแวร์ และติดตั้งระบบใหม่โดยไม่ต้องเข้าถึงนอกสถานที่
มาเธอร์บอร์ดเซิร์ฟเวอร์ได้รับการสนับสนุนโดยเทคโนโลยีตัวควบคุมหน่วยความจำของ Intel รองรับโมดูลหน่วยความจำเซิร์ฟเวอร์ที่ลงทะเบียน DDR5 ECC ความจุสูง พร้อมการแก้ไขข้อผิดพลาดและฟังก์ชันการมิเรอร์หน่วยความจำเพื่อป้องกันการหยุดชะงักของการประมวลผลที่เกิดจากข้อผิดพลาดของหน่วยความจำบิตเดียวในระหว่างงานฝึกอบรม AI ระยะยาว
ช่องใส่ไดรฟ์ NVMe U.2/SFF แบบ hot-swappable หลายตัวได้รับการกำหนดค่าไว้ที่แผงด้านหน้า เชื่อมต่อผ่านช่องทางการจัดเก็บข้อมูล Intel-native PCIe 4.0 รองรับการจัดเก็บข้อมูลชุดข้อมูลภายในความเร็วสูงพิเศษและการโหลดโมเดลที่มีความหน่วงต่ำ คอนโทรลเลอร์ Intel RAID เสริมมีไว้เพื่อสร้างอาร์เรย์จัดเก็บข้อมูลสำรองสำหรับโมเดลที่สำคัญและการสำรองข้อมูลการฝึกอบรม
โมดูลพาวเวอร์ซัพพลายและเฟรมเวิร์กโซลูชั่นระบายความร้อนทั้งหมดผ่านการรับรองความเข้ากันได้ของแพลตฟอร์ม Intel แชสซีนี้รวมอุปกรณ์จ่ายไฟแบบ hot-swappable ระดับแพลตตินัมสำรองที่มีประสิทธิภาพสูง เพื่อลดความเสี่ยงด้านไฟฟ้าขัดข้องจุดเดียว ตรรกะการจัดการพลังงานอัจฉริยะจาก Intel ปรับเอาต์พุตพลังงานแบบไดนามิกตามโหลดของ CPU และ GPU เพื่อลดการใช้พลังงานที่ไม่ได้ใช้งานและลด OPEX ของศูนย์ข้อมูล
กรอบการระบายความร้อนด้วยอากาศ 2U ได้รับการเสริมโครงสร้างเพื่อให้เหมาะสมกับข้อกำหนดการกระจายความร้อนของ GPU NVIDIA H200 กำลังสูงหลายตัว ด้วยการออกแบบท่ออากาศบังคับจากด้านหน้าไปด้านหลังที่ได้รับการปรับให้เหมาะสมโดยเครื่องมือจำลองความร้อนของ Intel เพื่อรักษาการไหลเวียนของอากาศที่สม่ำเสมอทั่วทั้งการ์ดเร่งความเร็วทั้งหมด และหลีกเลี่ยงความร้อนสูงเกินไปเฉพาะที่ภายใต้ภาระของ GPU ที่ต่อเนื่องเต็มที่
ระบบ CSYS-GPU-6700 ได้รับการออกแบบทางวิศวกรรมให้เป็นโหนด PCIe GPU เฉพาะสำหรับตัวเร่งความเร็ว NVIDIA H200 (ฟอร์มแฟคเตอร์ PCIe ไม่ใช่ตัวแปร SXM) พร้อมเค้าโครงสล็อต GPU หลายตัวที่กำหนดค่าได้ซึ่งปรับแต่งให้เหมาะกับการประมวลผลแบบขนานขนาดใหญ่:
NVIDIA H200 PCIe GPU แต่ละตัวมาพร้อมกับหน่วยความจำแบนด์วิดธ์สูง HBM3e สูงสุด 141GB ให้ปริมาณงานหน่วยความจำที่สูงมากเพื่อรองรับโมเดลพื้นฐานขนาดใหญ่พิเศษ โดยไม่ต้องออฟโหลดไปยัง RAM ระบบบ่อยครั้งหรือที่จัดเก็บข้อมูลภายนอกที่ช้า
ขับเคลื่อนโดยสถาปัตยกรรม GPU NVIDIA Blackwell พร้อม Tensor Core ขั้นสูงที่รองรับการประมวลผลแบบผสมความแม่นยำ FP4, FP8, FP16, BF16 และ FP32, การฝึกอบรม LLM ที่เร่งขึ้นอย่างมาก, การอนุมาน AI เชิงสร้างสรรค์, การประมวลผลแบบจำลองหลายรูปแบบและการจำลองเชิงตัวเลขทางวิทยาศาสตร์
เข้ากันได้อย่างสมบูรณ์กับสแต็กซอฟต์แวร์ NVIDIA CUDA, cuDNN, TensorRT, NeMo และ NVIDIA AI Enterprise; แพลตฟอร์มโฮสต์ของ Intel ช่วยให้มั่นใจได้ถึงการผสานรวมไดรเวอร์ คอนเทนเนอร์ และเครื่องมือจัดระเบียบสำหรับ Kubernetes, Slurm และเฟรมเวิร์กการกำหนดเวลาคลัสเตอร์อื่น ๆ ได้อย่างราบรื่น
สล็อต PCIe 5.0 x16 แบบเต็มความกว้างให้ปริมาณการรับส่งข้อมูลแบบสองทิศทางที่ไม่มีการจำกัดระหว่าง H200 GPU แต่ละตัวและ CPU โฮสต์ Intel Xeon ช่วยขจัดปัญหาคอขวดในการถ่ายโอนข้อมูลซึ่งพบได้ทั่วไปในเซิร์ฟเวอร์ PCIe 4.0 GPU รุ่นเก่า
ฟอร์มแฟกเตอร์: ตัวยึดชั้นวาง 2U, รองรับโครงยึดตู้ศูนย์ข้อมูลขนาด 19 นิ้วมาตรฐาน;
ขนาด: การออกแบบความสูง 2U ที่เป็นมาตรฐานอุตสาหกรรมเพื่อเพิ่มความหนาแน่นของแร็คให้สูงสุด โดยสามารถติดตั้งโหนดประมวลผลได้มากขึ้นต่อแร็ค เมื่อเทียบกับเซิร์ฟเวอร์ GPU ขนาดใหญ่ 4U/5U ซึ่งช่วยลดต้นทุนโดยรวมของศูนย์ข้อมูลและต้นทุนการจัดซื้อตู้
เค้าโครงการขยาย: เค้าโครงพื้นที่ภายในที่ได้รับการปรับปรุงโดย Vincanwo Group พร้อมขายึดการ์ด PCIe ที่เสริมความแข็งแรง เพื่อรักษาเสถียรภาพของตัวเร่ง NVIDIA H200 ที่มีน้ำหนักมากในระหว่างการสั่นสะเทือนของตู้หรือการขนส่ง
อินเทอร์เฟซที่แผงด้านหน้า: ช่องเก็บข้อมูลแบบถอดเปลี่ยนได้, ไฟ LED แสดงสถานะสำหรับ CPU, หน่วยความจำ, GPU, ความผิดปกติของแหล่งจ่ายไฟและพัดลม, สวิตช์เปิด/ปิดเครื่อง และพอร์ตวินิจฉัย USB
อินเทอร์เฟซที่แผงด้านหลัง: พอร์ตอีเธอร์เน็ตการจัดการระยะไกล IPMI, พอร์ตไฟฟ้าออปติกเครือข่ายความเร็วสูง 10G/25G หลายพอร์ต (รองรับผ่านอะแดปเตอร์เครือข่าย Intel PCIe), โมดูลจ่ายไฟสำรอง, แผ่นกั้นด้านหลังช่องขยายสำหรับระบายความร้อน
การฝึกอบรมและการอนุมานแบบจำลองภาษาขนาดใหญ่ (LLM)
การรวมกันของการประมวลผลโฮสต์ Intel dual Xeon และหน่วยความจำ NVIDIA H200 HBM3e หลายตัวช่วยลดขีดจำกัดความจุของหน่วยความจำสำหรับโมเดลพื้นฐานล้านล้านพารามิเตอร์ รองรับทั้งการฝึกอบรมแบบออฟไลน์เต็มรูปแบบและการปรับใช้เหตุผลแบบออนไลน์ที่มีเวลาแฝงต่ำ
คอมพิวเตอร์ AI ที่สร้างหลายรูปแบบ
เหมาะสำหรับการฝึกโมเดลข้อความ รูปภาพ ข้อความ-วิดีโอ การสร้างเสียง และปริมาณงานการอนุมานแบบกลุ่ม โดยใช้ประโยชน์จากการเร่งความเร็วแบบผสมที่มีความแม่นยำของ Blackwell Tensor Core เพื่อลดระยะเวลารอบงาน
คอมพิวเตอร์ทางวิทยาศาสตร์ประสิทธิภาพสูง
การจำลองทางอากาศพลศาสตร์ พลศาสตร์ของโมเลกุล การสร้างภาพทางการแพทย์ขึ้นมาใหม่ การพยากรณ์อากาศ และการสร้างแบบจำลองทางธรณีฟิสิกส์—การประมวลผลแบบขนานที่ปรับขนาดได้ผ่าน CPU แบบมัลติคอร์ของ Intel และ GPU H200 แบบคลัสเตอร์
ข้อมูลขนาดใหญ่ระดับองค์กรและ Digital Twin
การเรนเดอร์คู่ดิจิทัลเชิงอุตสาหกรรมแบบเรียลไทม์ การสร้างแบบจำลองเชิงปริมาณความเสี่ยงทางการเงิน การทำเหมืองข้อมูลพฤติกรรมผู้ใช้ขนาดใหญ่ด้วยฐานข้อมูลที่เร่งด้วย GPU และการประมวลผล Data Lake
โหนดบริการคลาวด์ AI
สามารถนำไปใช้เป็นโหนดการประมวลผล GPU แบบ Bare Metal มาตรฐานสำหรับคลาวด์ AI สาธารณะ/ส่วนตัว พร้อมการจัดการระยะไกล Intel IPMI ช่วยลดความซับซ้อนในการกำหนดเวลาทรัพยากรบนคลาวด์และการแยกฮาร์ดแวร์ของผู้เช่า
ความเข้ากันได้ของระบบนิเวศคู่ที่ได้รับการยืนยัน
แพลตฟอร์มร่วมที่ได้รับการตรวจสอบอย่างครบถ้วนของฮาร์ดแวร์เซิร์ฟเวอร์องค์กรของ Intel และ GPU NVIDIA H200 PCIe ซึ่งช่วยขจัดปัญหาความไม่เข้ากันของฮาร์ดแวร์ของบริษัทอื่นซึ่งพบได้ทั่วไปในเวิร์กสเตชัน GPU ที่ประกอบขึ้นเอง
การออกแบบประหยัดพื้นที่ 2U ความหนาแน่นสูง
ต่างจากเซิร์ฟเวอร์ GPU 4U ขนาดใหญ่ การออกแบบแร็ค 2U ขนาดกะทัดรัดช่วยเพิ่มความหนาแน่นในการปรับใช้แร็ค และลดพื้นที่ศูนย์ข้อมูล ค่าใช้จ่ายในการทำความเย็น และพลังงาน
ความเสถียรระดับอุตสาหกรรมตลอด 24 ชั่วโมงทุกวัน
แหล่งจ่ายไฟสำรอง, หน่วยความจำการแก้ไขข้อผิดพลาด ECC, การควบคุมพัดลมระบายความร้อนอัจฉริยะ และระบบแจ้งเตือนข้อผิดพลาดของฮาร์ดแวร์ ตอบสนองความต้องการการทำงานอย่างต่อเนื่องสำหรับสภาพแวดล้อมการผลิตของศูนย์ข้อมูล
ความยืดหยุ่นในการกำหนดค่าที่ปรับแต่งได้
Vincanwo Group รองรับการปรับเปลี่ยนการกำหนดค่าส่วนบุคคลของลูกค้า: รุ่น CPU Xeon ที่ปรับแต่งได้, ความจุหน่วยความจำ DDR5, ปริมาณพื้นที่จัดเก็บ NVMe, จำนวน GPU NVIDIA H200 ที่ปรับใช้ และอะแดปเตอร์เครือข่ายความเร็วสูงเสริม
อุปทานแบบครบวงจรและบริการหลังการขาย
ในฐานะผู้พัฒนาผลิตภัณฑ์และซัพพลายเออร์ Vincanwo Group ให้บริการจัดส่งระบบเซิร์ฟเวอร์ Intel ที่สมบูรณ์แบบที่ติดตั้งไว้ล่วงหน้าด้วย NVIDIA H200 GPU พร้อมด้วยการรับประกันฮาร์ดแวร์แบบรวม การดีบักทางเทคนิค คำแนะนำในการปรับใช้คลัสเตอร์ และการสนับสนุนทางเทคนิคหลังการขาย
CSYS-GPU-6700 2U PCIe GPU System โดย Vincanwo Group เป็นโหนดการประมวลผลประสิทธิภาพสูงที่สร้างขึ้นตามวัตถุประสงค์ที่สร้างขึ้นบนแพลตฟอร์มเซิร์ฟเวอร์องค์กรที่เติบโตเต็มที่ของ Intel ซึ่งได้รับการปรับให้เหมาะสมเป็นพิเศษเพื่อใช้งาน NVIDIA H200 PCIe Tensor Core GPU โดยผสานรวมการประมวลผลโฮสต์ x86 ที่แข็งแกร่ง ความจุหน่วยความจำ GPU HBM ขนาดใหญ่พิเศษ การเชื่อมต่อ PCIe 5.0 ความเร็วสูง และความหนาแน่นของแร็คขนาดกะทัดรัด มอบโซลูชันฮาร์ดแวร์ที่เชื่อถือได้ ปรับขนาดได้ และคุ้มค่าสำหรับปัญญาประดิษฐ์ระดับองค์กร คอมพิวเตอร์ทางวิทยาศาสตร์ประสิทธิภาพสูง และปริมาณงานบริการ GPU บนคลาวด์
| ชื่อผลิตภัณฑ์และรุ่น | CSYS-GPU-6700 | |
| แชสซี | ฟอร์มแฟกเตอร์ | แร็คเมาท์ 2U |
| โปรเซสเซอร์ | ซีพียู | ซ็อกเก็ตเดี่ยว E2 (LGA-4710) โปรเซสเซอร์ Intel® Xeon® ซีรีส์ 6700/6500 พร้อม P-core |
| จำนวนคอร์ | สูงถึง 80C/160T; แคชสูงสุด 336MB | |
| บันทึก | รองรับซีพียู TDP สูงสุด 350W (ระบายความร้อนด้วยอากาศ) | |
| จีพียู | จำนวน GPU สูงสุด | GPU ความกว้างสองเท่าสูงสุด 4 ตัว |
| GPU ที่รองรับ | NVIDIA PCIe: H200 NVL (141GB), NVIDIA RTX PRO™ 6000 Blackwell Server Edition Intel: กราฟิก Arc™ Pro B70 |
|
| การเชื่อมต่อระหว่าง CPU-GPU | PCIe 5.0 x16 การเชื่อมต่อระหว่าง CPU กับ GPU | |
| การเชื่อมต่อระหว่าง GPU-GPU | สะพาน NVIDIA® NVLink™ (อุปกรณ์เสริม) | |
| หน่วยความจำระบบ | หน่วยความจำ | จำนวนสล็อต: สล็อต DIMM 16 ช่อง/8 ช่อง หน่วยความจำสูงสุด (1DPC): สูงถึง 1TB 6400MT/s ECC DDR5 RDIMM หน่วยความจำสูงสุด (1DPC): สูงถึง 512GB 8000MT/s ECC DDR5 MRDIMM หน่วยความจำสูงสุด (2DPC): สูงถึง 2TB 5200MT/s ECC DDR5 RDIMM |
| แรงดันหน่วยความจำ | 1.1V | |
| อินพุต / เอาท์พุต | แลน | 1 RJ45 1 GbE พอร์ต BMC LAN เฉพาะ |
| ยูเอสบี | 1 พอร์ต USB 3.0 Type-A (ด้านหลัง) | |
| วีดีโอ | 1 พอร์ตมินิ DP | |
| ไบออสของระบบ | ประเภทไบออส | AMI 64MB SPI แฟลช EEPROM |
| การจัดการ | การกำหนดค่าพลังงาน | โหมดเปิดเครื่องสำหรับการกู้คืนไฟ AC การจัดการพลังงาน ACPI |
| ความปลอดภัย | ฮาร์ดแวร์ | Trusted Platform Module (TPM) 2.0 Silicon Root of Trust (RoT) – เป็นไปตามมาตรฐาน NIST 800-193 |
| คุณสมบัติ | เฟิร์มแวร์ที่เซ็นชื่อแบบเข้ารหัส บูตอย่างปลอดภัย อัพเดตเฟิร์มแวร์ที่ปลอดภัย การกู้คืนเฟิร์มแวร์อัตโนมัติ ความปลอดภัยของห่วงโซ่อุปทาน: รันไทม์การรับรองระยะไกล การป้องกัน BMC การล็อคระบบ |
|
| การตรวจสอบสุขภาพพีซี | ซีพียู | ตัวควบคุมแรงดันไฟฟ้าแบบสลับเฟส 8+4 มอนิเตอร์ สำหรับแกน CPU, แรงดันไฟฟ้าของชิปเซ็ต, หน่วยความจำ |
| พัดลม | พัดลมที่มีการตรวจสอบมาตรวัด รอบ ขั้วต่อพัดลมแบบ Pulse Wide Modulated (PWM) การตรวจสอบสถานะสำหรับการควบคุมความเร็ว |
|
| อุณหภูมิ | การตรวจสอบสภาพแวดล้อม CPU และแชสซี การควบคุมความร้อนสำหรับขั้วต่อพัดลม |
|
| การรับรอง | ระบบปฏิบัติการ | ออราเคิลลินุกซ์ 9.6, RHEL 10.0, วินโดวส์เซิร์ฟเวอร์ 2022, วินโดวส์เซิร์ฟเวอร์ 2025 |
| ขนาดและน้ำหนัก | ขนาด | สูง:88มม. x กว้าง:438.4มม. x ลึก: 900มม |
| น้ำหนัก | น้ำหนักสุทธิ: 38 กก. น้ำหนักสุทธิ: 30 กก |
|
| สีที่มีจำหน่าย | ด้านหน้าสีดำและตัวเครื่องสีเงิน | |
| แผงด้านหน้า | ปุ่ม | ปุ่มเปิด/ปิด ปุ่มรีเซ็ตระบบ |
| นำ | LED แสดงการทำงานของฮาร์ดไดรฟ์ LED แสดงกิจกรรมเครือข่าย LED แสดงสถานะพลังงาน LED ระบบร้อนเกินไปและไฟดับ |
|
| สล็อตขยาย | การกำหนดค่า PCI Express (PCIe) | ค่าเริ่มต้น 4 สล็อต PCIe 5.0 x16 FHFL แบบความกว้างสองเท่า 3 สล็อต PCIe 5.0 x16 FHFL |
| ม.2 | 2 สล็อต M.2 PCIe 5.0 x2 NVMe (M-key 2280/22110) | |
| ช่องไดรฟ์ / ที่เก็บข้อมูล | การกำหนดค่าช่องใส่ไดรฟ์ | ค่าเริ่มต้น: รวม 4 ช่องใส่ ช่องใส่ไดรฟ์ E1.S NVMe แบบ Hot-swap ด้านหน้า 4 ช่อง |
| ม.2 | 2 สล็อต M.2 PCIe 5.0 x2 NVMe (M-key 2280/22110) | |
| ระบบระบายความร้อน | แฟนๆ | พัดลมสำหรับงานหนักสูงสุด 6x 6 ซม. พร้อมการควบคุมความเร็วพัดลมที่เหมาะสมที่สุด |
| ผ้าห่อศพอากาศ | 1 ผ้าห่อศพอากาศ | |
| พาวเวอร์ซัพพลาย | แหล่งจ่ายไฟ | 3x 2000W แหล่งจ่ายไฟซ้ำซ้อน (2 + 1) ระดับไทเทเนียม (96%) |
| ขนาด (กxสxส) | 73.5 x 40 x 185 มม | |
| สภาพแวดล้อมการดำเนินงาน | ข้อมูลจำเพาะด้านสิ่งแวดล้อม | อุณหภูมิในการทำงาน: 10°C ถึง 35°C อุณหภูมิขณะไม่ใช้งาน: -30°C ถึง 60°C ความชื้นสัมพัทธ์ในการทำงาน: 8% ถึง 80% (สูงสุด 21° DP; ไม่มีการควบแน่น) ความชื้นสัมพัทธ์ขณะไม่ใช้งาน: 8% ถึง 90% (สูงสุด 38° DP; ไม่ควบแน่น) |