본 안내서는 테슬라 퍼스널 수퍼컴퓨터의 구축을 돕기 위한 것으로, 시스템/워크스테이션 구축 경험이 있습니다면 자신만의 시스템을 직접 구축하고 싶어할 수도 있습니다. 그렇지 않다면, 가장 손쉬운 방법은 다음의판매대행 업체들중 하나로부터 테슬라 퍼스널 수퍼컴퓨터의 완성품을 직접 구매하는 것입니다.
시스템 구축이 대개 그렇듯이 본인의 책임과 리스크가 따릅니다. 이러한 시스템을 구축할 때 선택할 수 있는 구성요소들은 다양합니다. 엔비디아는 일반적 안내는 제공하지만, 컴포넌트들의 모든 컨피규레이션 및 결합을 테스트할 수는 없습니다.
개인용 슈퍼컴퓨터를 구축하는 데에 있어 일반 사용자용 제품보다 Tesla가 더욱 우수한 이유에 대해 많은 질문을 받고 있습니다. 자세한 내용은 여기를 클릭하십시오.
주요 컴포넌트의 최소 사양
최소 사양은 해당 시스템을 “Tesla 개인용 슈퍼컴퓨터”로 만들고자 하는 사람들을 위한 것입니다. 더 낮은 사양의 Tesla GPU로 워크스테이션을 구성하는 것도 가능합니다.
- 3x 테슬라 C1060
- Quad-core CPU: 2.33 GHz (Intel or AMD)
- 12 GB 시스템 메모리 (Tesla C1060당 4GB의 시스템 메모리 필요)
- Linux 64-bit or Windows XP 64-bit
- 시스템 어쿠스틱 < 45 dBA
- 1200 W 전원 공급
완전한 4 테슬라 C1060 시스템 컨피규레이션의 예
이 목록은 4x Tesla C1060 PSC를 구성하기 위해 필요한 구성요소입니다. 메모리와 CPU, 파워 서플라이, 케이스 등과 같은 이러한 구성요소들은 유사하거나 적합한 수준의 제품으로 대체할 수 있습니다. NVIDIA는 PSC와 관련한 어떠한 구성요소에 대해서도 인증하지 않으며, 시스템에 대한 책임은 전적으로 제조 업체에 있습니다.
4 테슬라 C1060 컨피규레이션
| |
| Tyan S7025 |
| 4x PCI-e x16 Gen2 슬롯 |
| 4x 테슬라 C1060 |
| 온보드 그래픽(Linux에서 작동, Windows에는 PCI-e 슬롯 하나에 NVIDIA GPU 필요) |
| 듀얼 소켓 Intel Xeon Nehalem |
| 24GB (6x4GB) DDR3 DIMM (마더보드 최대 용량 64GB) |
| 쿨맥스 CUQ-1350B 1350W |
| Lian Li PC-P80 |
| 640 GB |
| DVD 버너 |
| Intel Xeon 페놈용 |
사전 구성된 SuperMicro SuperServer 7046GT-TRF
4GPU 시스템, 듀얼 소켓 Nehalem, 최대 96GB 메모리
3 테슬라 C1060 컨피규레이션
| |
| 4x PCI-e x16 Gen2 슬롯 |
4x PCI-e x8 Gen2 슬롯 |
| ASUS P6T7 WS SuperComputer |
AsRock X58 SuperComputera |
| 3x 테슬라 C1060 |
3x 테슬라 C1060s |
| 1x 쿼드로 FX 또는 NVS |
1x 쿼드로 FX 또는 NVS (단일 슬롯) |
| Intel Xeon E55xx / Core i7 |
Intel Core i7 |
| 24 GB DDR3 |
24 GB DDR3 |
| 1200W |
1200W |
| -- |
슬롯 0: 테슬라 C1060 슬롯 1: 테슬라 C1060 슬롯 2: 쿼드로 NVS 또는 FX (단일 슬롯) 슬롯 3: 테슬라 C1060 |
마더보드
테슬라 C1060 컴퓨팅 프로세서는 듀얼 와이드 PCI-e x16 Gen2 보드입니다. Gen 1 PCI-e x16 슬롯에서도 사용이 가능하지만, 그렇게 되면 CPU와 GPU간의 시스템 대역폭이 낮아지며 애플리케이션 성능에 영향을 미칠 수도 있습니다 (애플리케이션에 따라 다를 수 있음).
따라서 듀얼 슬롯만큼 서로 떨어져 있는 3 또는 4 PCI-e x16 슬롯의 마더보드를 이용해야 합니다.
CPUs
CPU의 선택은 사용하는 마더보드에 따라 결정됩니다. 엔비디아는 적어도 다음과 같은 2.33 GHz 쿼드-코어 CPU를 사용할 것을 권장합니다:
- Intel Xeon 또는 Core i7 quad-core
- AMD 페놈 또는 옵테론 쿼드-코어
시스템 메모리
각 Tesla C2050에는 4GB의 GPU 메모리가 탑재되어 있기 때문에 Tesla C2050당 4GB의 시스템 메모리를 권장하며 최소 사양은 3GB입니다. 따라서, 3x Tesla C2050 시스템의 경우 최소 12GB의 시스템 메모리로 구성되고 4x Tesla C2050 시스템의 경우 최소 16GB의 시스템 메모리로 구성됩니다.
전원공급장치
파워 서플라이를 선택할 수 있습니다. 최소 정격 용량이 1350W인 파워 서플라이를 선택하십시오. Coolmax CUQ-1350B 1350W 파워 서플라이는 그 좋은 예시가 될 것입니다. 각 Tesla C2050에 하나의 6-핀 및 8-핀을 권장하지만 Coolmax CUQ-1350B와 같은 일부 파워 서플라이는 두 개의 6-핀 전원 커넥터로 충분한 로드를 제공합니다. 파워 서플라이를 선택할 때에는 사양의 내용들을 정확하게 이해하는 것이 매우 중요합니다.
하드드라이브, DVD 또는 기타 컴포넌트
하드드라이브나 DVD 드라이브는 사용자가 선택하기에 달려있습니다. 보편적으로 160GB이상의 하드웨어 용량이 가장 적합합니다.
컴퓨터 케이스 및 샤시
4개의 테슬라 C1060 보드를 플러그인 할 때, 8 슬롯을 가진 케이스가 (일반 ATX 케이스보다 큰 사이즈임) 필요하듯이, 케이스와 샤시의 선택은 중요합니다.
시중에 나와있는 8개 이상 슬롯의 완성품 케이스는 다음과 같다
- ABS Canyon 695
- Ashinne ASR405
- Chenbro RM41300G
- Lian-Li PC-P80
- ThermalTake ArmorPlus
4개의 듀얼 와이드 GPU 보드를 수용하기 위해 7-슬롯 샤시에 8번째 슬롯을 자르는 것도 가능할 수 있으나, 이러한 시도는 사용자가 리스크를 감수해야 됩니다!
시스템 냉각
Lian-Li를 포함한 몇 가지 시스템 케이스들은 전용 시스템 팬과 함께 제공됩니다. 일반적으로 적어도 하나의 케이스 팬을 설치하여 테슬라 보드 한 면에 냉각효과를 줄 수 있도록 할 것(i.e. 마더보드에 직접 공기를 제공하는 것 등)을 권장합니다. 중요한 것은 케이스 내 기온을 45C 미만으로 유지하는 것입니다.
구동 시스템
이러한 고메모리, 고성능 시스템이 최상으로 구동하기 위해서는 리눅스 64-비트 또는 윈도우 XP 64-비트를 권장합니다.Windows 7을 사용하는 경우라면 최고의 CUDA 성능을 지원하는 TCC 드라이버를 권장합니다. TCC 드라이버는 Tesla 제품 전용입니다. 최신 TCC 드라이버는
nvidia.co.kr의 일반 드라이버 다운로드 페이지에서 찾을 수 있으며, 이전 TCC 드라이버를 다운로드 하고자 한다면:
http://www.nvidia.co.kr/object/tesla-win7-64bit-259.03-whql-driver-kr.html.을 방문하십시오. TCC 드라이버에서 지원되지 않는 내용에 관한 릴리스 요약 정보를 읽어보시기 바랍니다.
시스템 검증
시스템을 조립하고 오퍼레이팅 시스템을 설치하고 나면, CUDA 드라이버, CUDA 툴킷 그리고 옵션으로 CUDA SDK의 예제를
CUDA Zone에서 다운로드 받으십시오.
CUDA 드라이버, CUDA 툴킷 그리고 CUDA SDK 예제를 다운로드 받은 후에는 CUDA SDK에서 다음과 같이 실행하십시오:
- deviceQuery
- 이것은 시스템 내 테슬라 GPU의 개수를 나타냅니다
- bandwidthTest --memory=pinned --device=N
- 시스템 내 4 C1060에서 N=0, 1, 2, 3일 때 각각의 C1060을 실행하십시오.
- 이는 CPU 그리고 각각의 GPU간의 PCI-E 대역폭을 나타냅니다.
- 피크 PCI-E x16 Gen2 대역폭은 5 와 6 GBytes/sec 사이입니다. PCI-E x16 Gen1 과 PCI-E x8 Gen2 의 대역폭은 그 절반 정도 됩니다.
- nbody --benchmark --n=131072 --device=N
- 시스템 내 테슬라 GPU 가 있는 수만큼 인스턴스 (instance)를 동시 구동하십시오
- 즉 4개의 테슬라 C1060에서는 N=0,1,2,3 에 따라 4 인스턴스를 동시 구동합니다
- 이에 따라 모든 테슬라 GPU 상에서 nbody 프로그램이 구동됩니다
설치 장치의 안정성을 검사할 뿐 아니라
DGEMM burn-in 테스트를 이용하십시오.
문제 및 기타 문의사항
엔비디아는 개별적으로 테슬라 퍼스널 컴퓨터를 구축하는 개인들에게 직접적인 지원은 제공하지 않습니다. 하지만CUDA forums 을 통해 다른 CUDA 개발자들과 시스템 구축 관련 경험 및 질문들을 공유할 수 있습니다.
테슬라 C1060에 대한 보다 자세한 정보를 확인하십시오
본인의 테슬라 퍼스널 수퍼컴퓨터의 사진을 송부 하면 PSC 갤러리에 게시됩니다.