NVIDIA Software
 

대규모 병렬 컴퓨팅 및 시각화 컴퓨팅
Visual Studio와 함께 NVIDIA® Parallel Nsight™를 사용하여 대규모 병렬 컴퓨팅용 GPU 어플리케이션을 그 어느 때보다 쉽게 개발할 수 있습니다. NVIDIA의 기본 GPU 디버깅 및 프로파일링 기능을 통해 Parallel Nsight에서 GPU 코드를 가장 효율적인 방법으로 디버깅 및 프로파일링 및 최적화할 수 있습니다. 게다가 Parallel Nsight는 멀티코어 CPU 사용률, 멀티 GPU 및 멀티 API 가속화를 극대화하기 위해 Analysis 트레이스 기능을 사용하는 어플리케이션을 이기종에서도 실행할 수 있습니다.

Multiple Cores 연구 개발 속도를 10배 이상 빠르게 작업하고 싶은 과학자, 고급 3D 그래픽 시각화 및 과학용 프로세싱을 위해 GPU를 사용하는 어플리케이션 개발자 또는 DirectX의 한계를 넘고 싶은 그래픽 개발자라면, Parallel Nsight를 통해 다른 어떤 개발 환경보다 효율적으로 원하는 목표를 달성할 수 있습니다.



CUDA 개발
Icon Parallel Nsight

GPU 컴퓨팅 개발용 NVIDIA Parallel Nsight
NVIDIA Parallel Nsight 소프트웨어는 전세계적으로 가장 많이 사용되는 개발 환경인 Microsoft Visual Studio와 통합 환경을 제공하는 업계 최초의 대규모 병렬 컴퓨팅용 개발 환경입니다. Parallel Nsight는 Microsoft Visual Studio에서 GPU 및 CPU를 모두 개발할 수 있는 강력한 툴입니다.

Parallel Nsight 2.1에서 *새로워진 점*
   - CUDA 4.1 지원.
   - 새로운 기능: 향상된 대규모 쓰레드 방식의 어플리케이션 디버깅 환경을 위한 CUDA Warp Watch 뷰 및 CUDA Info
     페이지
   - 좀 더 깊이 있는 커널 성능 분석을 위한 고급 CUDA Profiler 실험
   - 단일 시스템에서 CUDA 개발자가 Parallel Nsight의 전체 기능을 경험할 수 있는 Optimus 랩톱 지원

NVIDIA OPTIMUS

CUDA DEBUGGER CUDA 디버거
>  *새로운 기능* CUDA 정보(Info) 페이지에는 사용자
    어플리케이션에서의 CUDA 실행 상태에 대한 세부
    정보가 표시됩니다. 사용자는 예외, 어서션, 브레이크
    포인트, MMU 장애에 대한 세부 정보를 필터링하여
    찾을 수 있으며 문제를 디버깅할 특정 워프로 쉽게
    전환할 수 있습니다.
>  *새로운 기능* CUDA 워프 감시(Warp Watch)
    기능으로 보다 효율적으로 상주 쓰레드를 탐색하고
    워프에 대한 쓰레드 상태를 시각화할 수 있습니다.
>  *새로운 기능* 시스템 정보(System Information)
    페이지에서는 모니터와의 연결로 시스템 정보를
    사용할 수 있으며, 드라이버 모델, GPU 아키텍처,
    메모리 등과 같은 모든 CUDA 장치에 대한 세부
    정보를 볼 수 있습니다
>  *새로운 기능* CUDA 어서션 발생 시 GPU 동작
    중단합니다.
>  GPU 하드웨어에서 직접 CUDA C/C++ 및
    DirectCompute 커널 디버깅이 가능합니다
>  Visual Studio에서 익숙한 Locals, Watch, Memory
    및 Breakpoints 창을 활용하여 병렬로 실행 중인
    수천 개의 쓰레드 검사합니다.
>  Visual Studio의 표준 Memory 창에서 직접 GPU
    메모리 확인할 수 있습니다.
>  조건부 브레이크 포인트를 사용하여 대규모 병렬
    코드에서 빠르게 오류를 식별, 수정할 수 있습니다.
>  CUDA C/C++ 메모리 체커(Memory Checker)를
    사용하여 메모리 접근 위반 식별할 수 있습니다.
 
Analyzer

CUDA PROFILER AND APPLICATION TRACE

CUDA 프로파일러 및 어플리케이션 트레이스
>  *새로운 기능* CUDA 프로파일링 실험을 통해
    개발자들은 다음 요소로 발생하는 성능 문제를
    이해할 수 있습니다:

  • 쓰레드 디버전스 또는 코드 분기
  • 메모리 통계;
  • 지연 이유에 대한 통계
  • 명령 입력 효율성
  • 달성된 FLOPS


>  *새로운 기능* 이제 추적된 워크로드에서
    종속성 탐색 스택 호출이 가능하기 때문에
    개발자는 워크로드의 원인인 GPU 워크로드, 해당
    API 호출 및 호스트 코드 전체를 파악할 수 있습니다.
>  *새로운 기능* CUDA 트레이스에서는 메모리
    동시 트레이스
사본 및 메모리 세트에 대한 지원이
    추가됩니다.
>  *새로운 기능* 시스템 트레이스에서는 32bit 프로세스
    에서 시작된 64bit 프로세스의 데이터 캡처링 지원
    기능이 추가됩니다.
>  *새로운 기능* OpenCL 1.1 API 트레이스 지원.
>  *새로운 기능* NVTXDirect3D 성능 마커
    (Performance Marker)
보고서 페이지에서는 이제
    API 호출로 제출된 모든 GPU 작업뿐만 아니라 한
    영역에서 이루어진 모든 CUDA, OpenCL, Direct3D
    및 OpenGL API 호출에 대한 통계 디스플레이를
    지원합니다.
>  *새로운 기능* 상관관계 창에서는 리포트
    테이블이나 타임라인 뷰에서 선택한 데이터를
    마이닝할 수 있습니다.
>  DirectCompute 쉐이더 프로파일링.
>  API 호출, 커널 시작, 메모리 전송 및 사용자 지정
    어플리케이션 주석을 포함하여 CPU 및 GPU 레벨
    이벤트를 캡처합니다.
>  단일 상관 타임라인에서는 캡처한 모든 이벤트를
    보여줍니다.
>  타임라인 검사 도구로 워크로드의 종속성을 검사할
    수 있습니다.
>  특화된 리포팅 뷰를 사용하여 캡처한 이벤트를
    필터링 및 정렬합니다.
>  GPU 성능 카운터를 사용하여 CUDA 커널을
    프로파일링합니다.

그래픽 개발
Icon Parallel Nsight

GPU 그래픽 개발용 NVIDIA Parallel Nsight
NVIDIA Parallel Nsight 소프트웨어는 전세계적으로 가장 많이 사용되는 개발 환경인 Microsoft Visual Studio와의 통합 환경을 제공하는 세계 최초의 그래픽 개발 환경으로, 이를 통해 고급 성능 최적화뿐만 아니라 기본 GPU 디버깅 및 API 디버깅 기능으로 DirectX 10 및 DirectX 11 그래픽 개발이 가능합니다

Parallel Nsight 2.1에서 *새로워진 점*
   - 동적 쉐이더 편집(Dynamic Shader Editing) 기능으로 어플리케이션을 실행하는 동안에도 쉐이더를 편집하고 다시
     컴파일 할 수 있습니다. 이 기능은 상황에 따른 최적화 테스트뿐만 아니라 렌더링 문제의 디버깅에도 도움이 됩니다.
   - 프레임 타이밍(Frame Timings) 페이지에서는 캡처된 프레임에 대한 빠른 프로파일링을 실행할 수 있으며 빠른
     프로파일링 처리 속도를 위해 각 그리기 호출의 다양한 타이밍을 확인할 수 있습니다.

GRAPHICS INSPECTOR AND DEBUGGER 그래픽 인스펙터 및 디버거
>  *새로운 기능* 어플리케이션을 실행하는 동안 동적
    쉐이더 편집(Dynamic Shader Editing) 기능을 사용할
    수 있습니다
>  *새로운 기능* 쉐이더 인스펙터(Shader Inspector}
    페이지에는 HLSL 변수 이름의 상수 버퍼가
    표시됩니다.
>  *새로운 기능* Visual Studio 외부 그래픽 디버깅을
    위해 Nsight HUD가 추가되었습니다.
>  DirectX 렌더링 호출에 대한 실시간 검사.
>  바운드 텍스처, 지오메트리 및 컴퓨팅 버퍼의
    시각화를 포함하는 GPU 파이프라인 상태의
    쌍방향 검사.
>  픽셀 히스토리(Pixel History)에서는 해당 픽셀에 영향을
    끼치는 모든 작업을 보여줍니다.
>  GPU 하드웨어에서 기본적으로 모든 HLSL 그래픽
    쉐이더를 디버깅합니다.
>  Visual Studio에서 익숙한 Locals, Watch, Memory 및
    Breakpoints 창을 활용하여 병렬로 실행 중인
    쓰레드를 검사합니다.
>  어플리케이션에서 로드한 모든 쉐이더로 소스 코드
    레벨를 확인 및 상호 작용합니다.
> 조건부 브레이크 포인트를 사용하여 주어진 모든
    원시코드 또는 픽셀에 영향을 끼치는 쉐이더를
    식별합니다.
 
GRAPHICS PROFILER AND APPLICATION TRACE

GRAPHICS PROFILER AND APPLICATION TRACE
그래픽 프로파일러 및 어플리케이션 트레이스
>  *새로운 기능* 프레임 타이밍(Frame Timings)
    페이지에 고급 그리기 호출 타이밍 정보가 표시됩니다.
>  *새로운 기능* 프레임 프로파일러(Frame Profiler)
    세션을 저장 및 복원하여 프로파일링 결과를
    공유할 수 있습니다.
>  *새로운 기능* 시스템 트레이스에서는 32bit 프로세스
    에서 시작된 64bit 프로세스의 데이터 캡처링
    지원 기능이 추가됩니다.
>  *새로운 기능* DirectX 및 OpenGL 워크로드, 메모리
    전송 및 명령 버퍼와 API 호출에 대한 이들 항목의
    상관관계를 추적합니다.
>  Direct3D, OpenGL 및 Cg API 트레이스.
>  프레임 프로파일러(Frame Profiler)에서 성능 병목현상
    및 GPU 사용률을 식별합니다.
>  오프라인 협업 및 분석을 위해 프레임 캡처를
    저장합니다.