AKTUALNOŚCI

Dwuprocesorowy akcelerator graficzny NVIDIA Tesla K80

18.11.2014 Skomentuj pierwszy

nvidia tesla k80

NVIDIA zaprezentowała nowy produkt należący do platformy obliczeń akcelerowanych NVIDIA Tesla: dwuprocesorowy akcelerator graficzny Tesla K80. Jest on najwydajniejszą na świecie kartą tego typu, zaprojektowaną do wielu zastosowań w dziedzinach uczenia maszynowego, analiz danych oraz obliczeń naukowych i wysokowydajnych (HPC).

Dwuprocesorowa karta Tesla K80 jest flagowym produktem platformy obliczeń akcelerowanych Tesla, wiodącej platformy stworzonej dla przyspieszenia analiz danych i obliczeń naukowych. Skupia ona najszybsze na świecie akceleratory graficzne, najpopularniejszy model obliczeń równoległych NVIDIA CUDA oraz kompleksowy ekosystem programistów, dostawców oprogramowania i producentów OEM centrów danych.

W porównaniu z poprzednim modelem Tesla K40, dwuprocesorowy akcelerator graficzny Tesla K80 cechuje się prawie dwukrotnie wyższą wydajnością i przepustowością pamięci. Nowa karta jest dziesięciokrotnie szybsza od najwydajniejszych procesorów centralnych (CPU), prześcigając je oraz konkurencyjne akceleratory graficzne w wykonywaniu złożonych operacji analitycznych i obsługi rozbudowanych aplikacji do obliczeń naukowych.

Usprawniona technologia NVIDIA GPU Boost (plik PDF) dynamicznie optymalizuje wydajność każdej aplikacji z osobna, w zależności od dostępnego zapasu mocy, pozwalając użytkownikom odblokować potencjał drzemiący w szerokiej gamie oprogramowania.

Wydajność wykorzystywana w badaniach naukowych, analizie danych i uczeniu maszynowym

Dwuprocesorowe akceleratory Tesla K80 zostały zaprojektowane z myślą o rozwiązywaniu najtrudniejszych problemów obliczeniowych w astrofizyce, genomice, chemii kwantowej czy analityce danych. Ponadto zoptymalizowano je pod kątem zadań głębokiego uczenia (ang. deep learning), jednego z najszybciej rozwijających się segmentów w dziedzinie uczenia maszynowego.

„Akceleratory graficzne firmy NVIDIA stały się podstawową platformą obliczeniową dla społeczności zajmującej się głębokim uczeniem”, powiedział Yann LeCun, dyrektor ds. badań nad sztuczną inteligencją w firmie Facebook oraz profesor informatyki i neurobiologii na Uniwersytecie Nowojorskim. „Ponieważ dokładność systemów głębokiego uczenia wzrasta wraz ze zwiększeniem rozmiarów modeli i zestawów danych, to zawsze szukamy jak najszybszego sprzętu, który możemy wykorzystać do naszych celów. Akcelerator Tesla K80 o dwuprocesorowej konstrukcji i dużej ilości pamięci zapewnia nam niespotykaną dotychczas wydajność i bezprecedensowe możliwości przetwarzania danych w ramach pojedynczego serwera, dzięki czemu będziemy mogli przyspieszyć nasze postępy w badaniach.”

Tesla K80 osiąga do 8,74 TFLOPS wydajności w obliczeniach o pojedynczej precyzji i do 2,91 TFLOPS wydajności szczytowej w obliczeniach zmiennoprzecinkowych o podwójnej precyzji. Tym samym jest on dziesięciokrotnie szybszy od najszybszych procesorów centralnych w wiodących aplikacjach naukowych i technicznych, takich jak AMBER, GROMACS, Quantum Espresso czy LSMS.

„Dwuprocesorowe akceleratory graficzne Tesla K80 są nawet dziesięciokrotnie szybsze od procesorów centralnych w stosowanych przez nas kluczowych aplikacjach, jednocześnie zapewniając niskie zużycie energii”, powiedział Wolfgang Nagel, dyrektor Centrum Usług Informatycznych i Obliczeń Wysokowydajnych przy Uniwersytecie Technicznym w Dreźnie. „Nasi naukowcy wykorzystują akceleratory graficzne w superkomputerze Taurus, w celu stworzenia doskonalszych terapii rakowych, lepszego poznania komórek poprzez obserwację ich cyklu życiowego oraz badania planetoid w ramach misji Rosetta, prowadzonej przez Europejską Agencję Kosmiczną (ESA).”

Najważniejsze cechy akceleratora Tesla K80 to:

Dwa procesory graficzne – dwukrotnie wyższa przepustowość dla aplikacji współpracujących z wieloma procesorami graficznymi.
24 GB ultraszybkiej pamięci GDDR5 – 12 GB pamięci na każdy procesor graficzny to dwukrotnie większa ilość od tej dostępnej w modelu Tesla K40, co umożliwia pracę z dwukrotnie większymi zestawami danych.
Przepustowość pamięci 480 GB/s – zwiększona przepustowość pamięci pozwala na skrócenie czasu analizy petabajtów informacji o połowę w porównaniu z akceleratorem Tesla K10. Optymalizacja do działań związanych z poszukiwaniami źródeł energii, przetwarzania dźwięku i obrazu, a także aplikacji analitycznych.
4992 rdzeni przetwarzania równoległego CUDA – dziesięciokrotne przyspieszenie przetwarzania aplikacji w porównaniu z zastosowaniem tylko procesora centralnego.
Technologia NVIDIA GPU Boost – dynamicznie dostosowuje częstotliwości taktowania zegarów procesora graficznego do charakterystyki danej aplikacji, zapewniając maksymalną wydajność w każdym zastosowaniu.
Dynamiczne przetwarzanie równoległe (ang. Dynamic Parallelism) – umożliwia dynamiczne tworzenie nowych wątków przez procesor graficzny, a tym samym znacząco ułatwia przetwarzanie adaptacyjnych i dynamicznych struktur danych.

Tesla K80 przyspiesza działanie szerokiej gamy oprogramowania do obliczeń wysokowydajnych, badań naukowych, prac technicznych i zastosowań komercyjnych, a także centrów danych – w sumie ponad 280 aplikacji. Kompletny katalog oprogramowania akcelerowanego przez procesory graficzne (plik PDF) jest dostępny do pobrania bezpłatnie.

Użytkownicy mogą także bezpłatnie wypróbować akcelerator Tesla K80, korzystając ze zdalnie udostępnionych klastrów. Więcej informacji na ten temat można uzyskać w witrynie GPU Test Drive.

Dostępność

Dwuprocesorowy akcelerator graficzny NVIDIA Tesla K80 jest dostępny już teraz i pojawi się w serwerach takich firm jak ASUS, Bull, Cirrascale, Cray, Dell, Gigabyte, HP, Inspur, Penguin, Quanta, Sugon, Supermicro i Tyan, a także u resellerów współpracujących z firmą NVIDIA.

Informacje o platformie obliczeń akcelerowanych NVIDIA Tesla

Platforma obliczeń akcelerowanych NVIDIA Tesla została zaprojektowana od podstaw pod kątem energooszczędnych obliczeń wysokowydajnych, przydatności w naukach obliczeniowych, superkomputerach, złożonych analiz danych i aplikacji uczenia maszynowego. Zapewnia ona znacząco większą wydajność i energooszczędność w porównaniu z rozwiązaniami opartymi wyłącznie na procesorach centralnych. Platforma jest głęboko zintegrowana z najszybszymi na świecie akceleratorami graficznymi, zaawansowanymi systemami zarządzania systemem, technologią akceleracji komunikacji i najpopularniejszym modelem obliczeń równoległych na świecie NVIDIA CUDA®.

Źródło: nvidia

ZOBACZ RÓWNIEŻ ...