Podczas pokazu SC10 Intel chwalił się możliwościami swojej architektury MIC, wywodzącej się wprost z projektu Larabee i przeznaczonej na rynek rozwiązań HPC. Podczas imprezy Knights Ferry musiał poradzić sobie z symulacją biznesową Monte Carlo, napisaną w języku C++ i wspieraną przez narzędzia deweloperskie Intel Parallel Studio XE 2011. Prelegenci podkreślali również gotowość do wsparcia obliczeń potrzebnych w innych dziedzinach, jak na przykład medycyna. Nowość od Intela ma być odpowiedzią na karty graficzne konkurencji, zwłaszcza Nvidia, które zdobywają coraz większą część rynku HPC.
Układ Knights Ferry był wyposażony w 32 rdzenie x86, pracujące z zegarem 1.2GHz i wspierane przez 8MB pamięci casche drugiego poziomu każdy oraz 2GB pamięci RAM typu GDDR5. Całość komunikuje się z pozostałymi elementami za pośrednictwem szyny PCI Express 2.0 i obsługuje technologię quad-HyperThreading. Prawdziwe możliwości MIC mamy jednak poznać dopiero wraz z nadejściem produkowanego w 22nm procesie produkcji Knights Corner, który będzie wyposażony w aż 50 rdzeni x86. Jednocześnie przedstawiciele Intela przekonywali, że ich nowy produkt stanowi tylko dodatek do procesorów z rodziny Xeon.
K O M E N T A R Z E
... (autor: AMD_Master | data: 17/11/10 | godz.: 18:21) Tylko 2GB pamięci...trochę słabo w porównaniu do swojego rywala, który ma 6GB.
@intel (autor: zomb1e | data: 17/11/10 | godz.: 18:36) Tak się kończy zabawa, kiedy chce się procesory x86 zmusić do obliczeń grafiki.
mnie ciekawi (autor: Jarek84 | data: 17/11/10 | godz.: 19:12) jaki będzie ralny wzrost Quad HT w stisunku do jednego fizycznego rdzenia KF.
@AMD_Master (autor: Promilus | data: 17/11/10 | godz.: 19:13) Tak, nawet FireStream ma 4GB...
@Wedelek
cache a nie casche
Swoją drogą pierwszy raz spotykam się z quad-ht ;) Intelowska implementacja SMT to HT, czy to oznacza 2 wątki na rdzeń, czy 4 - nadal jest HT :]
ooooo miód leje się na moje serce :D (autor: Qjanusz | data: 17/11/10 | godz.: 19:55) kolejny news o spuściźnie Larrabee.
Uwielbiam never ending storry kompletnej KOMPROMITACJI Paulo Otelloniego Zapowiadającego i jego potędze graficznej
:-)
@morgi (autor: Conan Barbarian | data: 17/11/10 | godz.: 21:29) Napisz coś pikantnego - tak, aby było wypierdowo i z przytupem. Tylko nas nie zawiedź.
@Promilus (autor: Mariosti | data: 17/11/10 | godz.: 23:44) quad w nazwie sugeruje że będą to 4 lub 8 wątków na rdzeń. W porównaniu do gpu jest to śmieszna wartość bo sprzętowi zarządcy wątków u nv i ati są w stanie obsłużyć nawet 1000 wątków jednocześnie. Ktoś może zapytać - jaki jest sens tylu sprzętowo przełączanych wątków? - już wyjaśniam. Ogromnej przepustowości kontroler RAM'u na takiej karcie posiada gigantyczne opóźnienia względem żądań dostępu do pamięci. Aby maskować te opóźnienia zarządca wątków w gpu ma pod ręką zawsze kilkanaście innych wątków uśpionych które nie muszą czekać na żadne dane i tyle. Wyjaśnia to też dlaczego ht w zwykłych procesorach nie daje oszałamiających zysków - ponieważ opóźnienia RAM'u są tam maskowane przez gigantyczną wręcz pamięć podręczną procesora, a i sam kontroler/pamięci z których korzystają zwykłe cpu ma znacznie mniejsze opóźnienia w porównaniu do "4-5GHz", 256-384bitowych molochów które można spotkać na kartach graficznych.
@Mariosti (autor: Promilus | data: 18/11/10 | godz.: 07:45) nie przeginaj...powiedz co jest odpowiednikiem rdzenia CPU w GPU? Stream Multiprocessor a nie Stream processor/Shader core/CUDA core. A co jest odpowiednikiem wątku? procesu? Tego się nie da porównać wprost!
@Promilus (autor: Mariosti | data: 18/11/10 | godz.: 12:13) Odpowiednikiem rdzenia cpu wykonującego tzw lekki wątek jest każdy sp w gpu, natomiast odpowiednikiem rdzenia mogącego obsługiwać procesy jest po części simd, z tym że to jest mało sensowne porównanie bo z założenia gpu wykorzystuje się do operacji równoległych względem danych i wtedy zawsze prawdziwa jest ta pierwsza definicja, czyli każdemu rdzeniu cpu odpowiada pojedynczy sp i u nvidii i u ati.
Wątki lekkie są wręcz wprost odpowiednikami tych z cpu, tylko jak wspomniałem pojęcie procesu jest bardziej skomplikowane w przypadku gpu.
@mariosti (autor: Promilus | data: 18/11/10 | godz.: 13:34) [quote]czyli każdemu rdzeniu cpu odpowiada pojedynczy sp i u nvidii i u ati[/quote]
Tiaaa... nie bądź śmieszny. Ja mogę odpalić 1 program na core 1, a drugi na core 2, a do tego trzeci na obu rdzeniach. Tego nie zrobisz na GPU. Tam wszystkie SP w SIMD/SM robią ten sam program - nie możesz liczyć na tym samym SM/SIMD naraz fizyki na cuda oraz kolorków pikseli czy współrzędnych wierzchołków. Za to w procach wyposażonych w HT mogą lecieć na pojedynczym rdzeniu 2-4 wątki różnych programów. Żeby było śmieszniej w CPU przełączanie między wątkami jest dużo szybsze niż w przypadku GPU, gdzie przełączanie między różnymi aplikacjami jest dość długie (co poprawiono w fermi).
@up (autor: Promilus | data: 18/11/10 | godz.: 13:34) Jak zwykle zapomniałem że tu brak bbcode ;)
ja pier.... ?!?!?! (autor: emuY | data: 18/11/10 | godz.: 19:10) na Syberii, lub w Arktyce w sam raz do badań i ocieplania chatek badaczy.
a tak to jeszcze trzeba by kupić ciekły azot do serwerowni w ilości kilkuset wagonów cystern :D
D O D A J K O M E N T A R Z
Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.