TwojePC.pl © 2001 - 2024
|
|
RECENZJE | Pentium 4 z 2MB cache, czyli czy więcej znaczy wydajniej |
|
|
|
Pentium 4 z 2MB cache, czyli czy więcej znaczy wydajniej Autor: Lancer | Data: 17/03/05
| Po zeszłorocznej, niespodziewanej informacji Intela o rezygnacji z produkcji Pentium 4 z zegarem 4GHz, na ten rok gigant przygotował niespotykany wcześniej wysyp nowości, chcąc pokazać, że cały czas ma wiele do zaoferowania. Do tej pory nie zdarzyło się, by w tak krótkim czasie została pokazana seria różnych linii procesorów.
Kilkanaście dni temu pojawiły się modele stanowiące dalszy rozwój znanego od roku rdzenia Prescott - układy wersji 6xx i nowy, flagowy wyrób firmy - Pentium 4 3,73GHz Extreme Edition. Na tym jednak nie koniec. Już za kilka tygodni ukaże się kolejna linia wyrobów Intela, pod znanym już dziś oznaczeniem Pentium D. Ma ona wielkie szanse na bycie pierwszą konsumencką rodziną mikroprocesorów wielordzeniowych. Będzie się więc działo...
Do tej pory ujawnione i wprowadzone na rynek zostały jedynie układy Pentium 4 6xx i to one będą tym razem stanowiły przedmiot naszego zainteresowania. Na wielordzeniowe, wzbudzające wiele emocji pomysły Intela jeszcze troszeczkę musimy poczekać. Niemniej i tak będzie ciekawie... |
|
Co pod maską?
Nowe procesory, tworzące linię Pentium 4 6xx, to tak naprawdę znane już od roku układy Prescott poddane delikatnemu liftingowi, a pracujące w gnieździe LGA775. Niestety, mimo licznych spekulacji, od roku nie pojawił się żaden model na socket 478 i nic nie wskazuje na zwrot w tej sytuacji. Zmodernizowany układ zyskał nazwę Prescott 2M. W dużym skrócie można go określić jako Prescotta z rdzeniem w steppingu E0 z powiększonym do 2MB cache L2 i dodaną funkcją EIST. Tyle w ogólnikach. Przejdźmy do konkretów.
Od czasu steppingu D0, który na dobre pojawił się wraz z Prescottem na gniazdo LGA775, w procesorze zaszło kilka drobnych, ale dosyć istotnych zmian. Jak wiadomo Prescott od urodzenia był układem bardzo "prądożernym", a co gorsze bardzo gorącym. Z czasem inżynierom m.in. dzięki udoskonaleniom samego procesu produkcyjnego, a także zmianom w samym rdzeniu, udało się ograniczyć emisję ciepła. I tak, o ile w modelu P4 540 (3,2GHz) z rdzeniem D0 TDP było ono na poziomie 115W, to takie same układy serii SL7PX i SL7PW korzystające ze steppingu E0 mają ten parametr już na poziomie 84W. Niestety, modele 560 i 570 mają już TDP na poziomie 115W (norma 04B). Tyle wynikło z samych starań technologów. A co na to konstruktorzy? Oni też dodali coś od siebie. Krokiem mającym uczynić Prescotta procesorem chłodniejszym i bezpieczniejszym było wprowadzenie metod redukcji ciepła Enhanced Halt Mode C1E i ochrony termicznej Thermal Monitoring 2. Przyjrzyjmy się tym zagadnieniom bliżej.
W chwili zakończenia przez program wykonywania zadania, system operacyjny przesyła instrukcję HALT. Procesor odczytując rozkaz systemu przechodzi w tryb oszczędności, podczas którego niepotrzebne jednostki są wyłączane (przechodząc do martwej pętli, wykonując puste rozkazy w czasie których nie jest pobierany kod z pamięci). Powoduje to obniżenie emisji ciepła. Tak działał wcześniejszy model redukcji cieplnej C1. W trybie C1E dodatkowo układ redukuje pobór mocy poprzez obniżenie napięcia zasilającego (o około 0,2V) i zmniejszenie zegara taktującego przez obniżenie mnożnika do najniższego możliwego (14x).
Tryb ochrony termicznej Thermal Monitoring 2 korzysta z podobnych mechanizmów, lecz działa tylko w przypadku stwierdzenia przegrzania. Po przekroczeniu pewnej progowej wartości następuje redukcja mnożnika i napięcia zasilającego skutkując obniżeniem emitowanej mocy. TM2 jest uzupełnieniem wcześniejszej funkcji Thermal Monitoring 1. Ta pierwsza w chwili przegrzania odcinała połowę cykli zegarowych powodując obniżenie emisji cieplnej. Niestety, taki stan procesora, mimo iż skutecznie chroni go przed przegrzaniem, powoduje zakłócenia w pracy m.in. podsystemu pamięci, kiedy dane żądane przez procesor mogą być odrzucane, z uwagi na redukcję zegara. Powstające w ten sposób błędy skutkować mogą zatrzymaniem całego systemu.
Drugą nowinką zaimplementowaną w rdzeniu E0 było dodanie Execute Disable Bit. To nic innego jak znany z procesorów AMD bit No eXecute (NX), zaszyty w tabelach translacji, umożliwiający zablokowanie instrukcji w buforze bez wpływu na pozostałe dane, chroniąc w ten sposób system choćby przed przepełnieniem stosu.
Dwie omówione wyżej cechy znalazły zastosowanie w procesorach Pentium 4 i Celeron, opartych o jądro Prescott ze steppingiem E0. Możemy je rozpoznać po literce "J" w indeksie procesora (np. Pentium 4 560J). Kolejnym krokiem ku serii 6xx było wprowadzenie rdzenia Prescott 2M w postaci steppingu N0.
Co nowego oferuje N0? Mamy kolejne dwie zmiany. Pierwsza wprowadza technologię EIST (Enanced SpeedStep Technology). Funkcja ta jest bardzo podobna do Cool&Quiet AMD i stanowi rozwinięcie Enhanced Halt Mode C1E. Różnica polega na tym, że w zależności od obciążenia procesor automatycznie reguluje zegar i poziom napięcia zasilającego, dostosowując dzięki temu wydajność (i ilość wydzielanej mocy) do bieżących potrzeb. Tak jak wcześniej, najniższym mnożnikiem jest 14-stka. Trzeba tu wtrącić, że rozwiązanie AMD jest elastyczniejsze, ponieważ w stanie głębokiego spoczynku K8 może zredukować zegar aż do mnożnika 4x (co przy znamionowym zegarze szyny referencyjnej 200MHz i mnożniku 4x końcowo daje 800MHz), a napięcie do 0,8V. W przypadku EIST możliwa najniższa jest wartość 2,8GHz - tak więc, im wyższy jest końcowy zegar procesora, tym więcej poziomów pracy EIST (dla modelu 3GHz są tylko dwie wartości, dla modelu 3,6GHz już pięć). Trudno ogólnie określić poziom napięcia zasilającego w najniższym trybie pracy EIST, z uwagi na indywidualnie dobierany przez producenta parametr znamionowego napięcia dla każdej partii procesorów. Standardowe napięcie Vcore w zależności od serii waha się od 1,2 do 1,4V i nie jest ono z góry ustalone.
Druga zmiana to powiększona pamięć podręczna cache L2. Ma on teraz rozmiar aż 2048KB. Warto dodać, że pierwotnie większy cache miał mieć dopiero następca Prescotta - Tejas, a i to dopiero w wymiarze 0,065um. Cóż, Tejasa nie będzie, a 2MB cache mamy już teraz. Parametry szyny dostępowej nie uległy zmianie (8-śmio drożna, 256-bitowa z 64-bitowym wierszem pamięci). Niestety, prawdopodobnie kolejny raz zwiększyła się latencja cache. Trudno jednak wyrokować, jaką ten parametr w praktyce ma wartość. Pierwotne pomiary jakie wykonałem wykazywały, że zarówno Prescott z 1 jak i z 2MB cache L2 ma opóźnienie około 30cykli. Jednak już np. program CacheMem wskazuje na 24 cykle dla rdzenia z 1MB i 27 cykli dla 2MB Prescotta. Cóż, na pewno rdzeń ma teraz więcej pamięci, ale niestety jest również możliwe, że ma do niej dłuższy czas dostępu.
Na tym koniec nowinek. Czy o czymś zapomniałem? Nie :) Ale należy dodać, że w końcu wraz z rdzeniem N0 dostajemy oficjalnie wsparcie dla 64 bitowych instrukcji zgodnych z AMD64, które w języku Intela zwą się EM64T (Extended Memory 64 Technology). Dlaczego nie zaliczyłem ich do nowinek? Ano, o intelowskim rozszerzeniu x86-64 pisałem już rok temu przy okazji premiery nowego jądra Pentium 4. Niestety do teraz owe rozszerzenia w procesorach Pentium 4 Prescott były zablokowane, choć od dawna już były dostępne dla serwerowych odmian tego rdzenia (Nocona). Co prawda, już od ponad pół roku niektóre serie Pentium 4 miały EM64T aktywne, ale były one udostępniane w niewielkich seriach i to tylko najbardziej zaufanym partnerom giganta. Teraz to się zmienia i dostęp do EM64T może mieć każdy.
Wiemy już co piszczy, teraz dowiemy się gdzie piszczy. Procesory ze steppingiem E0 dostępne są obecnie już we wszystkich procesorach LGA, zastępując tym samym starszy stepping D0. Układy rozpoznać można po wspomnianej już literce "J" w indeksie modelu procesora. I tak, na rynku dostępne są modele 520 (2,8GHz), 530J (3,0GHz), 540J (3,2GHz), 550J (3,4GHz), 560J (3,6GHz) i 570J (3,8GHz). Stepping E0 trafił też do Celeronów D.
A co z N0? Stepping ten znalazł zastosowanie w serii procesorów Pentium 4 z 2MB buforem. Układy zyskały nowy indeks: 6xx. I tak, dostępne są następujące modele P4 620 (2,8GHz), 630 (3,0GHz), 640 (3,2GHz), 650 (3,4GHz) oraz 660 (3,6GHz). Wszystkie układy wyposażone są w 64bitowe rozszerzenia EM64T z bitem NX, technologią Thermal Monitor 2 i Enhanced Halt Mode C1E. Technologię EIST wspierają modele od 630 w górę, z tego prostego powodu, że P4 620 pracuje z mnożnikiem 14x, a co za tym idzie EIST nie będzie działać z uwagi na wyczerpane pole do manewru mnożnikiem.
Do serii desktopowych układów dołączył jeszcze jeden model. Wersja Extreme Edition. To bardzo nietypowy model. O ile wcześniejsze procesory tej serii oparte były o 0,13um jądro Gallatin, które w praktyce było Northwoodem z dodanym cacheL3, to teraz Ekstremalna wersja trafiła w wymiar 0,09um i pod względem technologicznym niczym nie odbiega od zwykłych Pentiumów serii 6xx. Układ oparty jest o ten sam stepping N0, ma 2MB cacheL2 (L3 już nie ma). Dostępny jest jeden model, taktowany zegarem 3,73GHz. Układ nie ma żadnego indeksu i jest oznaczony po prostu jako Pentium 4 3,73GHz EE. Jednym wyróżnikiem, w stosunku do tradycyjnych modeli 6xx, jest podniesione do 266MHz (QPB 1066MHz) taktowanie szyny FSB. Układ pracuje przy mnożniku 14x, przy czym, podobnie jak model P4 620, ma wyłączoną technologię EIST. I tu mamy paradoks. Zarówno model P4 620, jak i P4 3,73GHz EE pracują z tym samym mnożnikiem i mają niemal te same możliwości. Różni je jedynie... szyna FSB, a co za tym idzie końcowe taktowanie i .... cena. Ekstremalny Pentium ma, tradycyjnie już, kosztować 1000$. To dosyć oryginalne podejście i pewnie z uwagi na chęć zachowania równowagi rynkowej model P4 620 będzie dostępny jedynie na wybranych rynkach w ograniczonych ilościach. Sprytnie ;)
Poniższa tabelka przedstawia zestawienie najważniejszych cech nowej rodziny procesorów Pentium na gniazdo LGA. Jak widać, dla nowych modeli aż do 3,4GHz TDP zachowano na w miarę rozsądnym poziomie. Warto uzmysłowić sobie, jak mocno potaniała produkcja P4 EE wraz z przejściem do nowego wymiaru technologicznego. Ilość tranzystorów w stosunku do starszego rdzenia Gallatin pozostała na podobnym poziomie, ale wymiary samego rdzenia drastycznie spadły. A mniejszy rdzeń oznacza niższy jednostkowy koszt produkcji.
(kliknij, aby powiększyć)
|
|
|
|
|
|
|
|
|
|