:. Análise Completa do Pentium 4

 Por Carlos E. Morimoto
 http://www.guiadohardware.net
 13/11/2000


Depois de vários atrasos, finalmente o Pentium 4, conhecido anteriormente como Willamette chega ao mercado. As duas verses iniciais operam a respectivamente 1.4 e 1.5 GHz, estando anunciadas verses de até 2 GHz até o final de 2001. O preço também no fica atrás, a verso de 1.5 GHz custa nos EUA por volta de 1080 dólares, enquanto a verso de 1.4 GHz, também nos EUA custa 920 dólares. Aqui no Brasil os preços sero de 15 a 50% mais altos, dependendo do revendedor.

Outro ponto interessante sobre o Pentium 4 é que pelo menos por enquanto o único chipset disponível, o i850 da própria Intel suporta apenas memórias Rambus, o que obriga qualquer um interessado em adquirir um Pentium 4 a adquirir também módulos de memória Rambus. A boa notícia é que finalmente as memórias Rambus esto começando a chegar ao mercado com preços digamos aceitáveis. Nos EUA um módulo RIMM de 64 MB custa em média 99 dólares, contra 45 dólares em média por um módulo de 64 MB de memória PC-133. Ainda custa pelo menos o dobro, mas já é bem menos do que custava a alguns meses atrás. Lembrando que como veremos adiante, os módulos RIMM devem ser usados em pares no Pentium 4.

 

:. OEM x Boxed

Existem duas verses do Pentium 4, a Boxed e a OEM. Ao contrário de outros processadores, no caso no Pentium 4 a diferença entra as duas verses no é apenas o cooler. A verso Boxed do Pentium 4 já vem com 2 módulos de 64 MB de memória Rambus e cooler, enquanto na verso OEM temos apenas o processador. Considerando que a verso Boxed custa cerca de 100 dólares a mais, ela acaba sendo uma melhor opço em termos de custo, já que adiquiridos separadamente, os módulos de memória e o cooler custam muito mais que isto.

 

:. A Arquitetura

O primeiro alerta a se fazer sobre o Pentium 4 é que o aumento da freqüncia de operaço no significa um ganho automático de potncia. Um Pentium 4 de 1.5 GHz no é 50% mais rápido que um Pentium 3 de 1 GHz. Um dado é o número de ciclos por segundo que o processador pode executar, outro é o que ele consegue processar em cada ciclo. Um 486 de 100 MHz por exemplo é muito mais lento que um Pentium de 75 MHz, apesar de operar a uma freqüncia mais alta.

Para entender os pontos fortes e fracos do Pentium 4, onde ele é mais rápido e onde ele é mais lento, por que no começar analisando a arquitetura interna do processador?

A Intel batizou a nova arquitetura do Pentium 4 de "NetBurst". O Nome no tem nada a ver com o desempenho em redes ou na Internet, mas tenta ilustrar os novos recursos do processador, assim como dar um ar de superioridade. A arquitetura NetBurst é composta por 4 componentes: Hyper Pipelined Technology, Rapid Execution Engine, Execution Trace Cache e Bus de 400MHz. Vamos aos detalhes de cada uma das 4 tecnologias:

 

:. Hyper Pipelined Technology

Esta é a característica mais marcante do Pentium 4. O Pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividido o trabalho de processar as instruçes. É como uma linha de produço com vários operários, onde cada um monta uma peça, até termos no final o produto completo. Apartir do 486, todos os processadores utilizam este recurso.

O Pentium III possui 10 estágios, o Athlon possui 11 estágios, enquanto o Pentium 4 possui nada menos que 20 estágios, daí o nome "Hyper Pipelined".

O uso de Pipeline permite que o processador possa processar várias instruçes ao mesmo tempo, sendo que cada estágio cuida de uma fraço do processamento. Quanto mais estágios, menor será o processamento executado em cada um. No caso do Pentium 4 cada estágio do Pipeline processa apenas metade do processado por um estágio do Pentium III, fazendo com que teoricamente o resultado final seja o mesmo, já que em compensaço existem o dobro de estágios.

O uso de mais estágios permite que o processador opere a freqüncias bem mais altas mais altas, já que cada estágio executa menos processamento. O grade problema neste caso é que os processadores atuais executam várias instruçes simultaneamente, enquanto os programas so uma seqüncia de instruçes. O Pentium 4 processa trs instruçes por ciclo, o Pentium antigo (Pentium 1) processa duas, e assim por diante.

Caso as instruçes seguintes no dependam do resultado da primeira, como uma seqüncia de somas de vários números, por exemplo, ento o processador no terá nenhum problema para resolv-las rapidamente.

Caso porém tenhamos uma tomada de deciso, onde o processador precisa primeiro resolver uma instruço para saber qual caminho deve tomar, como por exemplo "Se A > 3 ento B = C+5 seno B = C-5", entra em cena o recurso de execuço especulativa, onde enquanto é resolvida a primeira instruço, o processador escolhe um dos caminhos possíveis para ir "adiantando o serviço" enquanto no sabe qual deverá seguir. Se ao saber o resultado da primeira instruço ver que tomou o caminho certo, simplesmente continuará apartir dali. Caso por outro lado o processador tenha adivinhado errado, ento terá que jogar fora todo o trabalho já feito e tomar o outro caminho, perdendo muito tempo.

O Pentium 4 perde gritantemente nesse quesito, pois ele demora o dobro do tempo para processar a primeira instruço, já que ela é processada em 20 estágios, contra 10 do Pentium III. Isto significa que a cada tomada de deciso errada, sero perdidos pelo menos 20 ciclos de processamento, um eternidade, considerando que em média, 14% das instruçes processadas so de tomada de deciso. Se por acaso o processador errasse 50% das previses, ento os 7% de erros de previso resultariam numa diminuiço de 30% do desempenho do processador em comparaço com o antigo Pentium III.

Isto significa que a princípio o Pentium 4 é mais lento que um Pentium III do mesmo clock, podendo em compensaço operar a freqüncias mais altas. Todas as demais alteraçes feitas pela Intel, explicadas a seguir servem como paliativos para tentar diminuir a perda de desempenho trazida pelo maior número de estágios de Pipeline. Foi justamente devido a isto que a Intel optou por lançar diretamente os modelos de 1.4 e 1.5 GHz, pulando as verses de 1.1 e 1.2, que seriam o caminho mais óbvio já que o Pentium III ficou estacionado na verso de 1 GHz. Caso fosse lançado, um Pentium 4 de 1.1 GHz perderia para um Pentium III de 1 GHz em praticamente todas as aplicaçes.

Além da perda de desempenho, outro efeito colateral de se usar mais estágios de Pipeline é o fato de tornar o processador maior e mais complexo, fatalmente bem mais caro de se produzir. O Pentium 4 mede 217 milímetros quadrados, quase o dobro do Athlon, que mede 120 mm². Isto significa que o Pentium 4 é proporcionalmente mais caro de se produzir.

 

:. Execution trace Cache

O uso do cache L1 no Pentium 4 é no mínimo inovador. O Pentium 3 por exemplo tem 32 KB de cache L1, dividido em 2 blocos de 16 KB cada, para instruçes e dados. O Athlon tem 128 KB de cache L1, também dividido em dois blocos. O Pentium 4 por sua vez tem apenas 8 KB de cache para dados e só. Só? Sim, só isso. Porém, ele traz duas inovaçes que compensam esta aparente deficincia. A primeira é que graças ao tamanho reduzido, o pequeno cache de dados tem um tempo de latncia menor, ou seja é mais rápido que o cache L1 encontrado no Pentium III e no Athlon. Do ponto de vista dos projetistas da Intel, esta foi a melhor relaço em termos de desempenho.

O cache de instruçes por sua vez foi substituído pelo Execution trace Cache, que ao invés de armazenar instruçes, armazena diretamente uOPs, que so as instruçes já decodificadas, prontas para serem processadas. Isto garante que o cache tenha apenas um ciclo de latncia, ou seja o processador no prde tempo algum ao utilizar um dados armazenado no trace cache, ao contrário do que acontecia no Pentium III, onde perdia-se pelo menos dois ciclos em cada leitura.

Apesar da Intel no divulgar o tamanho do trace cache, sabe-se que ele armazena 12.000 uOPs, o que provavelmente equivale a 96 KB de dados. Considerando-se a eficincia do cache este tamanho é surpreendente. Para mais detalhes sobre o funcionamento do cache, consulte meu tutorial sobre cache

Se voc está em dúvida sobre o que é um "uOP", e como eles so produzidos e processados, aqui vai uma explicaço resumida: Apesar dos processadores para micros PC continuarem usando o conjunto x86 de instruçes, que é composto por 184 instruçes, internamente eles so capazes de processar apenas instruçes simples de soma e atribuiço. Existe ento um circuito decodificador, que converte as instruçes complexas usadas pelos programas nas instruçes simples entendidas pelo processador. Uma instruço complexa pode ser quebrada em várias instruçes simples. No Pentium 4, cada instruço simples é chamada de "uOP". No Athlon cada conjunto de duas instruçes ganha o nome de "macro-ops". Voc pode encontrar mais detalhes na minha analise do AMD Athlon

 

:. Bus de 400 MHz

Visando concorrer com o bus EV6 do Athlon, que opera de 100 a 133 MHz, com duas transferncias por ciclo, o que resulta na prática em freqüncias de respectivamente 200 e 266 MHz, o Pentium 4 conta com um bus operando a 100 MHz, mas com 4 transferncias por ciclo, o que equivale a um barramento de 400 Mhz.

O barramento controla a velocidade de comunicaço entre o processador e o chipset. Um barramento mais rápido, no significa um ganho de performance, porém, um barramento insuficiente, causará perda de desempenho, fazendo com que o processador no consiga comunicar-se com os demais componentes velocidade máxima.

Como tanto no Pentium 4, quanto no Athlon, o barramento é equivalente velocidade do acesso memória RAM, temos na prática um empate técnico.

 

:. Rapid Execution Engine

Todo processador atual é dividido em dois componentes básicos, as unidades de execuço de inteiros e as unidades de ponto flutuante. A parte que processa as instruçes envolvendo números inteiros é responsável pela maior parte das instruçes, e pelo desempenho do processador nos aplicativos do dia a dia enquanto as unidades de ponto flutuante, que compe o que chamamos de coprocessador aritmético é responsável pelo processamento das instruçes envolvendo valores complexos, usadas por jogos e aplicativos gráficos.

A "Rapid Execution Engine" do Pentium 4 consiste num reforço nas unidades de inteiros do processador. O Pentium 4 possui um total de 5 unidades de processamento de inteiros, duas ALUs, que processam as instruçes mais simples, duas GLUs, encarregadas de ler e gravar dados e uma terceira ALU, encarregada de decodificar e processar as instruçes complexas, que embora em menor quantidade, s as que tomam mais tempo do processador.

Este conjunto de 5 unidades de execuço de inteiros é semelhando ao do Pentium III, porém, como diferencial, no Pentium 4 tanto as duas ALUs encarregadas das instruçes simples, quanto as duas GLUs encarregadas das leituras e gravaçes so duas vezes mais potentes.

Segundo a Intel, as quatro unidades operam a uma freqüncia duas vezes superior do processador, o que sugere que num Pentium 4 de 1.5 GHz elas operem a 3 GHz. Porém, na verdade, cada unidade passa a ser composta por duas unidades trabalhando em paralelo. Com isto passa-se a processar duas instruçes por ciclo, mas a freqüncia de operaço continua a mesma. Na prática, o slogan acaba sendo real, mas em termos técicos é um dado distorcido.

Na teoria parece maravilhoso, mas existe um pequeno detalhe que elimina boa parte do ganho que seria de se esperar deste esquema. Apesar das duas ALUs de instruçes simples terem ficado mais rápidas, visando justamente compensar a perda de desempenho trazida pelos 20 estágios de Pipeline do Pentium 4, a ALU de instruçes complexas no teve a mesma evoluço. Isto significa que ao passar a usar 20 estágios de Pipeline, esta terceira ALU tornou-se mais lenta que a mesma no Pentium III.

Temos ento um cenário onde as instruçes simples so rapidamente processadas, mas as instruçes complexas ficam entaladas na vala comum da terceira ALU, causando uma grande perda de desempenho.

No coprocessador aritmético o cenário é ainda mais complicado, pois apesar das unidades de execuço terem perdido desempenho devido ao Pipeline de 20 estágios, no houve nenhum avanço para equilibrar a balança, como tivemos nas unidades de inteiros. Pelo contrário, o coprocessador aritmético encolheu, tendo sido podadas duas das unidades de execuço, uma das que processava instruçes MMX e uma das que processava instruçes SSE.

Ao invés de evoluir, como seria de se esperar, o coprocessador aritmético do Pentium 4 tornou-se ainda mais frágil do que o do Pentium 3, trazendo um cenário no mínimo curioso. Enquanto na época do Pentium II e do K6, a AMD competia com um processador que apesar de possuir um bom desempenho em aplicativos de escritório era literalmente massacrado nos jogos e aplicativos gráficos, temos agora com o Pentium 4 x Athlon um cenário semelhante, porém com os lados invertidos: A Intel ataca com um processador que é potente em inteiros, mas fraco em ponto flutuante.

Ironicamente, a soluço da Intel para tentar diminuir a deficincia do processador em ponto flutuante é a mesma que a AMD usou na época do K6-2. Lembra-se do 3D-Now, as instruçes incorporadas ao K6-2, que melhoravam seu desempenho nos jogos otimizados, fazendo com que em alguns títulos seu desempenho ficasse muito próximo ao de um Pentium II? A Intel optou por segui exatamente o mesmo caminho, incorporando 144 novas instruçes ao Pentium 4, chamadas de SSE2, que visam melhorar seu desempenho os jogos e aplicativos gráficos.

 

:. SSE2

As "Double Precision Streaming SIMD Extensions" do Pentium 4 so 144 novas instruçes de ponto flutuante de dupla preciso. Elas tem basicamente a mesma funço das instruçes SSE do Pentium III e do 3D-Now! Do Athlon: melhorar o desempenho do processador em aplicativos de ponto flutuante. A diferença é que as instruçes do Pentium 4 so muito mais poderosas que os conjuntos anteriores, o que pode literalmente salvar a pátria do Pentium 4 caso realmente um grande número de aplicativos sejam bem otimizados para as novas instruçes. A grande dúvida é que assim como nos conjuntos anteriores, é necessário que os aplicativos sejam reescritos a fim de utilizar as novas instruçes. E isso, claro, pode demorar um bom tempo, dependendo de como for a vendagem do processador.

A AMD anunciou que sua próxima geraço de processadores, o ClawHammer e Sledgehammer também suportaro o SSE2, mas eles devem estar no mercado apenas no final de 2001. Por enquanto o Pentium 4 ainda tem exclusividade. Vale lembrar que o Pentium 4 mantém compatibilidade com as instruçes SSE do Pentium III, aproveitando a base de aplicativos otimizados que já existe.

 

:. Acesso Memória

Apesar de trazer como desvantagem o fato de usar as caras memórias Rambus, o Pentium 4 está indiscutivelmente bem posicionado do ponto de vista do desempenho de acesso memória. Acessando simultaneamente dois módulos RIMM temos um barramento de dados de 3.2 GB/s usado módulos PC-800, o que corresponde a trs vezes o acesso permitido por módulos de memórias PC-133 comuns. Mesmo o Athlon usando memórias DDR fica para trás neste quesito

Por um lado isto ajuda bastante o processador em aplicativos dependentes da velocidade de acesso memória, como programas de ediço e compresso de vídeo e alguns jogos. Por outro causa no mínimo um certo desconforto no bolso, já que além de usar memória Rambus é preciso usar os módulos em pares. Se quiser 128 MB de memória, terá que usar obrgatoriamente dois módulos de 64 MB da mesma marca e velocidade. No existe a possibilidade de usar módulos RIMM de velocidades diferentes ou números ímpares.

módulo RIMM

 

:. Instalaço do Processador: novos coolers, fontes e gabinetes

O Pentium 4 utiliza como encaixe o soquete 423, semelhante ao soquete 370 utilizado pelo Pentium III e Celeron, mas naturalmente com mais contatos. A novidade fica por conta da instalaço do Cooler.

No Pentium 4, além de ser preso ao soquete através de presilhas, o cooler utiliza dois encaixes parafusados diretamente chapa do gabinete, através de 4 orifícios na placa me:

 

Nova furaço na chapa do gabinete

O problema aqui é que os gabinetes atualmente no mercado no possuem os 4 furos necessários para instalar os suportes. A soluço para usar um gabinete antigo aqui é marcar a posiço da placa me na chapa do gabinete e em seguida fazer voc mesmo os furos usando uma furadeira.

Estes suportes tornam-se necessários devido monstruosidade que so os coolers para Pentium 4, o cooler original da Intel, que acompanha os processadores Boxed por exemplo pesa quase meio quilo!. Definitivamente vai ser o fim dos coolers de 10 reais made in Paraguai :-)

 

O gigantesco cooler do Pentium 4

Uma novidade bem vinda é que o Pentium 4 trás de volta a chapinha metálica sobre o processador, o que acaba com os problemas de rachaduras no processador ao ser instalado o cooler, como vem acontecendo com alguns processadores Pentium III, Celeron, Duron e Athlon, soquetados, onde temos a parte traseira do processador (que é bem frágil) diretamente exposta.

Pentium 4: a chapa metálica protege o chip

Duron: O chip está exposto, podendo ser danificado
caso o cooler seja instalado com muita força

Juntamente com o Pentium 4, A Intel lançou também um novo padro de fontes de alimentaço, o ATX 2.03. O problema neste caso é que o Pentium 4 consome uma quantidade muito grande de eletricidade. O padro consiste em fontes que comprovadamente podem suportar esta demanda, e como garantia futura, as novas fontes trazem um novo conector de 12 volts. Este conector seria ligado diretamente a placa me visando aumentar o fornecimento elétrico para o processador. Este conector pode vir a ser necessário nas futuras geraçes do Pentium 4.

 

 

Novo conector da fonte

Por enquanto voc pode continuar utilizando fontes ATX normais no Pentium 4, apenas certifique-se de adquirir uma fonte de pelo menos 300 Watts e de boa qualidade, caso contrário pode ser que o micro montado no ligue ou fique travando devido deficincia no fornecimento elétrico da fonte.

 

:. Placas Me

As primeiras placas para o Pentium 4 incluem a Intel D850GB da própria Intel, assim como as placas P4T da Asus e a GA-8-TX da Gigabyte. Todos estes modelos so baseados no chipset i850 da Intel, o único disponível antes do lançamento do Pentium 4.

Como já citei, o maior defeito deste chipset, e consequentemente das placas mes com ele é o suporte exclusivo a memórias Rambus, que custam bem mais caro e, pior, precisam ser usadas em pares no Pentium 4 devido ao acesso a 32 bits. Nos próximos meses devemos ver chipsets tanto da Via quanto da Intel que suportem tanto memórias DDR quanto memórias SDRAM normais, o que ajudará a baratear bastante os micros baseados no Pentium 4.

 

:. Desempenho

Como disse no início deste artigo, a maioria das inovaçes trazidas pelo Pentium 4 visam diminuir a queda de performance causada pelo uso do Pipeline de 20 estágios. Este é o grande problema do Pentium 4: apesar de estar disponível em verses de clocks altíssimos, o processador perde tanto para o Pentium 3 quanto para o Athlon em uma base clock por clock em praticamente todos os aplicativos. É preciso um Pentium 4 de 1.4 GHz para conseguir superar o Pentium 3 de apenas 1 GHz por uma margem considerável, e mesmo assim, em alguns poucos aplicativos o Pentium 4, mesmo operando a uma freqüncia 40% superior chega a ficar muito próximo do seu antecessor. Comparado com o Athlon de 1.2 GHz, que seria seu concorrente direto, novos vexames: mesmo operando a uma freqüncia 200 Mhz superior, o Pentium 4 de 1.4 GHz, perde na maioria dos aplicativos. Na verdade, os únicos aplicativos atuais em que o Pentium 4 mostrou um desempenho convincente foi no Quake 3 (apenas no Quake 3, no em outros jogos) e na compresso de vídeo.

No futuro este cenário continuará se repetindo, pois devido sua arquitetura, o Pentium só conseguirá superar os Athlons e Pentiums 3 numa base clock por clock em aplicativos extremamente otimizados para o SSE2, ou em aplicativos que sejam muito dependentes da velocidade de acesso memória, como os aplicativos de compresso de vídeo e jogos que manipulem uma quantidade muito grande de texturas, com o Quake 3, já que graças ao uso de dois canais de memória Rambus, o Pentium 4 é o campeo neste quesito.

Como disse, a arquitetura do Pentium foi claramente desenvolvida para operar a altas freqüncias, e no necessariamente para competir com processadores do mesmo clock. Isto significa que o Pentium 4 sempre operará a freqüncias superiores s dos concorrentes, mas no necessariamente os superará em desempenho. O pior é que a estratégia pode dar certo já que ainda hoje muita gente acredita que "quanto mais Megahertz, mais rápido".

O Athlon atualmente opera a 1.2 GHz e esto agendados os lançamentos do Athlons de até 1,5 GHz e do Palomino. O Palomino é essencialmente um Athlon com modificaçes que visam alcançar freqüncias bem mais elevadas. As primeiras verses do Palomino operaro a 1.2 e 1.33 GHz, e sero lançadas entre fevereiro e março de 2001. Em maio/junho deverá ser lançada a verso de 1.5 GHz, seguida pela verso de 1.7 GHz.

Seguinte este cronograma, teremos no final de 2001 uma competiço direta entre o Pentium 4 de 2 GHz e o Athlon Palomino de 1.7 GHz, isto s vésperas do lançamento do Intel Itanium e do AMD ClawHammer. Provavelmente em Novembro de 2001 estarei justamente aqui escrevendo outra análise sobre o desempenho destes novos processadores. :-)

Como o Pentium 4 acabou se ser lançado, no tive a oportunidade de realizar testes detalhados de desempenho do novo processador, mas voc pode checar os benchmarks feitos por outros sites especializados. Todos mostram o desempenho do Pentium 4 em várias aplicaçes diferentes, incluindo jogos, e foram feitas por sites que considero confiáveis.

:. Benchs do Ace´s Hardware

:. Benchs do Anandtech

:. Benchs do Toms Hardware




Copyright 2003 Carlos E. Morimoto, http://www.guiadohardware.net - Todos os direitos reservados