:. Indique este site a um amigo...
 3284008 visitas desde 28/02/1999  |  Responsável: Carlos E. Morimoto
 :. Novo na área?! Leia nosso tutorial: Hardware para Iniciantes

Seções
Análises :. Pentium 4
Relacionados

+ HOME
   :. Análises
   :. Artigos
   :. Cursos Online
       :. Hardware
       :. Redes
       :. Linux (foca)
       :. Gravação CDs
       :. Notebooks
       :. Setup
   :. Livros
      
:. Entendendo e
    Dominando o Linux 4.Ed
   :. Arquivo DDD
   :. Dicionário
   :. FAQ
   :. Notícias
   :. Dicas Linux
   :. Overclock
   :. Tutoriais

+ Publicações
   :. CD GDH
   :. CDs Mandrake
   :. CDs do Linux
   :. E-Books

+ Kurumin Linux

+ Outros
   :. Fórum
   :. Humor
   :. Palm
   :. Quiz

+ Pesquisar no site:

+ Expediente

+ Comente esta
   Matéria

Dúvidas sobre
Linux?
Baixe o E-book
Entendendo e Dominando o Linux
de Carlos E. Morimoto
ou increva-se no
Curso de Linux
em SP


Invista em
conhecimento:
:.CD-ROM Guia do Hardware: Todos os e-books e uma cópia off-line de todo o site por R$ 21,00
:.Linux Mandrake 9.0 GDH, com manual em Português e aplicativos. 4 CDs por R$ 24,00
:. E-Books de Carlos E. Morimoto:
Manual de Hardware Completo 3ed.
Redes 3ed
Upgrade e Manutenção
Novas tecnologias 3Ed
Entendendo e Dominando o Linux
Dicionário Técnico de Informática. R$ 8,00

:. CDs do Linux:
Slackware 8.1 R$ 8,00
Red Hat 8.0 R$ 16,00
DemoLinux 3.0 R$ 8,00
Knoppix R$ 8,00
Peanut 9.1 R$ 8,00
FreeBSD R$ 20,00
NetBSD R$ 16,00
Libranet R$ 8,00
Debian 3.0 R$ 35,00
Definity R$ 8,00
E outras distribuições

 

Dicas do dia : Receba as atualizações do Guia do Hardware todos os dias, direto no seu e-mail. Clique aqui para se inscrever.
 

Data: 13.11.2000  :. Em Reformulação!
Tipo: Processadores
Fabricante: Intel
Por: Carlos E. Morimoto

 

   Análise Completa do Pentium 4

Depois de vários atrasos, finalmente o Pentium 4, conhecido anteriormente como Willamette chega ao mercado. As duas versões iniciais operam a respectivamente 1.4 e 1.5 GHz, estando anunciadas versões de até 2 GHz até o final de 2001. O preço também não fica atrás, a versão de 1.5 GHz custa nos EUA por volta de 1080 dólares, enquanto a versão de 1.4 GHz, também nos EUA custa 920 dólares. Aqui no Brasil os preços serão de 15 a 50% mais altos, dependendo do revendedor.

Outro ponto interessante sobre o Pentium 4 é que pelo menos por enquanto o único chipset disponível, o i850 da própria Intel suporta apenas memórias Rambus, o que obriga qualquer um interessado em adquirir um Pentium 4 a adquirir também módulos de memória Rambus. A boa notícia é que finalmente as memórias Rambus estão começando a chegar ao mercado com preços digamos aceitáveis. Nos EUA um módulo RIMM de 64 MB custa em média 99 dólares, contra 45 dólares em média por um módulo de 64 MB de memória PC-133. Ainda custa pelo menos o dobro, mas já é bem menos do que custava a alguns meses atrás. Lembrando que como veremos adiante, os módulos RIMM devem ser usados em pares no Pentium 4.

 

:. OEM x Boxed

Existem duas versões do Pentium 4, a Boxed e a OEM. Ao contrário de outros processadores, no caso no Pentium 4 a diferença entra as duas versões não é apenas o cooler. A versão Boxed do Pentium 4 já vem com 2 módulos de 64 MB de memória Rambus e cooler, enquanto na versão OEM temos apenas o processador. Considerando que a versão Boxed custa cerca de 100 dólares a mais, ela acaba sendo uma melhor opção em termos de custo, já que adiquiridos separadamente, os módulos de memória e o cooler custam muito mais que isto.

 

:. A Arquitetura

O primeiro alerta a se fazer sobre o Pentium 4 é que o aumento da freqüência de operação não significa um ganho automático de potência. Um Pentium 4 de 1.5 GHz não é 50% mais rápido que um Pentium 3 de 1 GHz. Um dado é o número de ciclos por segundo que o processador pode executar, outro é o que ele consegue processar em cada ciclo. Um 486 de 100 MHz por exemplo é muito mais lento que um Pentium de 75 MHz, apesar de operar a uma freqüência mais alta.

Para entender os pontos fortes e fracos do Pentium 4, onde ele é mais rápido e onde ele é mais lento, por que não começar analisando a arquitetura interna do processador?

A Intel batizou a nova arquitetura do Pentium 4 de "NetBurst". O Nome não tem nada a ver com o desempenho em redes ou na Internet, mas tenta ilustrar os novos recursos do processador, assim como dar um ar de superioridade. A arquitetura NetBurst é composta por 4 componentes: Hyper Pipelined Technology, Rapid Execution Engine, Execution Trace Cache e Bus de 400MHz. Vamos aos detalhes de cada uma das 4 tecnologias:

 

:. Hyper Pipelined Technology

Esta é a característica mais marcante do Pentium 4. O Pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividido o trabalho de processar as instruções. É como uma linha de produção com vários operários, onde cada um monta uma peça, até termos no final o produto completo. Apartir do 486, todos os processadores utilizam este recurso.

O Pentium III possui 10 estágios, o Athlon possui 11 estágios, enquanto o Pentium 4 possui nada menos que 20 estágios, daí o nome "Hyper Pipelined".

O uso de Pipeline permite que o processador possa processar várias instruções ao mesmo tempo, sendo que cada estágio cuida de uma fração do processamento. Quanto mais estágios, menor será o processamento executado em cada um. No caso do Pentium 4 cada estágio do Pipeline processa apenas metade do processado por um estágio do Pentium III, fazendo com que teoricamente o resultado final seja o mesmo, já que em compensação existem o dobro de estágios.

O uso de mais estágios permite que o processador opere a freqüências bem mais altas mais altas, já que cada estágio executa menos processamento. O grade problema neste caso é que os processadores atuais executam várias instruções simultaneamente, enquanto os programas são uma seqüência de instruções. O Pentium 4 processa três instruções por ciclo, o Pentium antigo (Pentium 1) processa duas, e assim por diante.

Caso as instruções seguintes não dependam do resultado da primeira, como uma seqüência de somas de vários números, por exemplo, então o processador não terá nenhum problema para resolvê-las rapidamente.

Caso porém tenhamos uma tomada de decisão, onde o processador precisa primeiro resolver uma instrução para saber qual caminho deve tomar, como por exemplo "Se A > 3 então B = C+5 senão B = C-5", entra em cena o recurso de execução especulativa, onde enquanto é resolvida a primeira instrução, o processador escolhe um dos caminhos possíveis para ir "adiantando o serviço" enquanto não sabe qual deverá seguir. Se ao saber o resultado da primeira instrução ver que tomou o caminho certo, simplesmente continuará apartir dali. Caso por outro lado o processador tenha adivinhado errado, então terá que jogar fora todo o trabalho já feito e tomar o outro caminho, perdendo muito tempo.

O Pentium 4 perde gritantemente nesse quesito, pois ele demora o dobro do tempo para processar a primeira instrução, já que ela é processada em 20 estágios, contra 10 do Pentium III. Isto significa que a cada tomada de decisão errada, serão perdidos pelo menos 20 ciclos de processamento, um eternidade, considerando que em média, 14% das instruções processadas são de tomada de decisão. Se por acaso o processador errasse 50% das previsões, então os 7% de erros de previsão resultariam numa diminuição de 30% do desempenho do processador em comparação com o antigo Pentium III.

Isto significa que a princípio o Pentium 4 é mais lento que um Pentium III do mesmo clock, podendo em compensação operar a freqüências mais altas. Todas as demais alterações feitas pela Intel, explicadas a seguir servem como paliativos para tentar diminuir a perda de desempenho trazida pelo maior número de estágios de Pipeline. Foi justamente devido a isto que a Intel optou por lançar diretamente os modelos de 1.4 e 1.5 GHz, pulando as versões de 1.1 e 1.2, que seriam o caminho mais óbvio já que o Pentium III ficou estacionado na versão de 1 GHz. Caso fosse lançado, um Pentium 4 de 1.1 GHz perderia para um Pentium III de 1 GHz em praticamente todas as aplicações.

Além da perda de desempenho, outro efeito colateral de se usar mais estágios de Pipeline é o fato de tornar o processador maior e mais complexo, fatalmente bem mais caro de se produzir. O Pentium 4 mede 217 milímetros quadrados, quase o dobro do Athlon, que mede 120 mm². Isto significa que o Pentium 4 é proporcionalmente mais caro de se produzir.

 

:. Execution trace Cache

O uso do cache L1 no Pentium 4 é no mínimo inovador. O Pentium 3 por exemplo tem 32 KB de cache L1, dividido em 2 blocos de 16 KB cada, para instruções e dados. O Athlon tem 128 KB de cache L1, também dividido em dois blocos. O Pentium 4 por sua vez tem apenas 8 KB de cache para dados e só. Só? Sim, só isso. Porém, ele traz duas inovações que compensam esta aparente deficiência. A primeira é que graças ao tamanho reduzido, o pequeno cache de dados tem um tempo de latência menor, ou seja é mais rápido que o cache L1 encontrado no Pentium III e no Athlon. Do ponto de vista dos projetistas da Intel, esta foi a melhor relação em termos de desempenho.

O cache de instruções por sua vez foi substituído pelo Execution trace Cache, que ao invés de armazenar instruções, armazena diretamente uOPs, que são as instruções já decodificadas, prontas para serem processadas. Isto garante que o cache tenha apenas um ciclo de latência, ou seja o processador não perde tempo algum ao utilizar um dados armazenado no trace cache, ao contrário do que acontecia no Pentium III, onde perdia-se pelo menos dois ciclos em cada leitura.

Apesar da Intel não divulgar o tamanho do trace cache, sabe-se que ele armazena 12.000 uOPs, o que provavelmente equivale a 96 KB de dados. Considerando-se a eficiência do cache este tamanho é surpreendente. Para mais detalhes sobre o funcionamento do cache, consulte meu tutorial sobre cache

Se você está em dúvida sobre o que é um "uOP", e como eles são produzidos e processados, aqui vai uma explicação resumida: Apesar dos processadores para micros PC continuarem usando o conjunto x86 de instruções, que é composto por 184 instruções, internamente eles são capazes de processar apenas instruções simples de soma e atribuição. Existe então um circuito decodificador, que converte as instruções complexas usadas pelos programas nas instruções simples entendidas pelo processador. Uma instrução complexa pode ser quebrada em várias instruções simples. No Pentium 4, cada instrução simples é chamada de "uOP". No Athlon cada conjunto de duas instruções ganha o nome de "macro-ops". Você pode encontrar mais detalhes na minha analise do AMD Athlon

 

:. Bus de 400 MHz

Visando concorrer com o bus EV6 do Athlon, que opera de 100 a 133 MHz, com duas transferências por ciclo, o que resulta na prática em freqüências de respectivamente 200 e 266 MHz, o Pentium 4 conta com um bus operando a 100 MHz, mas com 4 transferências por ciclo, o que equivale a um barramento de 400 Mhz.

O barramento controla a velocidade de comunicação entre o processador e o chipset. Um barramento mais rápido, não significa um ganho de performance, porém, um barramento insuficiente, causará perda de desempenho, fazendo com que o processador não consiga comunicar-se com os demais componentes à velocidade máxima.

Como tanto no Pentium 4, quanto no Athlon, o barramento é equivalente à velocidade do acesso à memória RAM, temos na prática um empate técnico.

 

:. Rapid Execution Engine

Todo processador atual é dividido em dois componentes básicos, as unidades de execução de inteiros e as unidades de ponto flutuante. A parte que processa as instruções envolvendo números inteiros é responsável pela maior parte das instruções, e pelo desempenho do processador nos aplicativos do dia a dia enquanto as unidades de ponto flutuante, que compõe o que chamamos de coprocessador aritmético é responsável pelo processamento das instruções envolvendo valores complexos, usadas por jogos e aplicativos gráficos.

A "Rapid Execution Engine" do Pentium 4 consiste num reforço nas unidades de inteiros do processador. O Pentium 4 possui um total de 5 unidades de processamento de inteiros, duas ALUs, que processam as instruções mais simples, duas GLUs, encarregadas de ler e gravar dados e uma terceira ALU, encarregada de decodificar e processar as instruções complexas, que embora em menor quantidade, sã as que tomam mais tempo do processador.

Este conjunto de 5 unidades de execução de inteiros é semelhando ao do Pentium III, porém, como diferencial, no Pentium 4 tanto as duas ALUs encarregadas das instruções simples, quanto as duas GLUs encarregadas das leituras e gravações são duas vezes mais potentes.

Segundo a Intel, as quatro unidades operam a uma freqüência duas vezes superior à do processador, o que sugere que num Pentium 4 de 1.5 GHz elas operem a 3 GHz. Porém, na verdade, cada unidade passa a ser composta por duas unidades trabalhando em paralelo. Com isto passa-se a processar duas instruções por ciclo, mas a freqüência de operação continua a mesma. Na prática, o slogan acaba sendo real, mas em termos técnicos é um dado distorcido.

Na teoria parece maravilhoso, mas existe um pequeno detalhe que elimina boa parte do ganho que seria de se esperar deste esquema. Apesar das duas ALUs de instruções simples terem ficado mais rápidas, visando justamente compensar a perda de desempenho trazida pelos 20 estágios de Pipeline do Pentium 4, a ALU de instruções complexas não teve a mesma evolução. Isto significa que ao passar a usar 20 estágios de Pipeline, esta terceira ALU tornou-se mais lenta que a mesma no Pentium III.

Temos então um cenário onde as instruções simples são rapidamente processadas, mas as instruções complexas ficam entaladas na vala comum da terceira ALU, causando uma grande perda de desempenho.

No coprocessador aritmético o cenário é ainda mais complicado, pois apesar das unidades de execução terem perdido desempenho devido ao Pipeline de 20 estágios, não houve nenhum avanço para equilibrar a balança, como tivemos nas unidades de inteiros. Pelo contrário, o coprocessador aritmético encolheu, tendo sido podadas duas das unidades de execução, uma das que processava instruções MMX e uma das que processava instruções SSE.

Ao invés de evoluir, como seria de se esperar, o coprocessador aritmético do Pentium 4 tornou-se ainda mais frágil do que o do Pentium 3, trazendo um cenário no mínimo curioso. Enquanto na época do Pentium II e do K6, a AMD competia com um processador que apesar de possuir um bom desempenho em aplicativos de escritório era literalmente massacrado nos jogos e aplicativos gráficos, temos agora com o Pentium 4 x Athlon um cenário semelhante, porém com os lados invertidos: A Intel ataca com um processador que é potente em inteiros, mas fraco em ponto flutuante.

Ironicamente, a solução da Intel para tentar diminuir a deficiência do processador em ponto flutuante é a mesma que a AMD usou na época do K6-2. Lembra-se do 3D-Now, as instruções incorporadas ao K6-2, que melhoravam seu desempenho nos jogos otimizados, fazendo com que em alguns títulos seu desempenho ficasse muito próximo ao de um Pentium II? A Intel optou por segui exatamente o mesmo caminho, incorporando 144 novas instruções ao Pentium 4, chamadas de SSE2, que visam melhorar seu desempenho os jogos e aplicativos gráficos.

 

:. SSE2

As "Double Precision Streaming SIMD Extensions" do Pentium 4 são 144 novas instruções de ponto flutuante de dupla precisão. Elas tem basicamente a mesma função das instruções SSE do Pentium III e do 3D-Now! Do Athlon: melhorar o desempenho do processador em aplicativos de ponto flutuante. A diferença é que as instruções do Pentium 4 são muito mais poderosas que os conjuntos anteriores, o que pode literalmente salvar a pátria do Pentium 4 caso realmente um grande número de aplicativos sejam bem otimizados para as novas instruções. A grande dúvida é que assim como nos conjuntos anteriores, é necessário que os aplicativos sejam reescritos a fim de utilizar as novas instruções. E isso, claro, pode demorar um bom tempo, dependendo de como for a vendagem do processador.

A AMD anunciou que sua próxima geração de processadores, o ClawHammer e Sledgehammer também suportarão o SSE2, mas eles devem estar no mercado apenas no final de 2001. Por enquanto o Pentium 4 ainda tem exclusividade. Vale lembrar que o Pentium 4 mantém compatibilidade com as instruções SSE do Pentium III, aproveitando a base de aplicativos otimizados que já existe.

 

:. Acesso à Memória

Apesar de trazer como desvantagem o fato de usar as caras memórias Rambus, o Pentium 4 está indiscutivelmente bem posicionado do ponto de vista do desempenho de acesso à memória. Acessando simultaneamente dois módulos RIMM temos um barramento de dados de 3.2 GB/s usado módulos PC-800, o que corresponde a três vezes o acesso permitido por módulos de memórias PC-133 comuns. Mesmo o Athlon usando memórias DDR fica para trás neste quesito

Por um lado isto ajuda bastante o processador em aplicativos dependentes da velocidade de acesso à memória, como programas de edição e compressão de vídeo e alguns jogos. Por outro causa no mínimo um certo desconforto no bolso, já que além de usar memória Rambus é preciso usar os módulos em pares. Se quiser 128 MB de memória, terá que usar obrigatoriamente dois módulos de 64 MB da mesma marca e velocidade. Não existe a possibilidade de usar módulos RIMM de velocidades diferentes ou números ímpares.

módulo RIMM

 

:. Instalação do Processador: novos coolers, fontes e gabinetes

O Pentium 4 utiliza como encaixe o soquete 423, semelhante ao soquete 370 utilizado pelo Pentium III e Celeron, mas naturalmente com mais contatos. A novidade fica por conta da instalação do Cooler.

No Pentium 4, além de ser preso ao soquete através de presilhas, o cooler utiliza dois encaixes parafusados diretamente à chapa do gabinete, através de 4 orifícios na placa mãe:

 

Nova furação na chapa do gabinete

O problema aqui é que os gabinetes atualmente no mercado não possuem os 4 furos necessários para instalar os suportes. A solução para usar um gabinete antigo aqui é marcar a posição da placa mãe na chapa do gabinete e em seguida fazer você mesmo os furos usando uma furadeira.

Estes suportes tornam-se necessários devido à monstruosidade que são os coolers para Pentium 4, o cooler original da Intel, que acompanha os processadores Boxed por exemplo pesa quase meio quilo!. Definitivamente vai ser o fim dos coolers de 10 reais made in Paraguai :-)

 

O gigantesco cooler do Pentium 4

Uma novidade bem vinda é que o Pentium 4 trás de volta a chapinha metálica sobre o processador, o que acaba com os problemas de rachaduras no processador ao ser instalado o cooler, como vem acontecendo com alguns processadores Pentium III, Celeron, Duron e Athlon, soquetados, onde temos a parte traseira do processador (que é bem frágil) diretamente exposta.

Pentium 4: a chapa metálica protege o chip

Duron: O chip está exposto, podendo ser danificado
caso o cooler seja instalado com muita força

Juntamente com o Pentium 4, A Intel lançou também um novo padrão de fontes de alimentação, o ATX 2.03. O problema neste caso é que o Pentium 4 consome uma quantidade muito grande de eletricidade. O padrão consiste em fontes que comprovadamente podem suportar esta demanda, e como garantia futura, as novas fontes trazem um novo conector de 12 volts. Este conector seria ligado diretamente a placa mãe visando aumentar o fornecimento elétrico para o processador. Este conector pode vir a ser necessário nas futuras gerações do Pentium 4.

 

 

Novo conector da fonte

Por enquanto você pode continuar utilizando fontes ATX normais no Pentium 4, apenas certifique-se de adquirir uma fonte de pelo menos 300 Watts e de boa qualidade, caso contrário pode ser que o micro montado não ligue ou fique travando devido à deficiência no fornecimento elétrico da fonte.

 

:. Placas Mãe

As primeiras placas para o Pentium 4 incluem a Intel D850GB da própria Intel, assim como as placas P4T da Asus e a GA-8-TX da Gigabyte. Todos estes modelos são baseados no chipset i850 da Intel, o único disponível antes do lançamento do Pentium 4.

Como já citei, o maior defeito deste chipset, e consequentemente das placas mães com ele é o suporte exclusivo a memórias Rambus, que custam bem mais caro e, pior, precisam ser usadas em pares no Pentium 4 devido ao acesso a 32 bits. Nos próximos meses devemos ver chipsets tanto da Via quanto da Intel que suportem tanto memórias DDR quanto memórias SDRAM normais, o que ajudará a baratear bastante os micros baseados no Pentium 4.

 

:. Desempenho

Como disse no início deste artigo, a maioria das inovações trazidas pelo Pentium 4 visam diminuir a queda de performance causada pelo uso do Pipeline de 20 estágios. Este é o grande problema do Pentium 4: apesar de estar disponível em versões de clocks altíssimos, o processador perde tanto para o Pentium 3 quanto para o Athlon em uma base clock por clock em praticamente todos os aplicativos. É preciso um Pentium 4 de 1.4 GHz para conseguir superar o Pentium 3 de apenas 1 GHz por uma margem considerável, e mesmo assim, em alguns poucos aplicativos o Pentium 4, mesmo operando a uma freqüência 40% superior chega a ficar muito próximo do seu antecessor. Comparado com o Athlon de 1.2 GHz, que seria seu concorrente direto, novos vexames: mesmo operando a uma freqüência 200 Mhz superior, o Pentium 4 de 1.4 GHz, perde na maioria dos aplicativos. Na verdade, os únicos aplicativos atuais em que o Pentium 4 mostrou um desempenho convincente foi no Quake 3 (apenas no Quake 3, não em outros jogos) e na compressão de vídeo.

No futuro este cenário continuará se repetindo, pois devido à sua arquitetura, o Pentium só conseguirá superar os Athlons e Pentiums 3 numa base clock por clock em aplicativos extremamente otimizados para o SSE2, ou em aplicativos que sejam muito dependentes da velocidade de acesso à memória, como os aplicativos de compressão de vídeo e jogos que manipulem uma quantidade muito grande de texturas, com o Quake 3, já que graças ao uso de dois canais de memória Rambus, o Pentium 4 é o campeão neste quesito.

Como disse, a arquitetura do Pentium foi claramente desenvolvida para operar a altas freqüências, e não necessariamente para competir com processadores do mesmo clock. Isto significa que o Pentium 4 sempre operará a freqüências superiores às dos concorrentes, mas não necessariamente os superará em desempenho. O pior é que a estratégia pode dar certo já que ainda hoje muita gente acredita que "quanto mais Megahertz, mais rápido".

O Athlon atualmente opera a 1.2 GHz e estão agendados os lançamentos do Athlons de até 1,5 GHz e do Palomino. O Palomino é essencialmente um Athlon com modificações que visam alcançar freqüências bem mais elevadas. As primeiras versões do Palomino operarão a 1.2 e 1.33 GHz, e serão lançadas entre fevereiro e março de 2001. Em maio/junho deverá ser lançada a versão de 1.5 GHz, seguida pela versão de 1.7 GHz.

Seguinte este cronograma, teremos no final de 2001 uma competição direta entre o Pentium 4 de 2 GHz e o Athlon Palomino de 1.7 GHz, isto às vésperas do lançamento do Intel Itanium e do AMD ClawHammer. Provavelmente em Novembro de 2001 estarei justamente aqui escrevendo outra análise sobre o desempenho destes novos processadores. :-)

Como o Pentium 4 acabou se ser lançado, não tive a oportunidade de realizar testes detalhados de desempenho do novo processador, mas você pode checar os benchmarks feitos por outros sites especializados. Todos mostram o desempenho do Pentium 4 em várias aplicações diferentes, incluindo jogos, e foram feitas por sites que considero confiáveis.

 

:. Benchs do Ace´s Hardware

:. Benchs do Anandtech

:. Benchs do Toms Hardware


 

© 1999 - 2002 :. Todos os direitos reservados :. Carlos E. Morimoto
Melhor visualizado em qualquer browser. Você escolhe o que usar, não nós :-)