TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

ATIVIDADES PRÁTICAS SUPERVISIONADAS ARQUITETURA DE COMPUTADORES

Pesquisas Acadêmicas: ATIVIDADES PRÁTICAS SUPERVISIONADAS ARQUITETURA DE COMPUTADORES. Pesquise 859.000+ trabalhos acadêmicos

Por:   •  1/10/2013  •  2.355 Palavras (10 Páginas)  •  572 Visualizações

Página 1 de 10

1 Comparativo dos Tipos de Processadores

1.a Processadores

Comparamos três dos principais processadores da marca Intel®, o Processador Intel® CoreTM i7-950 com 8M de memória Cache L3, velocidade de clock de 3,06 GHz, velocidade QPI do barramento frontal de 4.8 GT/s Intel® QPI, soquete FCLGA 1366 pinos e tecnologia 45nm com instruções de 64 bits, permitindo a execução de multitarefas com velocidade de 25% superior em relação aos processadores de sua geração anterior. Marcado por ser um processador da “primeira geração” de processadores multi-core da linha i7, possui 4 núcleos de processamento físicos e 4 threads simulados com a tecnologia Hyper-Threading, possui seu próprio controlador de memória, capaz de aceitar apenas memórias DDR3 de até 1.6V, sendo capaz de acessar os três módulos de memória de uma só vez com a arquitetura triple chanel. Como esse processador não possui um controlador PCI Express 2.0 integrado, ele utiliza um barramento chamado de QuickPath Interface QPI, responsável pela comunicação entre o processador e o chipset ponta norte. É capaz de utilizar o Modo Turbo (TURBO BOOST), que permite o processador aumentar o clock dos seus núcleos. Com novos conjuntos de instruções SSE4.2 que trazem 47 novas instruções para o processador e melhorias nas instruções SSE desalinhadas, aprimoramento na microarquitetura sendo capaz de suportar a fusão de instruções no modo 64 bits, controle de energia e o aumento no desempenho da tecnologia de virtualização.

O Processador Intel® CoreTM 2 DUO E7500 com 3M de memória cache L2 compartilhada, com velocidade de clock de 2,93 GHz, velocidade FSB do barramento frontal de 1066 MHz, soquete LGA 775 pinos e tecnologia de 45nm com instruções de 64 bits, processador da família Core 2 com arquitetura Core Intel® capaz de trabalhar com multitarefas tranquilhamente, possui 2 núcleos físicos com 1 thread para cada núcleo, seu acesso a memória é feita por um Hub Controlador de Memoria ou MCH do chipset, sendo assim quem especifica qual tipo de memória a ser usada é a placa mãe e não o processador. Com tecnologia de 64 bits própria da Intel, este processador possui o recurso EM64T (ExtendedMemory 64 Technology), que permite o uso de sistemas operacionais de 64 bits rodem programas de 32 bits e 16bits sem a necessidade de serem recompilados para a plataforma 64 bits, possuem também instruções SSE3 e SSE 4.1, este processador não possui tecnologia de virtualização e nem o Modo Turbo contidos em alguns modelos de processadores da mesma família Core 2 .

O Processador Pentium 4 HT Technology com 1M de memória cache L2, com velocidade de clock de 3.80 GHz, velocidade FSB do barramento frontal 800 MHz, soquete LGA 775 pinos e tecnologia de 90nm com instruções de 32 bits, processador da primeira família Pentium 4 HT com tecnologia Hyper-Threading, possui um núcleo físico com uma thread, o acesso a memória é feita por um HUB MCH do chipset que limita qual memória deverá ser usada. Possui uma arquitetura híbrida CISC/RISC aceitando instruções x86, já que todos os programas são escritos sob este tipo de instrução, o Pentium 4 é capaz de utilizar a tecnologia Modo Turbo (TURBO BOOST), onde o processador pode aumentar o clock do seu núcleo dependendo da instrução executada.

Observamos que existe sim uma evolução entre os modelos e gerações de processadores, o Intel® CoreTM i7-950 é a evolução da arquitetura Core, primeiro a possuir um controle de memoria integrado ao processador e ter 8 MB de memoria cache L3. O Intel® CoreTM 2 DUO E7500 foi criado com o conceito da tecnologia de multiplos núcleos para o uso de ‘multitarefas’ denominada arquitetura Core, baseada na arquitetura do Pentium III. Resolveu o problema de compartilhamento da memória cache L2 que seu antecessor o Pentium D tinha, onde ele alocava um valor fixo de 50%-50% para cada thread do processador, agora ele compartilha a mesma memoria cache L2 para as threads, fazendo o escalonamento de qual thread usará mais a memória cache.

O Intel®Pentium 4 3.8 GHz HT Technology foi o primeiro processador a usar a tecnologia 90mn e Hyper-Thrading, podendo elevar ainda mais o seu clock. Esta geração (Prescott) de processadores Pentium 4 supera a sua geração (NorthWood) anterior de Pentium 4, com algumas novidades nas instruções SSE3 e possuindo um gerenciamento térmico que diminui automaticamento o clock do processador caso ele detecte algum super aquecimento, este processador também era equipado com a tecnologia TURBO BOOST.

1.b Tabela de Processadores

Processador Intel® Core™ i7-950 Processor (8M Cache, 3.06 GHz, 4.80 GT/s Intel® QPI) Intel® Core™2 Duo Processor E7500 (3M Cache, 2.93 GHz, 1066 MHz FSB) Intel® Pentium® 4 Processor supporting HT Technology 3.80 GHz, 1M Cache, 800 MHz FSB

Codinome Bloomfield Wolfdale Prescott

Número processador I7-950 E7500 -

Nº Núcleos 4 2 1

Nº Treads 8 2 1

Velocidade clock 3,06GHz 2,93GHz 3.8GHz

Cache 8 MB Intel® Smart Cache 3 MB L2 Cache 1MB

Razão barramento/núcleo 23 11 -

Tipo de Barramento QPI FSB FBS

Barramento do sistema 4.8GT/s 1066MHz 800MHz

Conjunto de Instruções 64 bits 64 bits 32 bits

N° de transistores núcleo de processamento 731 million 228 million 125 million

Largura de banda máxima da memória 25.6 GB/s - -

Max TDP 130W 65W 65W

LowHalogenOptionsAvailable See MDDS See MDDS See MDDS

Tecnologia Hyper-Threading Intel Sim - -

Benchmark.exe

2 RISC: Características de execução de Instruções

2.1.a Explicar a saída do simulador

----- Trying to compile -----

0 : INP //Carrega a instrução na memória 0 onde será a entrada de dados

1 : OUT //Carrega a instrução na memória 3 onde será a saída de dados

2 : HLT //Carrega a instrução na memória 2 onde será encerrado o programa

----- Resolving Labels -----

----- Translating Mnemonics -----

Line 0 : INP

Opcode = 901 // INP foi trocado pela instrução 901

Line 1 : OUT

Opcode = 902 // OUT foi trocado pela instrução 902

Line 2 : HLT

Opcode = 0 // 0 é o encerramento do programa

----- Program Successfully Compiled -----

Restarting Processor // restaura o processo

Processor Starting // inicializa o processo

PC = 0 : Instruction in Memory 0 is 901 //armazena carrega a instrução 901 na primeira memória ou (PC)

--> 9 represents: INPUT or OUTPUT // 9 representa ENTRADA ou SAÍDA de dados

--> 01 represents: I/O channel (01 = input, 02 = output) // carrega a instrução 01 que é de ENTRADA

Input is required by instruction 1

--> Value 12 copied from inbox to Accumulator

PC = 1 : Instruction in Memory 1 is 902 //armazena carrega a instrução 902 na segunda memória ou (PC)

--> 9 represents: INPUT or OUTPUT // 9 representa ENTRADA ou SAÍDA de dados

--> 02 represents: I/O channel (01 = input, 02 = output) // carrega a instrução 02 que é de SAÍDA

--> Value 12 copied from Accumulator to outbox //

PC = 2 : Instruction in Memory 2 is 0

--> 0 represents: HALT

--> Execution Stopped

Processor Stopped

INP foi trocado pela instrução 901 e colocado no primeiro endereço de memória

OUT foi trocado pela instrução 902 e colocado no segundo endereço de memória

HLT encerra o programa

Pegou o valor digitado e colocou na saída

2.1.b O que significa PC e opcode no simulador?

PC(ProgramCounter) é um ponteiro que armazena o endereço de memória da próxima instrução que deve ser executada, OPCODE informa qual operação uma instrução será realizada.

2.1.c Qual o tamanho máximo do registrador AC desse simulador?

999 á 999

2.1.d O Processador LMC possui 11 instruções. Em um processador Intel 64, qual o tamanho das instruções desse processador. O processador Intel 64 usa instruções de tamanho fixo ou variável?

O tamanho das instruções da Intel 64 é de 64bits e são instruções de tamanhos variáveis.

2.1.e Explicar a vantagem em se utilizar um grande banco de registrados, qual a diferença entre processadores com 32 e 64 bits de bancos de registrados.

Uma grande vantagem em se ter um grande bando de registradores é rapidez em executar cálculos diretamente no processador sem a necessidade de uma de uma memória cache ou uma memória primária.

O processador de 64 bits possui o dobre de registradores do processador de 32 bits, sendo que o processador de 32 bits possui 8 registradores de 32 bytes de armazenamento.

2.1.f Construir uma estrutura de pipeline para esse processador. Usem as instruções de máquina do simulador. Disponível em:

<http://www.atkinson.yorku.ca/~sychen/research/LMC/LMCInstructions.html>.

INP // entrada de dados

STA VLO // armazena em VLO

LDA VLO // carrega o valor de VLO

OUT // saída de dados

VLO DAT // declaração do VLO

BRA 1 // define o calculador para o endereço de 1

2 INP // entrada de dados

STA VLO2 // armazena em VLO2

LDA VLO2 // carrega o valor de VLO2

OUT // saída de dados

VLO2 DAT // declaração do VLO2

BRA 3 // define o calculador para o endereço de 3

4 INP // entrada de dados

STA VLO3 // armazena em VLO3

LDA VLO3 // carrega o valor de VLO3

OUT // saída de dados

VLO3 DAT // declaração do VLO3

BRA 5 // define o calculador para o endereço 5

1 INP // entrada de dados

STA VALOR // armazena em VALOR

LDA VALOR // carrega o valor de VALOR

OUT // saída de dados

VALOR DAT // declaração do VALOR

BRA 2 // define o calculador para o endereço 2

3 INP // entrada de dados

STA VALOR2 // armazena em VALOR2

LDA VALOR2 // carrega o valor de VALOR2

OUT // saída de dados

VALOR2 DAT // declaração do VALOR2

BRA 4 // define o calculador para o endereço 4

5 INP // entrada de dados

STA VALOR3 // armazena em VALOR3

LDA VALOR3 // carrega o valor de VALOR3

OUT // saída de dados

VALOR3 DAT // declaração do VALOR3

BRA FIM // define o calculador para o endereço FIM

FIM HLT // FIM do programa

Processador CISC (ComplexInstruction Set Computing, ou “computador com um conjunto complexo de intruções”), são capazes de executar centenas de instruções complexas em sua micro programação, com isso sua performance pode ser menor. Implementada com micro-códigos em seu processador dificultando a alteração da lógica de tratamento de instruções, onde pode acarretar o alto custo do produto a nível de comercialização, está arquitetura usada em processadores Intel e AMD.

Processador RISC (ReducedInstruction Set Computing, ou “computador com um conjunto reduzido de instruções”), suportam uma quantidade limitada de instruções, mas favorecendo um conjunto simples e pequeno de instruções, tornando-o mais rápido pois as instruções são executadas diretamente pelo hardware e não por uma micro-programação. Esta arquitetura é muito utilizada em processadores para vídeo-game, pois o hardware será dedicado para jogos, usado também em processadores da linha POWERPC.

2.2.a Benchmark_etapa_2.exe

Executado no processador Core i7 950 3,07GHz

2.2.b Intel Core i7 950 3.07GHZ com 10³ instruções por clock.

Benchmark com 10³ instruções por clock.

TESTE 1

Tempo decorrido: 0

Tempo médio: 0

TESTE 2

Tempo decorrido: 0

Tempo médio: 0

TESTE 3

Tempo decorrido: 0

Tempo médio: 0

TESTE 4

Tempo decorrido: 0

Tempo médio: 0

2.2.c Intel Core i7 950 3.07GHZ com 106 instruções por clock.

Benchmark com 106 instruções por clock.

TESTE 1

Tempo decorrido: 0

Tempo médio: 0

TESTE 2

Tempo decorrido: 6

Tempo médio: 0,000000019544

TESTE 3

Tempo decorrido: 31

Tempo médio: 0,00000010097

TESTE 4

Tempo decorrido: 2.41667

Tempo médio: 0000000472313

2.2.d Intel Core i7 950 3.07GHZ com 108 instruções por clock.

Benchmark com 108 instruções por clock.

TESTE 1

Tempo decorrido: 38

Tempo médio: 0,000000123779

TESTE 2

Tempo decorrido: 566

Tempo médio: 0,00000184365

TESTE 3

Tempo decorrido: 3089

Tempo médio: 0,0000100619

TESTE 4

Tempo decorrido: 14518,98

Tempo médio: 0,0000472932

2.3 Benchmark Intel Core i7 2630QM 2.0GHz com tempo de execução

2.3.a Intel Core i7 2630QM 2.0GHZ com 10³ instruções por clock.

Benchmark com 10³ instruções por clock.

TESTE 1

Tempo execução: 0

Tempo médio: 0

TESTE 2

Tempo execução: 0

Tempo médio: 0

TESTE 3

Tempo execução:0

Tempo médio: 0

TESTE 4

Tempo execução: 0

Tempo médio: 0

2.3.b Intel Core i7 2630QM 2.0GHZ com 106 instruções por clock.

Benchmark com 106 instruções por clock.

TESTE 1

Tempo execução: 1 segundo

Tempo médio: 0,0000000009

TESTE 2

Tempo execução: 5 segundos

Tempo médio: 0,000000025

TESTE 3

Tempo execução:36 segundos

Tempo médio: 0,00000018

TESTE 4

Tempo execução: 2,91667 minutos

Tempo médio:0,000000875

Paralelismo no Nível de Instruções e Processadores Superescalares

O paralelismo ao nível de instrução é uma família de técnicas de desenvolvimento de processadores e compiladores que aumentam o desempenho dos computadores e vídeo games que suportam está tecnologia, tornando-os mais rápidos para que os mesmos possam fazer operações em paralelo de leitura e escrita de memória, soma de inteiros e multiplicação de pontos flutuantes. Com o paralelismo no nível de instrução surgiu as microarquiteturas superescalares que são capazes de iniciar instruções comuns simultaneamente e executá-las independentemente de maneira concorrente em múltiplos pipelines, o número máximo de instruções em uma etapa de pipeline é chamado de grau, onde um processador superescalar de grau 3 em leitura (fetch) é capaz de executar a leitura da instrução quatro instruções por ciclo.

Um processador Superescalar necessita de um pipeline com algumas etapas como:

* Leitura (fetch)

* Decodificação (decode)

* Lançamento (dispatch)

* Execução (execute)

* Escrita (writeback)

* Finalização (retirement)

E possui as seguintes unidades funcionais independentes:

* Unidade Lógica Aritmética (ALU)

* Unidade de leitura/gravação em memória (Load/Store Unit)

* Unidade de Ponto Flutuante (Floating Point Unit)

* Unidade de Salto (Branch Unit)

Para que o processador Superescalar execute corretamente as instruções simultaneamente e independentemente é necessário que não exista nenhuma dependência, tais como:

* Dependência estrutural – ocorre quando duas instruções requerem a mesma unidade funcional e seu numero não é suficiente.

* Dependência de dados – ocorre quando uma instrução necessita do resultado da outra instrução para ser executada.

* Dependência de escrita – ocorre quando duas instruções precisam escrever no mesmo endereço de memória.

* Dependência de controle – ocorre quando uma instrução depende de uma estrutura de controle e não se pode determinar o fluxo correto até a avaliação da unidade de controle.

Sendo que as dependências de um processador Superescalar podem ser tratadas de duas maneiras diferentes, estaticamente (durante a compilação) ou dinâmica (durante a execução do programa).

Com a evolução da arquitetura RISC e do POWERPC foi possível trazer para os vídeos games esta tecnologia, podendo melhorar ainda mais o desempenho dos consoles para jogos. Com isso as empresas Sony, Toshiba e IBM (STI) correram atrás para desenvolver o primeiro vídeo game com processador baseado na arquitetura RISC, tendo como base o processador do PowerPC e com core dinâmico, o processador recebeu o nome de Cell e possui 8 núcleos de processamento, sendo que os primeiros 6 núcleos são acessíveis para os desenvolvedores de jogos com capacidade de 3.2 GHz (SPE -Synergistic Processing Elements), o 7º núcleo é dedicado para operações de I/O (E/S) do console e o 8º e último é desabilitado para que exista melhorias futuras tanto no software que gerencia o console (S.O) chamado de XMB - XrossMediaBar quanto nos jogos que necessitam de mais recurso. Com esse avanço no hardware de um vídeo game o Playstation 3 foi um dos primeiros vídeos games a possuir um Sistema Operacional (XMB) para controlar melhor o seu hardware, e com isso disponibilizou outras vantagens do seu uso como uma central multimídia, sendo capaz de acessar a internet por meio de um browser, jogar on-line com outros proprietários de Playstation 3, jogos em 3D, assistir á filmes em 3D e High-Definition (HD 1080p) em mídias Blu-ray ou via Streaming de redes on-line, ouvir músicas e ver fotos.

4 Referências Bibliografias

Clube do Hardware

http://www.clubedohardware.com.br/artigos/Por-Dentro-da-Microarquitetura-Intel-Nehalem/1471/1 acessado 02/09/2013

http://www.clubedohardware.com.br/artigos/Todos-os-Modelos-do-Core-i7/1651/2 acessado 02/09/2013

http://www.clubedohardware.com.br/artigos/Todos-os-Modelos-do-Core-2/1264/1

http://www.clubedohardware.com.br/artigos/Por-Dentro-da-Microarquitetura-Intel-Core/1203/2

http://www.clubedohardware.com.br/artigos/1143

http://www.clubedohardware.com.br/artigos/1201

http://www.clubedohardware.com.br/artigos/Por-Dentro-da-Arquitetura-do-Pentium-4/1201/1

Intel

http://ark.intel.com/pt-br/products/27507/Intel-Pentium-4-Processor-supporting-HT-Technology-3_80-GHz-1M-Cache-800-MHz-FSB

http://ark.intel.com/pt-br/products/36503/Intel-Core2-Duo-Processor-E7500-(3M-Cache-2_93-GHz-1066-MHz-FSB)

http://ark.intel.com/pt-br/products/37150/Intel-Core-i7-950-Processor-(8M-Cache-3_06-GHz-4_80-GTs-Intel-QPI)

Intergames

http://local.intergames.co.uk/PLAYSTATION_3_Hardware_London-r1373727-London_EN.html

Scribd

http://pt.scribd.com/doc/94027608/03-Paralelismo-em-nivel-de-instrucoes-e-processadores-superescalares

Unicamp

http://www.ic.unicamp.br/~rodolfo/Cursos/mc722/2s2004/g14-Paralelismo_Instrucao-texto.pdf

Encydia

http://pt.encydia.com/es/Superescalar

...

Baixar como  txt (17.3 Kb)  
Continuar por mais 9 páginas »