TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Estatistica Descritiva

Trabalho Universitário: Estatistica Descritiva. Pesquise 860.000+ trabalhos acadêmicos

Por:   •  31/1/2014  •  10.097 Palavras (41 Páginas)  •  1.657 Visualizações

Página 1 de 41

 











 



 

   



 









 



INTRODUÇÃO

O cidadão comum pensa que a estatística se resume apenas a apresentar

tabelas de números em colunas esportivas e ou econômicas de jornais e revistas,

ilustradas com gráficos, pilhas de moedas, etc. ou quando muito associam a

estatística à previsão de resultados eleitorais. Mas estatístico de hoje não se limita a

compilar tabelas de dados e os ilustrar graficamente. Pois á partir de 1925, com os

trabalhos de Fisher, a estatística iniciou-se como método científico, então, o

trabalho do estatístico passou a ser o de ajudara planejar experimentos, interpretar

e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a

tomada de decisões razoáveis. Deste modo, podemos então definir estatística como

sendo a ciência que se preocupa com a coleta, organização, apresentação, análise e

interpretação de dados. Didaticamente podemos dividir a estatística em duas

partes: a estatística descritiva e a inferência estatística. A estatística descritiva se

refere à maneira de apresentar um conjunto de dados em tabelas e gráficos, e ao

modo de resumir as informações contidas nestes dados a algumas medidas. Já a

inferência estatística baseia-se na teoria das probabilidades para estabelecer

conclusões sobre todo um grupo (chamado população), quando se observou apenas

uma parte (amostra) desta população. É necessário ter em mente que a estatística é

uma ferramenta para o pesquisador, nas respostas dos “por quês" de seus

problemas. E que para ela ser bem usada é necessário conhecer os seus

fundamentos e princípios, e acima de tudo que o pesquisador desenvolva um

espírito crítico e jamais deixe de pensar. Pois "em ciência é fácil mentir usando a

estatística, o difícil é falar a verdade sem usar a estatística".

1. CONCEITOS BÁSICOS

1.1 O QUE É A ESTATÍSTICA?

Podemos dizer, de uma forma bem simplificada, que:

ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve

para estudar e medir os fenômenos coletivos.

1 Agradecimento especial à profa. Sandra Regina Peres da Silva por ter cedido o original para adaptação

2

Tentando ser um pouco mais rigoroso, podemos dizer que:

ESTATÍSTICA é a ciência que estuda as técnicas necessárias para coletar,

organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a

respeito de uma população.

POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que

interessam ao estudo de um fenômeno coletivo segundo alguma característica.

AMOSTRA é qualquer subconjunto não vazio de uma população.

PARÂMETRO é uma característica numérica estabelecida para toda uma

população.

ESTIMADOR é uma característica numérica estabelecida para uma amostra.

Exemplo:

Fenômeno coletivo: eleição para governador do Estado de Goiás.

População: conjunto de todos os eleitores do estado.

Parâmetro: proporção de votos de um certo candidato X.

Amostra: grupo de 1.000 eleitores selecionados em todo o estado.

Estimador: proporção de votos do candidato X, obtida na amostra.

Dentre os modelos estatísticos podemos destacar os seguintes:

CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos

de uma população.

AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer

generalizações sobre a população sem precisar examinar cada um de seus

elementos.

Principais propriedades do Censo:

• Confiabilidade 100%

• Custo elevado

• Lento

• Nem sempre é viável

Principais propriedades da Amostragem:

• Confiabilidade menor que 100%

• Mais barata que o Censo

• Mais rápida que o Censo

• É sempre viável

3

1.2 PARTES DA ESTATÍSTICA

Estatística Descritiva – é a parte da Estatística que trabalha com a organização e a

apresentação dos dados.

Estatística Indutiva ou Inferência Estatística – é a parte da Estatística que

trabalha com análise e interpretação dos dados, com o objetivo de obter e

generalizar conclusões para a população a partir de uma amostra.

Inicialmente vamos nos dedicar ao estudo da Estatística Descritiva.

Posteriormente, abordaremos alguns aspectos da Inferência Estatística.

1.3 ATRIBUIÇÕES DA ESTATÍSTICA DESCRITIVA

• Obtenção ou coleta de dados – normalmente feita através de um questionário ou

de observação direta

• Organização dos dados – consiste na ordenação e crítica dos dados

• Apresentação dos dados – através de tabelas e gráficos

• Obtenção de algumas informações como médias, proporções, dispersões,

índices que facilitam a descrição dos fenômenos observados.

Passamos a descrever os conceitos envolvidos em um estudo da Estatística

Descritiva.

DADO ESTATÍSTICO é toda informação devidamente coletada e registrada.

Todo dado se refere a uma variável.

POPULAÇÃO

AMOSTRA

informações

(conclusões / tomada de decisões)

Análise e interpretação dos dados

(usando técnicas estatísticas)

Coleta

4

VARIÁVEL é uma característica dos elementos de uma população ou de uma

amostra, que pode assumir diferentes valores, sejam numéricos ou não, e que

interessa ao estudo.

1.3.1 CLASSIFICAÇÃO DAS VARIÁVEIS

Variável Qualitativa: tipo de variável que não pode ser medida numericamente.

Exemplos: cor dos cabelos, marca de refrigerantes, cor dos olhos, etc.

As variáveis qualitativas se classificam em dois tipos:

- Variável Qualitativa Ordinal: quando seus elementos têm relação de ordem.

Exemplos: colocação – primeiro lugar, segundo lugar, etc.

conceito – ótimo, bom, regular, péssimo.

- Variável Qualitativa Nominal: quando seus elementos são identificados por um

nome.

Exemplos: cor dos olhos, marcas de carro, etc.

Variável Quantitativa: tipo de variável que pode ser medida numericamente.

Exemplos: peso, altura, número de faltas, número de gols, etc.

Já as variáveis quantitativas têm as seguintes classificações:

- Variável Quantitativa Discreta: tipo de variável que só pode assumir valores

pertencentes a um conjunto enumerável. Normalmente seus valores estão

associados a característica de contagem.

Exemplos: número de carros vendidos, número de filhos, etc.

- Variável Quantitativa Contínua: tipo de variável que pode assumir qualquer

valor num intervalo de valores. Normalmente seus valores estão associados a

característica de medidas.

Exemplos: altura das pessoas, peso dos recém-nascidos, etc.

Variável

Qualitativa

Quantitativa

Ordinal

Nominal

Discreta

Contínua

5

Obs.: a variável idade, apesar de ser representada, geralmente, por números

inteiros, é uma variável contínua, pois está relacionada com o tempo, que é uma

variável contínua.

1.3.2 ORGANIZAÇÃO DE DADOS EM TABELAS

Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de

dados estatísticos.

São elementos das tabelas:

Título – texto conciso, indicador do conteúdo de uma tabela. Localizado no topo

da tabela, responde às perguntas: O quê? Quando? Onde?

Corpo – conjunto de linhas e colunas que contém informações sobre a variável em

estudo. Cada cruzamento de uma linha com uma coluna constitui uma casa ou

célula.

Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas.

Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada

linha contém.

Fonte – identificador do responsável (pessoa física ou jurídica) pelo fornecimento

dos dados. Não se indica a fonte no caso em que a tabela é apresentada pelo

próprio pesquisador, ou pelo próprio grupo de pesquisadores, ou pela própria

instituição que obteve os dados. É inscrita na primeira linha do rodapé (parte

inferior da tabela) e deve ser precedida da palavra Fonte:.

Notas – são informações de natureza geral que servem para esclarecer o conteúdo

das tabelas ou para explicar o método utilizado no levantamento dos dados. As

notas são colocadas logo após a fonte.

Chamadas – são informações de natureza específica que servem para explicar ou

conceituar determinados dados. As chamadas são inscritas no rodapé após a Fonte

e as Notas.

As chamadas devem obedecer às seguintes regras:

a) A chamada deve ser indicada por algarismo arábico, ou por asterisco, entre

parênteses. A chamada deve ser escrita à esquerda da casa, quando feita no

corpo da tabela, e à direita da coluna indicadora, quando feita nessa coluna.

b) Se houver mais de uma chamada na mesma tabela, elas devem ser numeradas

sucessivamente, de cima para baixo e da esquerda para a direita.

6

c) As chamadas são colocadas no rodapé da tabela, em ordem numérica e

separadas por pontos.

d) Quando a tabela ocupa várias páginas, as chamadas devem ser apresentadas na

página em que aparecem.

Exemplo de tabela:

PRODUÇÃO BRASILEIRA DE CAFÉ Título

1991-1995

Coluna ANOS PRODUÇÃO (1.000 t) Cabeçalho

Indicadora 1991 2.535

1992 2.666 Casa ou célula

1993 2.122

1994 3.750

1995 2.007

Rodapé FONTE: IBGE Corpo

1.3.3 NORMAS PARA APRESENTAÇÃO DE TABELAS

a) as tabelas devem ser delimitadas, no alto e em baixo, por traços horizontais;

b) as tabelas não devem ser delimitadas, à direita e à esquerda, por traços verticais;

c) o cabeçalho deve ser delimitado por traços horizontais;

d) podem ser feitos traços verticais no interior da tabela, separando as colunas;

e) as tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo

quando não se lê o texto em que estão apresentadas;

f) as tabelas devem ser numeradas com algarismos arábicos;

g) a tabela deve ser colocada no texto em posição tal que não exija, para a leitura,

rotação da página em sentido horário;

h) quando dois ou mais tipos de informação tiverem sido agrupados em um só

conjunto, esse conjunto entra na tabela sob a denominação “outros”;

i) as tabelas podem apresentar dados obtidos através de perguntas ou de

entrevistas. Nesses casos, se parte das pessoas não respondeu a determinada

pergunta, essa informação deve ser apresentada na tabela sob a especificação

“sem declaração”;

j) nenhuma célula da tabela deve ficar em branco. Toda célula deve apresentar um

número ou um sinal, conforme a convenção:

... dado numérico não disponível

7

- dado numérico igual a zero não resultante de arredondamento.

0 quando o valor é muito pequeno para ser expresso pela unidade

utilizada

x dado omitido, a fim de evitar a individualização da informação

k) as tabelas muito longas precisam ser apresentadas em duas ou mais páginas.

Nesses casos, o cabeçalho deve ser repetido em todas as páginas, mas o título é

escrito apenas na primeira. Nas demais páginas escreve-se, em lugar do título,

“continua” e na última escreve-se “conclusão”. Só deve ser feito o traço

inferior, que delimita a tabela, na última página;

l) as tabelas com muitas linhas e poucas colunas ficam melhor apresentadas

quando as colunas são organizadas em duas ou mais partes, escritas lado a lado.

Essas partes são separadas por dois traços verticais. Nesses casos, o cabeçalho

deve indicar o conteúdo das colunas em todas as partes;

m) as tabelas com muitas colunas precisam ocupar duas páginas que se

confrontam. Para facilitar a leitura, todas as linhas devem receber um número

de ordem. O número de ordem deve ser escrito na primeira coluna da página à

esquerda e na última coluna da página à direita;

n) o total é geralmente apresentado na última linha, entre dois traços horizontais,

embora também possa ser apresentado na primeira linha.

1.4 SÉRIES ESTATÍSTICAS

Uma série estatística é toda tabela que apresenta a distribuição de um conjunto de

dados estatísticos em função do tempo, do local ou do fenômeno.

Tipos Básicos de Séries:

• Temporal, Cronológica ou Histórica

• Geográfica, Territorial ou de Localização

• Categórica ou Específica

Série Temporal: usada para apresentar dados observados em determinado local,

discriminados ao longo do tempo.

8

Exemplo:

Produção Brasileira de Motos

1996-1998

Ano Produção (unidades)

1996 288.073

1997 426.547

1998 476.655

Fonte: Revista ISTO É – no1546

Apresentação do tempo:

• Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus

períodos inicial e final ligados por um hífen (-).

Exemplos:

1991 – 1995 apresenta dados numéricos para os anos de 1991, 1992, 1993,

1994, 1995;

Out 1991 – Mar 1992 apresenta dados numéricos para os meses de outubro,

novembro e dezembro de 1991 e janeiro, fevereiro e março de 1992.

• Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por

seus períodos inicial e final ligados por barra (/).

Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de

apresentar dados numéricos para algum (ns) dos anos desta série.

Série Geográfica: usada para apresentar dados de diferentes regiões geográficas,

em determinado tempo.

Exemplo:

Vacinação contra a Poliomielite

1993

Regiões Quantidade

Norte 211.209

Nordeste 631.040

Sudeste 1.119.708

Sul 418.785

Centro-Oeste 185.823

Fonte: Ministério da Saúde

9

Série Categórica: usada para apresentar dados que se distribuem em diferentes

categorias, em determinado tempo e local.

Exemplo:

Avicultura Brasileira

1992

Espécies Número

(1.000 cabeças)

Galinhas 204.160

Galos, frangos, frangas e pintos 435.465

Codornas 2.488

Fonte: IBGE

Séries Mistas ou Conjugadas (tabela de dupla entrada): quando são feitas

combinações de duas ou mais séries.

Exemplo:

Exportação Brasileira

1985/1995

Importadores 1985 1990 1995

América Latina 13,0 13,4 25,6

EUA e Canadá 28,2 26,3 22,2

Europa 33,9 35,2 20,7

Ásia e Oceania 10,9 17,7 15,4

África e Oriente Médio 14,0 8,8 5,5

Fontes: MIC e SECEX

Nota: Valores em percentagem

1.5 REPRESENTAÇÃO GRÁFICA DAS SÉRIES ESTATÍSTICAS

Os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo,

ajudando a visualizar as tendências e a interpretar os valores representativos deste

fenômeno.

Requisitos Fundamentais na Representação Gráfica:

• O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno

em estudo;

• Todo gráfico deve ter título e escala, para que possa ser interpretado sem que

haja necessidade de esclarecimentos adicionais no texto;

• O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE

escreve o título acima do gráfico;

10

• As variáveis devem ser claramente identificadas;

• A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os

valores iniciais dos dados são muito altos, deve ser feita uma interrupção no

eixo, com indicação clara da posição do zero;

• O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais

leve do que a parte do gráfico que se pretende evidenciar;

• Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o

gráfico é feito dentro de um retângulo.

Principais Tipos de Gráficos: • Diagramas

• Cartogramas

• Pictogramas

Cartogramas: São representações através de mapas (cartas geográficas). Este

gráfico é empregado quando o objetivo é o de relacionar os dados estatísticos

diretamente com áreas geográficas ou políticas.

Pictogramas: É a representação gráfica através de figuras. Por se tratar de uma

apresentação atraente, é um gráfico que desperta muito a atenção do leitor.

Diagramas: São gráficos geométricos construídos, em geral, no sistema

cartesiano.

Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em

Barras, Gráfico em Colunas ou em Barras Múltiplas e Gráfico em Setores.

Gráfico em Linha: Usado para apresentar as séries temporais. Representado num

sistema de coordenadas cartesianas, cada par de valores da série corresponde a um

ponto. Estes pontos são unidos por segmentos de reta.

Exemplo:

Tabela 1

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

ANOS PRODUÇÃO (1.000 t)

1991 2.535

1992 2.666

1993 2.122

1994 3.750

1995 2.007

FONTE: IBGE

11

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

0

500

1.000

1.500

2.000

2.500

3.000

3.500

4.000

1991 1992 1993 1994 1995

ANOS

PRODUÇÃO (1.000t)

Regras para a elaboração de um gráfico em linhas:

• Fixe a largura (l) do gráfico;

• Determine a altura máxima e a altura mínima de acordo com as normas a

seguir:

hmín = 60% da largura e hmáx = 80% da largura

• Determine os limites da escala, dividindo o maior valor a representar pela altura

máxima e pela altura mínima;

• Determine a escala, escolhendo um valor, de preferência inteiro, entre os

valores encontrados para limites;

• Trace um sistema de coordenadas cartesianas;

• Determine, graficamente, todos os pontos da série;

• Ligue esses pontos, dois a dois, por segmentos de reta;

• Identifique, claramente, as variáveis nos dois eixos;

• Acrescente o Título, a Fonte e a Legenda (quando necessária).

Gráfico em Colunas: Usado para representar as séries cronológicas, geográficas e

categóricas. Representado por meio de retângulos de mesma base, dispostos

verticalmente (em colunas).

Exemplo:

12

Tabela 1

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

ANOS PRODUÇÃO (1.000 t)

1991 2.535

1992 2.666

1993 2.122

1994 3.750

1995 2.007

FONTE: IBGE

PRODUÇÃO BRASILEIRA DE CAFÉ

1991-1995

0

500

1.000

1.500

2.000

2.500

3.000

3.500

4.000

1991 1992 1993 1994 1995

ANOS

PRODUÇÃO (1.000t)

Gráfico em Barras: Usado para representar as séries geográficas e categóricas.

Representado por meio de retângulos dispostos horizontalmente (em barras).

Exemplo:

13

Tabela 2

EXPORTAÇÕES BRASILEIRAS

MARÇO – 1995

ESTADOS VALOR (US$ milhões)

São Paulo 1.344

Minas Gerais 542

Rio Grande do Sul 332

Espírito Santo 285

Paraná 250

Santa Catarina 202

FONTE: SECEX

E X P O R T A Ç Õ E S B R A S IL E IR A S

M A R Ç O - 1 9 9 5

0 5 0 0 1 . 0 0 0 1 . 5 0 0

S ã o P a u l o

M i n a s G e r a i s

R i o G r a n d e d o S u l

E s p í r i t o S a n t o

P a r a n á

S a n t a C a t a r i n a

V a l o r ( U S $ m i l h õ e s )

OBSERVAÇÕES:

1) O procedimento para a construção de um gráfico em colunas (ou barras) é

análogo ao do gráfico em linhas, observando que no gráfico em barras deve-se

fazer a inversão nos eixos cartesianos (o eixo x corresponde a altura e o eixo y

corresponde a largura).

2) Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência

ao gráfico em barras (séries geográficas e específicas).

Gráfico em Colunas ou em Barras Múltiplas: Usado para representar as séries

conjugadas.

Exemplo:

14

Tabela 3

BALANÇA COMERCIAL DO BRASIL

1989 – 1993

ESPECIFICAÇÕES VALOR (US$ 1.000.000)

1989 1990 1991 1992 1993

Exportação (FOB) 34.383 31.414 31.620 35.793 38.783

Importação 18.263 20.661 21.041 20.554 25.711

FONTE: Ministério da Fazenda

BALANÇA COMERCIAL DO BRASIL

1989-1993

0

5.000

10.000

15.000

20.000

25.000

30.000

35.000

40.000

45.000

1989 1990 1991 1992 1993

Valor (us$ 1.000.000)

Exportação (FOB) Importação

Gráfico em Setores: Construído com base em um círculo, este gráfico é usado

para comparar proporções.

Exemplo:

15

Tabela 4

REBANHO SUINO DO SUDESTE DO BRASIL

1992

ESTADOS QUANTIDADE (mil cabeças)

Minas Gerais 3.363,7

Espírito Santo 430,4

Rio de Janeiro 308,5

São Paulo 2.035,9

Total 6.138,5

FONTE: IBGE

REBANHO SUÍNO DO SUDESTE DO BRASIL 1992

55%

33%

5%

7%

Minas Gerais Espírito Santo Rio de Janeiro São Paulo

Regras para a elaboração de um gráfico em setores:

• Trace uma circunferência. A área do círculo representa o total, isto é, 100%,

devendo ser dividida em tantos setores quantas sejam as partes.

• Lembre-se de que uma circunferência tem 360°. Então, se ao total

correspondem 360°, a cada parte corresponderá um setor cujo ângulo x é dado

por:

TOTAL

PARTE

x

× 360

=

• Marque os valores dos ângulos calculados na circunferência e trace os raios,

separando os setores.

• Para facilitar a distinção, faça um tracejado diferente em cada setor.

• Coloque título e legenda no gráfico.

OBS.: Para clareza dos dados, deve-se usar no máximo sete setores.

16

1.6 DISTRIBUIÇÃO DE FREQUÊNCIAS

Freqüentemente, ao coletar dados, o pesquisador se depara com uma grande

massa de valores numéricos, que se repetem algumas vezes, dificultando sua

análise e interpretação. Surge então a necessidade de organizar esses dados em

uma tabela onde os valores observados se apresentam associados individualmente

ou em classes com os números de suas repetições, isto é, com suas respectivas

freqüências. Esta tabela recebe o nome de Distribuição de Freqüências.

De acordo com a disposição dos dados têm-se dois tipos de distribuição:

1.6.1 Distribuição de Freqüências Simples (dados não agrupados ou não

tabulados em classes de valores)

É uma tabela onde os valores da variável analisada aparecem individualmente

correlacionados com os números de suas repetições (freqüências).

Esse tipo de distribuição é normalmente usado para representar variáveis

discretas.

Exemplo:

Tabela 1

Construtora Aimorés – Número de Acidentes Registrados

Janeiro de 2000

Nº de Acidentes Nº de Dias

0 18

1 5

2 2

3 2

4 3

5 1

Total 31

FONTE: Dados Hipotéticos

1.6.2 Distribuição de Freqüências por Classes (dados agrupados ou

tabulados em classes de valores)

Quando a variável analisada apresenta um grande número de valores torna-se

mais vantajoso o agrupamento destes em classes de freqüência, evitando assim

grande extensão da tabela e facilitando a visualização do fenômeno como um todo.

17

A distribuição de freqüências por classes é uma tabela onde os valores

observados são agrupados em classes, isto é, em intervalos de variações da variável

em questão.

Esse tipo de distribuição é normalmente usado para representar variáveis

contínuas. É utilizada também para representar variáveis discretas em um grande

número de valores observados.

Exemplo:

Tabela 2

Salários dos funcionários da Loja XY

Salários (R$) Nº de funcionários

1000 1200 2

1200 1400 6

1400 1600 10

1600 1800 5

1800 2000 2

Total 25

FONTE: Dados Hipotéticos

A seguir são apresentados alguns conceitos fundamentais para a compreensão

dessas séries.

Dados Brutos

É a apresentação dos dados observados na seqüência em que foram coletados, isto

é, sem nenhuma ordenação numérica.

Exemplo:

O número de peças defeituosas obtidas da produção de uma máquina durante vinte

dias foi:

2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 – 0 – 1 – 2

Rol

É a organização dos dados brutos em ordem crescente ou decrescente.

Exemplo:

O rol do exemplo anterior é:

0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5

18

Amplitude Total (AT)

É a diferença entre o maior valor e o menor valor da seqüência dos dados

observados.

AT = valor máximo – valor mínimo

Exemplo:

A amplitude total do rol apresentado é: AT = 5 – 0 = 5

Freqüência Absoluta Simples (ou simplesmente freqüência)

Denotada por Fi, a freqüência indica o número de ocorrências de cada valor ou o

número de valores pertencentes a uma classe.

Na Tabela 1: F6 = F(5) = 1

Na Tabela 2: F2 = 6

1.6.3 Regras para a elaboração de uma Distribuição de Freqüências

Simples

a) Escreve-se, ordenadamente, os dados observados na coluna indicadora.

b) Obtém-se as freqüências absolutas simples dos dados (Fi). Essas freqüências

constituem o corpo da tabela.

Exemplo:

Sejam os dados abaixo representativos de uma pesquisa sobre o número de irmãos

de 20 alunos da Turma PEST.

Dados Brutos:

1 – 3 – 0 – 5 – 2 – 1 – 1 – 0 – 0 – 1 – 4 – 3 – 1 – 0 – 1 – 2 – 2 – 1 – 3 – 1

Rol:

0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 3 – 3 – 3 – 4 – 5

A distribuição de freqüências do rol apresentado é:

19

Tabela 3

Número de Irmãos de 20 alunos da Turma PEST

i Número de Irmãos (xi) Repetições (Fi)

1 0 4

2 1 8

3 2 3

4 3 3

5 4 1

6 5 1

Total  Fi = 20

1ª Coluna (i) – número de ordem dos valores distintos da variável número de

irmãos.

2ª Coluna (xi) – valores distintos da variável número de irmãos.

3ª Coluna (Fi) – número de repetições dos valores distintos da variável número de

irmãos.

Nota:

k

i

i 1

F n

=

 = , onde n é igual ao número de dados observados (n = 20)

Observa-se que neste tipo de tabela não há perda de informação, podendo os dados

originais serem reconstituídos a partir da distribuição elaborada.

1.6.4 Tipos de Freqüências

Para a interpretação dos resultados de uma pesquisa, conforme os tipos de

informações requeridas utilizam-se diversos tipos de freqüências de dados.

A seguir serão apresentados os tipos de freqüências, derivados da distribuição de

freqüências absolutas, bastante úteis na interpretação de dados.

Freqüência Total

É a soma de todas as freqüências absolutas simples em uma tabela.

k

i

i 1

F n

=

 =

20

A freqüência total de uma distribuição de freqüências é igual ao número total de

observações (n).

Exemplo:

Na Tabela 3, temos:

6

i 1 2 3 4 5 6

i 1

F F F F F F F 4 8 3 3 1 1 20

=

 = + + + + + = + + + + + =

Freqüência Relativa Simples, ou simplesmente, Freqüência Relativa

Simbolizada por fi, a freqüência relativa simples fornece a proporção de cada valor

ou de casos ocorridos em cada classe, em relação ao número total de observações.

Portanto, é um número relativo. Para calcular a freqüência relativa, basta dividir a

freqüência absoluta da ordem em questão pelo número de observações.

n

F

f i

i =

As comparações expressas através de porcentagem são mais usuais. Para obter a

porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o

quociente obtido por 100, ou seja:

i

i

F

f 100

n

= ×

Nota:

k

i

i 1

f 1

=

 = ou 100%

Exemplo:

Na Tabela 3, temos:

1

1

F 4

f 0,20 100 20

20 20

= = = × = %

2

2

F 8

f 0,40 100

20 20

= = = × = 40%

3

3

F 3

f 0,15 100 15

20 20

= = = × = %

21

4

4

F 3

f 0,15 100 15

20 20

= = = × = %

5

5

F 1

f 0,05 100 5

20 20

= = = × = %

6

6

F 1

f 0,05 100 5

20 20

= = = × = %

Freqüência Absoluta Acumulada

Denotada por Faci, a freqüência absoluta acumulada fornece a informação de

quantos elementos se situam até determinado valor. A freqüência acumulada do iésimo

valor ou i-ésima classe (freqüência acumulada de ordem i) é obtida

somando-se a freqüência desse valor ou classe com as freqüências anteriores, ou

seja, é a soma de todas as freqüências de ordens menores ou igual a da ordem em

questão.

Exemplo:

Fac3 =

3

i=1

 Fi = F1 + F2 + F3

Fac4 =

4

i=1

 Fi = F1 + F2 + F3 + F4

Exemplo:

Na tabela 3, temos:

Fac1 = F1 = 4 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18

Fac2 = F1 + F2 = 4 + 8 = 12

Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19

Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20

Freqüência Acumulada Relativa

Denotada por faci, fornece a proporção de elementos situados até determinado

valor. Consiste na soma da freqüência relativa de cada valor ou classe com as

freqüências relativas dos valores ou classes anteriores, ou seja, é a soma das

freqüências simples relativas de ordens menores ou iguais a da ordem em questão.

.

22

Exemplo:

fac3 =

3

i=1

 fi = f1 + f2 + f3

Exemplo:

Na tabela 3, temos:

fac1 = f1 = 0,20 = 20%

fac2 = f1 + f2 = 0,20 + 0,40 = 0,60 = 60%

fac3 = f1 + f2 + f3 = 0,60 + 0,15 = 0,75 = 75%

fac4 = f1 + f2 + f3 + f4 = 0,75 + 0,15 = 0,90 = 90%

fac5 = f1 + f2 + f3 + f4 + f5 = 0,90 + 0,05 = 0,95 = 95%

fac6 = f1 + f2 + f3 + f4 + f5 + f6 = 0,95 + 0,05 = 1 = 100%

A freqüência relativa acumulada de ordem i pode ser também calculada através do

quociente:

= 









Exemplo:

3

15

fac 0,75 75

20

= = = %

Com relação à Tabela 3, utilizando todos os tipos de freqüências definidas

anteriormente, podemos construir a seguinte distribuição de freqüências:

Tabela 4

Número de Irmãos de 20 alunos da Turma PEST

i xi Fi fi fi (%) Faci faci faci(%)

1 0 4 0,20 20 4 0,20 20

2 1 8 0,40 40 12 0,40 40

3 2 3 0,15 15 15 0,75 75

4 3 3 0,15 15 15 0,90 90

5 4 1 0,05 5 5 0,95 95

6 5 1 0,05 5 5 1,00 100

Total 20 1,00 100 − − −

FONTE: Dados Fictícios

23

Interpretação:

• f3 = 0,15; 15% dos alunos responderam que têm 2 irmãos.

• F2 = 8; 8 alunos responderam que têm 1 irmão;

• fac3 = 0,75; 75% dos alunos responderam que têm entre 0 e 2 irmãos.

1.6.5 Representação Gráfica de uma Distribuição de Freqüências

Simples

A distribuição de Freqüências Simples é representada graficamente por um Gráfico

em Hastes, um diagrama onde as freqüências são representadas por segmentos de

retas perpendiculares ao eixo das abcissas. Cada segmento é determinado pelos

pontos (xi,Fi) e (xi,0).

Exemplo: Representação gráfica da Tabela 3.

EXERCÍCIOS

1. Considere a seguinte distribuição de freqüências correspondente aos diferentes

preços de um determinado produto pesquisados em 20 lojas.

Preços do Produto A

i Preço (R$) Número de Lojas

1 50 2

2 51 5

3 52 6

4 53 6

5 54 1

Total 20

FONTE: Dados Fictícios

0 1 2 3 4 5 xi (numero de irmãos)

Fi

1

3

4

8

24

a) Quantas lojas apresentam preços de R$ 52,00?

b) Determine as freqüências relativas simples e as freqüências absolutas

acumuladas.

c) Quantas lojas apresentaram um preço de até R$ 52,00 (inclusive)?

d) Qual é a percentagem de lojas com preços de até R$ 53,00 (inclusive)?

2. A distribuição de freqüências a seguir apresenta o número de acidentes por dia,

durante 40 dias, em determinado cruzamento.

Número de Acidentes no Cruzamento X

i Nº de Acidentes por dia

(xi)

Número de Dias

(Fi)

1 0 30

2 1 5

3 2 3

4 3 1

5 4 1

Total 40

FONTE: Dados Fictícios

a) Determine as freqüências absolutas acumuladas, as freqüências simples

relativas e as freqüências acumuladas relativas.

b) Após ter determinado as freqüências acima, interprete todos os resultados da 3ª

linha da distribuição de freqüências.

3. Em uma amostra de 30 milheiros de telhas recebidas pela Construtora ABC

Ltda, constatou-se os seguintes números de unidades defeituosas por milheiro:

5 – 20 – 10 – 5 – 40 – 30 – 20 – 5 – 10 – 15 – 10 – 30 – 40 – 10 – 50 – 10 –

30 – 15 − 20 – 40 – 10 – 20 – 20 – 50 – 10 – 40 – 30 – 20 – 0 – 30

a) Agrupar estes dados em uma distribuição de freqüências simples.

b) Representá-la através de um gráfico conveniente.

c) Calcular todos os tipos de freqüências conhecidos.

d) Qual a percentagem de milheiros com mais de 30 telhas defeituosas?

e) Quantos milheiros tiveram menos de 10 telhas defeituosas?

f) Qual a proporção de milheiros com menos de 20 telhas defeituosas?

25

4. Dada a distribuição de freqüências:

Indústria de Equipamentos Eletrônicos – IEE

Número de Falhas em Componentes durante o período

de garantia

Janeiro de 2000

i Nº de Falhas

(xi)

Número de Equipamentos

(Fi)

1 0 148

2 1 52

3 2 34

4 3 26

5 4 13

6 5 7

Total 280

FONTE: Dados Fictícios

a) Determinar as freqüências relativas percentuais, as freqüências acumuladas e as

freqüências relativas acumuladas percentuais.

b) Através das freqüências calculadas, responder qual a porcentagem de:

b.1) equipamentos que não apresentaram falha em seus componentes;

b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes;

b.3) equipamentos trocados, sabendo-se que a indústria se compromete a trocar o

equipamento que apresente 4 ou mais falhas em seus componentes.

5. Considere os seguintes números.

1 3 5 7 9 2 4 6 8 10 15 20 25

0 1 2 3 4 5 6 7 8 9 9 8 7

8 6 5 4 3 2 1 0 10 15 20 25 12

8 11 6 4 2 1 3 5 7 9 11

a) Construa a distribuição de freqüências simples.

b) Representá-la através de um gráfico conveniente.

c) Calcular todos os tipos de freqüências conhecidos.

26

1.7 Intervalo de Classe ou Classe

Classes são intervalos de variações da variável, ou seja, é cada um dos grupos de

valores em que se subdivide a amplitude total do conjunto de valores observados

da variável.

Uma determinada classe pode ser identificada por seus extremos ou pela ordem em

que ela se encontra na tabela (valor do índice i)

O número de classes de uma distribuição de freqüências será denotado por k.

A notação indica intervalo fechado à esquerda. Assim, na Tabela 2, um

funcionário que apresentou salário de R$ 1400,00 pertence à classe

1400 1600, ou terceira classe (i = 3).

Existem diversas maneiras de expressar as classes:

a) a b compreende todos os valores entre a e b, incluindo a e b

b) a b compreende todos os valores entre a e b, excluindo a

c) a b compreende todos os valores entre a e b, excluindo b

d) a b compreende todos os valores entre a e b, excluindo a e b

Em nosso curso usaremos a forma expressa em “c)”.

1.7.1 Limites de Classe

São os valores extremos de cada classe. O menor valor denomina-se limite inferior

da classe i (li) e o maior, limite superior da classe i (Li).

Assim, na quarta classe da Tabela 2 tem-se l4 = 1600 e L4 = 1800.

1.7.2 Amplitude do Intervalo de Classe (h)

A amplitude do intervalo de classe é o comprimento da classe, sendo definida

como a diferença entre o limite superior e o limite inferior da classe.

hi = Li − li

Exemplo:

Na Tabela 2, temos:

h1 = 1200 – 1000 = 200

h2 = 1400 – 1200 = 200

27

Em geral h1 = h2 = h3 = ... = h k = h, e determina-se a amplitude do intervalo

fazendo:

T A

h

k

=

Exemplo: Dados: AT = 64 e k = 7. Temos: h =

64

7

= 9,14 » 10

Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior.

1.7.3 Número de Classes (k)

Não existe uma regra fixa que forneça o número de classes. No entanto, como o

objetivo da distribuição de freqüências é facilitar a compreensão dos dados, é

importante que a distribuição contenha um número adequado de classes. Se este

número for escasso, os dados originais ficarão tão comprimidos que pouca

informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias

classes, haverá algumas com freqüências nulas ou muito pequenas e o resultado

será uma distribuição irregular e prejudicial à interpretação do fenômeno como um

todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a

quantidade de dados for pequena não se justifica a construção de uma tabela, e se

for grande, mais de 20 classes dificulta a análise.

Em função do total de observações existem vários métodos que orientam a escolha

de um número de classes conveniente. Seguem-se os dois mais utilizados:

a) Regra da Raiz Quadrada

k = 5 para n £ 25

k = n para n > 25, onde n é o número de observações.

Exemplo:

Para n = 30, o número de classes será 30 = 5,48 » 5.

b) Regra de Sturges

k = 1 + 3,3 log n,

onde: n = número de observações.

Exemplo:

Para n = 30, tem-se: k = 1 + 3,3 log 30 » 6.

28

Para n = 30 os resultados obtidos pelos dois critérios são bastante próximos. O

mesmo não acontece para valores grandes de n onde a regra de Sturges tem o

inconveniente de prever um número relativamente pequeno de classes e o

procedimento da raiz quadrada, um número relativamente grande. Neste caso deve

prevalecer o bom senso do analista.

1.7.4 Ponto Médio da Classe (xi)

Considerando que os valores de uma classe estão distribuídos uniformemente, o

ponto médio ou valor médio de uma classe é o valor que melhor a representa para

efeito de cálculo de certas medidas.

O ponto médio de uma classe i é definido por: i i

i

l L

x

2

+

=

Uma outra maneira de obter o ponto médio é adicionar a metade da amplitude ao

limite inferior da classe.

Na Tabela 2, o ponto médio da classe 1200 1400 é:

3

1200 1400

x 1300

2

+

= = , ou 3

200

x 1200 1300

2

= + = .

1.7.5 Regras para a elaboração de uma Distribuição de Freqüências

por Classes

a) Determinar o rol (opcional).

b) Determinar a amplitude total (AT) dos dados:

AT = valor máximo – valor mínimo

c) Determinar o número conveniente de classes (k), de acordo com um dos

critérios citados anteriormente.

d) Determinar a amplitude de cada classe (h) dividindo a amplitude total pelo

número de classes.

AT

h

k

=

Muitas vezes ao efetuar esta divisão, pode-se chegar a um resultado não muito

conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o

29

valor encontrado seja aproximado para o maior inteiro, caso contrário algum dado

excederia o limite superior da última classe prevista.

e) Determinar os limites das classes, escolhendo-se, preferencialmente, números

inteiros. O limite inferior da primeira classe e o limite superior da última, não

precisam, necessariamente, pertencer ao conjunto.

f) Construir a tabela de freqüências, contando o número de ocorrência de cada

classe.

Exemplo:

Os dados a seguir representam as notas de 50 alunos.

33 35 35 39 41 41 42 45 47 48

50 52 53 54 55 55 57 59 60 60

61 64 65 65 65 66 66 66 67 68

69 71 73 73 74 74 76 77 77 78

80 81 84 85 85 88 89 91 94 97

Vamos agrupar estes elementos em uma distribuição de freqüências por classes

a) Amplitude Total: AT = 97 – 33 = 64

b) Número de Classes: k = 50 » 7 ou k = 1 + 3,3 log 50 = 1 + 3,3 x 1,7 » 7

c) Amplitude das Classes (h): T A 64

h 9,14 10

k 7

= = = @ (aproximar para o maior

inteiro)

d) Limites das Classes

30 40

40 50

50 60

60 70

70 80

80 90

90 100

e) Distribuição de Freqüências por Classes

Ponto inicial = 30 (o ponto inicial deve ser sempre menor ou igual ao

menor valor observado)

Ponto final = 100 (o ponto final deve ser sempre maior que o

maior valor observado)

30

Notas de 50 alunos

Classes Notas Fi fi fi(%) Faci faci faci(%) xi

1 30 |--- 40 4 0,08 8 4 0,08 8 35

2 40 |--- 50 6 0,12 12 10 0,20 20 45

3 50 |--- 60 8 0,16 16 18 0,36 36 55

4 60 |--- 70 13 0,26 26 31 0,62 62 65

5 70 |--- 80 9 0,18 18 40 0,80 80 75

6 80 |--- 90 7 0,14 14 47 0,94 94 85

7 90 |--- 100 3 0,06 6 50 1,00 100 95

Total 50 1,00 100 − − − −

FONTE: Dados Hipotéticos

Interpretação:

F3 = 8 ® 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60.

f4 = 26% ® 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive).

Fac6 = 47 ® 47 alunos obtiveram notas inferiores a 90.

fac5 = 80% ® 80% dos alunos obtiveram notas inferiores a 80.

1.8 Distribuição de Freqüências com Intervalos de Classes Desiguais

Existem casos em que é mais adequado agrupar os dados em classes com

larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a

categoria a que pertencem.

Exemplo:

Tabela 5

Categoria de Atletas por Idade

Classes Idades Fi

1 2 |--- 13 12

2 13 |--- 15 5

3 15 |--- 18 8

4 18 |--- 30 30

5 30 |--- 40 12

6 40 |--- 60 10

7 60 |--- 90 2

Total 79

31

1.9 Gráficos de uma Distribuição de Freqüências por Classes

1. Histograma

É um tipo de gráfico apropriado para representar dados agrupados em classes.

Consiste de colunas justapostas cujas bases representam as classes e as alturas

correspondem às freqüências das classes.

2. Polígono de Freqüências

Trata-se da representação de uma distribuição de freqüências por classes,

através de um polígono.

O eixo das abcissas constitui a base do polígono. Os vértices são os pontos

(xi,Fi) onde xi é o ponto médio e Fi é a freqüência da classe.

O fechamento da poligonal com a base é feito unindo o primeiro vértice ao

ponto médio de uma classe anterior à primeira, e o último vértice ao ponto médio

de uma classe posterior à última.

Esse gráfico é adequado também para a representação de freqüências relativas e

percentuais.

3. Polígono de Freqüências Acumuladas ou Ogiva de Galton

Utilizado para representar as freqüências acumuladas. Os vértices são os pontos

(Li, Faci). Pode ser usado também para representar as freqüências acumuladas

relativas percentuais. O fechamento é feito unindo o primeiro vértice ao limite

inferior da primeira classe.

Esse gráfico será útil para a determinação das medidas separatrizes que serão

tratadas posteriormente.

Exemplo:

Dada a distribuição de freqüências:

Notas dos alunos da turma PEST

Notas Fi Fac Fi xi

30 |--- 40 4 4 0,08 35

40 |--- 50 6 10 0,12 45

50 |--- 60 8 18 0,16 55

60 |--- 70 13 31 0,26 65

70 |--- 80 9 40 0,18 75

80 |--- 90 7 47 0,14 85

90 |--- 100 3 50 0,06 95

Total 50 − 1,00 −

32

Os gráficos representativos dessa distribuição são:

HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS

POLÍGONO DE FREQUÊNCIAS ACUMULADAS

EXERCÍCIOS

1. Os dados a seguir referem-se às notas de 50 alunos:

60 85 33 52 65 77 84 65 74 57

71 35 81 50 35 64 74 47 54 68

80 61 41 91 55 73 59 53 77 45

71 55 78 48 69 85 67 39 60 76

94 98 66 66 73 42 65 94 88 89

3

4

6

7

8

9

13

Fi

30 40 50 60 70 80 90 100 classe

Polígono de

freqüência

10

4

18

47

31

40

50

Fac

30 40 50 60 70 80 90 100 classe

33

Pede-se:

a) A amplitude total da amostra.

b) O número de classes.

c) A amplitude das classes.

d) As classes (valor inicial = 30).

e) As freqüências absolutas das classes.

f) As freqüências relativas.

g) Os pontos médios das classes.

h) As freqüências acumuladas das classes.

i) O histograma.

j) O polígono de freqüências.

k) O polígono de freqüências acumuladas.

2. A tabela abaixo apresenta os salários de 90 operários da Empresa Aço S/A

Salários dos Funcionários da Empresa

Aço

Classes Salários

Mínimos

Fi

1 1 |--- 3 40

2 3 |--- 5 30

3 5 |--- 7 10

4 7 |--- 9 5

5 9 |--- 11 5

Total 90

a) Determine as freqüências simples relativas, as freqüências absolutas

acumuladas e as freqüências relativas acumuladas.

b) Quantos funcionários ganham menos de 3 salários mínimos?

c) Quantos ganham mais de salários mínimos?

d) Qual a percentagem de operários com salário entre 5 e 7 salários mínimos?

e) Qual a percentagem de operários com salário inferior a 7 salários mínimos?

f) Construa o histograma e o polígono de freqüência.

3. Complete a tabela abaixo:

i Classes xi Fi Faci fi

1 0 |--- 2 1 4 0,04

2 2 |--- 4 8

3 4 |--- 6 5 30 0,18

4 |--- 7 27 0,27

5 8 |--- 10 15 72

6 10 |--- 12 83

7 |--- 13 10 93 0,10

8 14 |--- 16 0,07

− Total −

34

4. A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400

lotes:

i Áreas (m2) Nº de Lotes

1 300 |--- 400 14

2 400 |--- 500 46

3 500 |--- 600 58

4 600 |--- 700 76

5 700 |--- 800 68

6 800 |--- 900 62

7 900 |--- 1000 48

8 1000 |--- 1100 22

9 1100 |--- 1200 6

Com referência a essa tabela determine:

a) A amplitude total.

b) O limite superior da 5ª classe.

c) A freqüência acumulada da 4ª classe.

d) O número de lotes cuja área não atinge 700 m2.

e) O número de lotes cuja área é superior ou igual a 800 m2.

f) A classe do 72º lote.

5. Responda as seguintes questões:

a) O que é freqüência simples absoluta de uma classe?

b) O que é freqüência simples relativa de uma classe?

c) O que é freqüência acumulada absoluta de uma classe?

d) O que é freqüência acumulada relativa de uma classe?

e) O que é limite inferior de uma classe?

f) O que é ponto médio de uma classe?

6. Os pesos de 40 alunos estão relacionados a seguir:

69 57 72 54 93 68 72 58 64 62

65 76 60 49 74 59 66 83 70 45

60 81 71 67 63 64 53 73 81 50

67 68 53 53 65 58 80 60 63 53

a) Agrupar estes dados em classes de valores (Dado log 40 = 1,6).

b) Determine as freqüências relativas, as freqüências acumuladas e as freqüências

relativas acumuladas.

c) Determine os pontos médios das classes.

d) Interprete todos os resultados da 3ª linha da tabela.

e) Construa o histograma, o polígono de freqüências e o polígono de freqüências

acumuladas da distribuição.

35

7. Os dados abaixo referem-se ao consumo mensal de energia elétrica em kwh

da conta nº 001.161157-1 das Centrais Elétricas de Goiás, no período de 1997 a

1999.

142 – 178 – 164 – 190 – 146 – 131 – 119 – 131 – 187 – 158 – 168 – 111 –

96 – 118 – 182 – 116 – 188 – 207 – 229 – 180 – 181 – 175 – 205 – 179 –

184 – 227 – 210 – 210 – 213 – 190 – 240 – 215 – 226 – 188 – 190 – 205 –

a) Sintetizar esses dados através de uma distribuição de freqüências por classes.

b) Calcular todos os tipos de freqüências que você conhece.

c) Com base nas freqüências calculadas, apresentar os seguintes percentuais:

c.1) de meses com consumo inferior a 150 kwh.

c.2) de meses com consumo superior a 200 kwh.

d) Representar a distribuição elaborada através de um histograma e de um

polígono de freqüências.

e) Representar a distribuição de freqüências acumuladas através de uma Ogiva.

8. Dada a amostra:

28 33 27 30 31 30 33 30 33 29

27 33 31 27 31 28 27 29 31 24

31 33 30 32 30 33 27 33 31 33

23 29 30 24 28 34 39 30 18 17

18 15 16 17 17 18 19 19 20 29

a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5).

b) Calcule as freqüências absolutas, as freqüências acumuladas e os pontos médios

das classes.

c) Interprete todos os resultados da 4ª linha da tabela.

d) Construa o histograma, o polígono de freqüências e o polígono de freqüências

acumuladas da distribuição.

9. Abaixo temos a distribuição dos aluguéis de 65 casas.

Aluguel (centenas de $) 1,5 |-- 3,5 3,5 |-- 5,5 5,5 |-- 7,5 7,5 |-- 9,5 9,5 |-- 11,5

Nº de casas 12 18 20 10 5

Com referência a essa tabela determine:

a) A amplitude total.

b) O limite superior da 5ª classe.

c) A freqüência acumulada da 4ª classe.

d) O número de aluguéis cujo valor atinge, no máximo, R$ 550,00.

36

e) O número de aluguéis cujo valor é superior ou igual a R$ 750,00.

f) A classe do 50º aluguel.

10. A distribuição de freqüência abaixo representa o consumo por nota de 54 notas

fiscais emitidas durante um dia em uma loja de departamentos.

Consumo por nota (R$) nº de notas

0 |------ 50 10

50 |------ 100 28

100 |------ 150 12

150 |------ 200 2

200 |------ 250 1

250 |------ 300 1

a) Interprete todos os resultados da 4ª linha da tabela.

b) Construa o histograma e o polígono de freqüências.

37

2. MEDIDAS DE POSIÇÃO

As medidas de posição são valores que representam o conjunto de dados

observados ou então promovem uma partição sobre este conjunto. Entre as

medidas de posição destacam-se as medidas de tendência central e as separatrizes.

2.1 MEDIDAS DE TENDÊNCIA CENTRAL

A maneira mais simples de resumirmos as informações contidas em um

conjunto de dados observados é estabelecer um ponto central em torno do qual os

dados se distribuem. Tais medidas orientam quanto à posição do conjunto no eixo

dos números reais e possibilitam comparações de séries de dados entre si pelo

confronto destes números. São chamadas Medidas de Tendência Central, pois

representam os fenômenos pelos seus valores médios em torno dos quais tendem a

se concentrar os dados.

2.1.1 MÉDIA ARITMÉTICA ( x )

a) Média aritmética para dados não agrupados

Sejam x1, x2, ..., xn, n valores da variável X. A média aritmética simples, denotada

por x , é definida por:

n

i

i 1

x

x

n

= =



,

onde n é o número de valores observados da variável X.

Exemplo:

Determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0.

5

i

i 1

x

7,0 3,0 5,5 6,5 8,0

x 6,0

5 5

= + + + +

= = =



38

b) Média aritmética para dados agrupados

Neste caso, usamos a média aritmética dos valores x1, x2, ..., xk, ponderada pelas

suas respectivas freqüências absolutas F1, F2, F3, ... , Fk. Desta forma, temos:

k

i i

i 1

x F

x

n

= =



,

onde n = F1 + F2 + ... + Fk =

k

i

i 1

F

=



Observação: Quando se tratar de uma distribuição de freqüência por classe, xi

corresponde ao ponto médio da classe, ou seja, i i

i

l L

x

2

+

= .

Exemplos:

1. Determinar a média aritmética da distribuição a seguir.

NÚMERO DE IRMÃOS DE 20 ALUNOS DA TURMA IDX

i xi Fi

1 0 4

2 1 8

3 2 3

4 3 3

5 4 1

6 5 1

TOTAL 20

Fonte: Dados Hipotéticos

Solução:

Para determinar a média acrescentaremos a coluna com o cálculo de xiFi

NÚMERO DE IRMÃOS DE 20 ALUNOS DA TURMA IDX

i xi Fi XIFI

1 0 4 0

2 1 8 8

3 2 3 6

4 3 3 9

5 4 1 4

6 5 1 5

39

TOTAL 20 32

Fonte: Dados Hipotéticos

k 6

i i i i

i 1 i 1

x F x F

32

x 1,6

n 20 20

= = = = = =

 

2. Dada a distribuição:

Renda Familiar de 40 Famílias

i Salários (R$

1.000)

Fi

1 2 |--- 4 5

2 4 |--- 6 10

3 6 |--- 8 14

4 8 |--- 10 8

5 10 |--- 12 3

TOTAL 40

Fonte: Dados Hipotéticos

Determinar a renda média familiar destas 40 famílias.

Solução:

Acrescentamos as colunas com os cálculos de xi e xiFi ,

Renda Familiar de 40 Famílias

i Salários

(R$ 1.000)

Fi xi xiFi

1 2 |--- 4 5 3 15

2 4 |--- 6 10 5 50

3 6 |--- 8 14 7 98

4 8 |--- 10 8 9 72

5 10 |--- 12 3 11 33

TOTAL 40 − 268

Fonte: Dados Hipotéticos

e utilizamos a fórmula:

k 5

i i i i

i 1 i 1

x F x F

268

x 6,7

n 40 40

= = = = = =

 

40

Assim, cada família possui, em média, uma renda de R$6.700,00.

Observação: Do ponto de vista teórico, vários tipos de média podem ser

calculados para uma massa de dados. O uso da média aritmética apresenta

vantagens para cálculos posteriores, devendo, entretanto, além de outros casos, ser

empregada em séries que estejam em progressão aritmética ou se os valores

extremos não influírem sensivelmente sobre ela. Outra orientação para seu

emprego é na comparação com as outras medidas de tendência central.

Focalizaremos ainda neste estudo as médias geométricas e as médias harmônicas.

2.1.2 MÉDIA GEOMÉTRICA (Mg)

a) Média geométrica para dados não agrupados

Sejam x1, x2, ..., xn, n valores da variável X. A média geométrica, denotada por

Mg, é definida por:

n

Mg = x1 × x2 × x3 × ...× xn

Exemplo:

Calcular a média geométrica dos valores: 3, 6, 12, 24 e 48.

Mg = 5 3× 6×12× 24× 48 = 5 248.832 =12

b) Média geométrica para dados agrupados

Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas F1,

F2, F3, ... , Fk, respectivamente. A média geométrica, denotada por Mg, é definida

por:

n F1 F2 F3 Fk

1 2 3 k Mg = x × x × x × ... × x

Exemplo:

Calcular a média geométrica da distribuição:

xi 1 2 3 5

Fi 8 6 5 3

41

Mg = 2218 × 26 ×35 ×53 =1,9311

Observação: Quando o número de observações for muito grande é aconselhável o

emprego de logaritmo (decimal ou neperiano). Assim,

n F1 F2 F3 Fk

1 2 3 k Mg = x × x × x ×...× x  Mg = ( 1 2 3 k )

1

F F F F n

1 2 3 k x × x × x ×...× x

log Mg = log ( 1 2 3 k )

1

F F F F n

1 2 3 k x × x × x ×...× x = 1 1 2 2 k k F . log x F . log x ... F . log x

n

+ + +

Aplicando este resultado no exemplo acima, temos:

log Mg =

8 . log 1 6 . log 2 5 . log 3 3 . log 5

22

+ + + =

8 . 0 6 . 0,3010 5 . 0,4771 3 . 0,6990

22

+ + + = 0,2858

Logo, Mg = antilog 0,2858 = 10 0,2858 = 1,9311

A média geométrica como medida de tendência central é de pouco uso, e seu

emprego é restrito, como no caso dos dados de uma série formarem ou se

aproximarem de uma progressão geométrica, e em números índices. Exemplos de

dados com este comportamento são os preços num período de inflação e a variação

do montante em juros compostos, apresentando-se em progressão geométrica de

razão (1 + r), sendo r a taxa unitária.

Como a média geométrica depende do produto, se um dos fatores for igual a

zero ela também o será. Por outro lado, se tiver fatores negativos ela poderá ser

negativa ou imaginária (número complexo), dependendo para isso, do índice n ser

ímpar ou par.

2.1.3 MÉDIA HARMÔNICA (Mh)

a) Média harmônica para dados não agrupados

Sejam x1, x2, ..., xn, n valores da variável X. A média harmônica, denotada por Mh,

é definida por:

42

1 2 3 n

n

Mh

1 1 1 1

...

x x x x

=

+ + + +

Exemplo: Calcular a média harmônica de 2, 5 e 8.

3

Mh 3,64

1 1 1

2 5 8

= =

+ +

b) Média harmônica para dados agrupados

Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas

F1, F2, F3, ... , Fk, respectivamente. A média harmônica de X, denotada por Mh, é

definida por:

k

1 2 3 k i

1 2 3 k i 1 i

n n

Mh

F F F F ... F

x x x x x =

= =

+ + + + 

A média harmônica é particularmente recomendada para séries de valores que

são inversamente proporcionais, como para o cálculo de velocidade média, tempo

médio de escoamento de estoque, etc.

A média harmônica poderá ser empregada, por exemplo, no caso dos preços

unitários de certas mercadorias que são inversamente proporcionais às quantidades

de lotes, se o preço total de cada lote tiver o mesmo custo. O preço médio unitário

deverá ser igual à média harmônica dos demais preços.

EXERCÍCIOS:

1. Determine a média aritmética das seguintes séries:

a) 3, 4, 1, 3, 6, 5 e 6;

b) 60, 80, 90, 100 e 120;

c) 2,5; 3,6; 4,1; 4,3 e 6,2.

2. A média mínima para aprovação em uma matéria é 5. Se um estudante

obteve as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5 e 4,0 nos trabalhos mensais desta

matéria, pergunta-se: ele foi ou não aprovado?

3. Calcule para cada uma das distribuições a sua respectiva média:

43

a)

xi 3 4 7 8 12

Fi 2 5 8 4 3

b)

Aluguel

(R$1.000)

1,5 |--- 3,5 3,5 |--- 5,5 5,5 |--- 7,5 7,5 |--- 9,5 9,5 |---

11,5

Nº DE IMÓVEIS 12 18 20 10 5

4. Com importâncias iguais foram compradas quantidades diferentes de certa

mercadoria cujos preços unitário foram R$ 20,00, R$ 40,00, R$ 20,50, R$ 21,00

e R$ 21,60. Calcular o preço médio unitário de custo destas mercadorias.

(Sugestão: utilize a média harmônica) .

5. Calcule a média geométrica para as séries:

a) 1, 2, 4, 7, 16;

b) 81, 26, 10, 3, 1.

6. Utilizando a série de dados 2, 8, 7 e 15, comprove as seguintes propriedades

da média aritmética:

a) A soma dos desvios em torno da média é zero, isto é, (xi − x) = 0

b) Somando (ou subtraindo) uma mesma quantidade arbitrária a (de) todos os

valores da série, a média ficará aumentada (ou diminuída) desta mesma

quantidade.

c) Multiplicando ou dividindo cada termo de uma série por uma constante, a

média ficará multiplicada ou dividida pela constante.

d) A soma dos quadrados dos desvios medidos em relação à média é um mínimo,

ou seja, é sempre menor que a soma dos quadrados dos desvios medidos em

relação a qualquer outro valor, isto é, i (x − x) é mínimo.

7. Calcule as médias aritmética, geométrica e harmônica para a série a seguir e

observe pelos cálculos qual a relação entre estas médias.

xi Fi

2 1

3 4

4 3

5 2

TOTAL

44

2.1.4 MEDIANA (Md)

A mediana, denotada por Md, é o valor que divide o rol em duas partes

contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana é o

valor que ocupa a posição central de uma série de dados.

50% 50%

Md

a) Mediana para dados não agrupados

i) Se n é ímpar – o rol admite apenas um termo central que ocupa a posição

n 1

2

+ .

O valor do elemento que ocupa esta posição é a mediana.

Exemplo: Determinar a mediana da série: 20; 12; 23; 20; 8; 12; 2.

Rol: 2; 8; 12; 12; 20; 20; 23.

n = 7 (n é ímpar)

O rol admite somente um termo central que ocupa a posição

7 1

2

+ , ou seja, a 4ª

posição. Portanto Md = x4 = 12.

Interpretação: 50% dos valores da série são menores ou iguais a 12 e 50% dos

valores são maiores ou iguais a 12.

ii) Se n é par – neste caso o rol admite dois termos centrais que ocupam as

posições

n

2

e

n

1

2

+ .

Neste caso a mediana é definida como a média aritmética destes dois termos

centrais.

Exemplo: Determinar a mediana da série: 7; 21; 13; 15; 10; 8; 9; 13.

Rol: 7; 8; 9; 10; 13; 13; 15; 21.

n = 8 (n é par)

A série admite dois termos centrais que ocupam as posições

8

2

e

8

1

2

+ , ou seja, a

4ª posição e a 5ª posição.

Portanto,

45

4 5 x x 10 13

Md 11,5

2 2

+ +

= = = .

Interpretação: 50% dos valores do rol são menores ou iguais a 11,5 e 50% dos

valores são maiores ou iguais a 11,5.

b) Mediana para dados agrupados sem intervalos de classes

O procedimento para o cálculo da mediana para dados agrupados sem

intervalos de classes é o mesmo utilizado para dados não agrupados, ou seja:

• Se n for ímpar, a mediana será o termo central, isto é, o termo de ordem

n 1

2

+ .

• Se n for par, a mediana será a média aritmética entre os elementos centrais, isto

é, os elementos de ordem

n

2

e

n

1

2

+ .

Exemplo 1:

Determinar a mediana da distribuição abaixo.

i xi Fi Faci

1 2 1 1

2 5 4 5

3 8 10 15

4 10 6 21

5 12 2 23

TOTAL 23 −

n = 23 (n é ímpar)

A distribuição admite apenas um termo central que ocupa a posição

23 1

2

+ , ou

seja, a 12ª posição.

Através das freqüências acumuladas podemos observar que: o 1º elemento é o 2; o

2º, o 3º, o 4º e o 5º elementos são iguais a 5; o 6º, o 7º, ... , o 15º elementos são

iguais a 8; e assim sucessivamente.

Portanto o 12º elemento é o 8.

Logo, Md = x12 = 8.

46

Exemplo 2: Determinar a mediana da distribuição

i xi Fi Faci

1 0 3 3

2 1 5 8

3 2 8 16

4 3 10 26

5 5 6 32

TOTAL 32 −

n = 32 (n é par).

A série admite dois termos centrais que ocupam as posições

32

2

e

32

1

2

+ , ou seja,

o 16º e o 17º elementos.

Observando as freqüências acumuladas, temos:

O 1º, o 2º e o 3º elementos são iguais a 0;

O 4º, o 5º, o 6º, o 7º e o 8º são iguais a 1;

O 9º, o 10º, ... , o 16º são iguais a 2;

O 17º, o 18º, ... , o 26º são iguais a 3;

O 27º, o 28º, ..., o 32º são iguais a 5.

Portanto o 16º termo é igual a 2 e o 17º termo é igual a 3.

Logo, 16 17 x x 2 3

Md 2,5

2 2

+ +

= = =

c) Mediana para dados agrupados com intervalos de classes

• Calcula-se

n

2

, independente de n ser par ou ímpar;

• Localiza-se, através das freqüências acumuladas, a classe mediana, ou seja, a

classe que contém o termo de ordem

n

2

;

• Aplica-se a fórmula:

ant

Md

Md

n

Fac

Md l 2 h

F

= + × ,

onde:

lMd = limite inferior da classe mediana;

Facant = freqüência acumulada da classe anterior à classe mediana;

h = amplitude da classe mediana;

FMd = freqüência absoluta da classe mediana.

47

Exemplo 1

Determinar a mediana da distribuição.

i Altura(cm) Fi Faci

1 150 |--- 154 4 4

2 154 |--- 158 9 13

3 158 |--- 162 11 24 ® classe mediana

4 162 |--- 166 8 32

5 166 |--- 170 5 37

6 170 |--- 174 3 40

TOTAL 40 −

• Calcula-se

n

2

®

40

20

2

=

• Localiza-se a classe mediana (a classe que contém o termo de ordem

n

2

)

Classe mediana = 3ª classe

• Aplica-se a fórmula:

ant

Md

Md

n

Fac

Md l 2 h

F

= + ×

lMd = 158

Facant= 13

20 13

Md 158 4 160,55

11

= + × =

h = 4

FMd = 11

Interpretação: 50% das pessoas têm altura inferior a 160,55 cm.

Exemplo 2 Consideremos a distribuição de freqüência por classes das notas dos 50

alunos da turma PEST e vamos calcular a sua mediana.

Notas de 50 alunos da turma PEST

Classes Notas Fi Faci

1 30 |--- 40 4 4

2 40 |--- 50 6 10

3 50 |--- 60 8 18

4 60 |--- 70 13 31 ® classe mediana

5 70 |--- 80 9 40

6 80 |--- 90 7 47

7 90 |--- 100 3 50

Total 50 ----

Fonte: Dados Hipotéticos

48

• Calcula-se

n

2

®

50

25

2

=

• Localiza-se a classe mediana (a classe que contém o termo de ordem

2

n )

Classe mediana = 4ª classe

• Aplica-se a fórmula:

ant

Md

Md

n

Fac

Md l 2 h

F

= + ×

lMd = 60

Facant= 18

25 18

Md 60 10 65,38

13

= + × =

h = 10

FMd = 13

Interpretação: 50% das notas foram inferiores a 65,38.

EXERCÍCIOS:

1. Determinar a média e a mediana das séries:

a) 2; 5; 8; 10; 12; 8; 5; 12

b) 3,4; 5,2; 4,7; 6; 8,4; 9,3; 2,1; 4,8

2. Determinar a média e a mediana das distribuições:

a)

xi 2 3 4 5 7

Fi 3 5 8 4 2

b)

xi 73 75 77 79 81

Fi 2 10 12 5 2

c)

Classes 1 |--

-

3 3 |--

-

5 5 |--

-

7 7 |--

-

9 9 |--

-

11 11 |--

-

13

Fi 3 5 8 6 4 3

d)

Classes 22 |--

-

25 25 |--

-

28 28 |--

-

31 31 |--

-

34

Fi 3 5 8 6

49

2.1.5 MODA (Mo)

A moda é o valor mais freqüente do conjunto de dados observados.

a) Moda para dados não agrupados

Para determinar a moda, basta identificar o(s) elemento(s) que mais se repete(m).

Exemplo: Determinar a moda dos conjuntos de dados abaixo:

a) 2; 8; 3; 5; 4; 5; 3; 5; 1

O elemento que mais se repete é o 5. Portanto: Mo = 5 (seqüência unimodal).

b) 6; 10; 5; 6; 10; 2

Neste conjunto de dados o elemento 6 e o elemento 10 se repetem mais vezes

que os demais. Portanto: Mo1 = 6 e Mo2 = 10 (seqüência bimodal).

c) 2; 2; 8; 8; 5; 5; 6; 6

Não há nenhum elemento que se destaque por possuir maior freqüência.

Portanto, a série não possui moda e é dita amodal.

Observação: A moda só é considerada medida de tendência central no caso

unimodal. Nos demais casos é uma medida estatística de análise.

b) Moda para dados agrupados sem intervalos de classes

Neste caso, basta identificar o(s) elemento(s) de maior freqüência.

Exemplo: Determinar a moda das distribuições:

a)

i xi Fi

1 0 2

2 2 5

3 3 8

4 4 3

5 5 1

Total

Mo = 3 (Distribuição Unimodal)

50

b)

i xi Fi

1 1 2

2 2 5

3 3 4

4 4 5

5 5 1

Total

Mo1 = 2 e Mo2 = 4 (Distribuição Bimodal)

c)

i xi Fi

1 4 5

2 5 5

3 8 5

4 10 5

Total

Não há moda (Distribuição Amodal)

c) Moda para dados agrupados com intervalos de classes

Neste caso, há diversos processos para o cálculo da moda.

i) Fórmula de Czuber

• Identifica-se a classe modal (a que possui maior freqüência);

• Aplica-se a fórmula:

1

Mo

1 2

Mo l h D

= + ×

D + D

,

onde:

lMo = limite inferior da classe modal.

D1 = diferença entre a freqüência absoluta da classe modal e a freqüência

absoluta da classe anterior à classe modal.

D2 = diferença entre a freqüência absoluta da classe modal e a freqüência

absoluta da classe posterior à classe modal.

h = amplitude da classe modal.

51

Exemplo 1

Determinar a moda da distribuição:

i classes Fi

1 0 |--- 1 3

2 1 |--- 2 10

3 2 |--- 3 17 ® Classe Modal

4 3 |--- 4 8

5 4 |--- 5 5

TOTAL 43

• Identifica-se a classe modal: 3ª classe (maior freqüência = 17)

• Aplica-se a fórmula:

1

Mo

1 2

Mo l h D

= + ×

D + D

,

onde:

lMo = 2;

D1 = 17 – 10 = 7;

D2 = 17 – 8 = 9;

h = 3 – 2 = 1

Logo:

7

Mo 2 1 2,44

7 9

= + × =

+

Exemplo 2 Considere a distribuição abaixo.

Salários dos Empregados da Empresa PEST

Classes Salários (classes) Fi (nº funcionários)

1 800 |-¾ 1800 70

2 1800 |-¾ 2500 140

3 2500 |-¾ 3000 140

4 3000 |-¾ 5000 60

Total 410

Fonte: Dados Hipotéticos

Como as amplitudes das classes não são iguais, vamos utilizar as densidades das

classes i

i

F

h

para identificar a classe modal (aquela com a maior densidade)

52

Salários dos Empregados da Empresa PEST

Classes Salários

(classes)

xi

(pto médio)

Fi

(nº funcionários)

Fi/hi

(densidade)

1 800 |-¾ 1800 1300 70 0,07

2 1800 |-¾ 2500 2150 140 0,20

3 2500 |-¾ 3000 2750 140 0.28

4 3000 |-¾ 5000 4000 60 0,03

Total 410

Fonte: Dados Hipotéticos

• Identifica-se a classe modal: 3ª classe (maior densidade = 0,28)

• Aplica-se a fórmula:

1

Mo

1 2

Mo l h D

= + ×

D + D

,

onde:

lMo = 2500;

D1 = 0,28 – 0,20 = 0,08;

D2 = 0,28 – 0,03 = 0,25;

h = 500

Logo:

0,08

Mo 2500 500 2500 0,24 500 2621,21

0,08 0,25

= + × = + × =

+

Assim, R$ 2621,21 é o salário mais freqüente entre os 410 funcionários dessa

empresa.

ii) Fórmula de Pearson

Mo @ 3Md − 2x

Na fórmula de Pearson a moda é aproximadamente igual a diferença entre o

triplo da mediana e o dobro da média. Esta fórmula dá uma boa aproximação

quando a distribuição apresenta razoável simetria em relação à média.

Observação: Para calcular a moda de uma variável, precisamos apenas da

distribuição de freqüência. Para a mediana necessitamos minimamente ordenar os

valores atribuídos à variável. A média só pode ser calculada para variáveis

quantitativas. Assim, para as variáveis nominais somente podemos trabalhar com a

mediana, além da moda.

53

EXERCÍCIOS:

1. Para cada distribuição, determine a média, a mediana e a moda:

a)

xi 72 75 78 80

Fi 8 18 28 38

b)

Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22

Fi 6 10 15 10 5

3. MEDIDAS SEPARATRIZES

As medidas separatrizes são valores que dividem o conjunto de dados observados

em um determinado número de partes, contendo cada uma a mesma quantidade de

elementos.

São elas:

• Mediana

É considerada também uma medida separatriz.

• Quartis

São valores que dividem o rol em quatro partes iguais, cada uma com 25% dos

elementos. Ao todo tem-se 3 quartis: Q1 (1º quartil), Q2 (2º quartil) e Q3 (3º

quartil).

25% 25% 25% 25%

Q1 Q2=Md Q3

Observe que:

o Abaixo do 1º quartil tem-se 25% dos elementos;

o Abaixo do 2º quartil tem-se 50% dos elementos;

o Abaixo do 3º quartil tem-se 75% dos elementos;

• Decis

São valores que dividem o rol em dez partes iguais, cada uma com 10% dos

elementos. Ao todo tem-se 9 decis: D1 (1º decil), D2 (2º decil), ... , D9 (9º decil).

54

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9

Observe que:

• Abaixo do 1º decil tem-se 10% dos elementos;

• Abaixo do 2º decil tem-se 20% dos elementos;

• Abaixo do 3º decil tem-se 30% dos elementos; e assim sucessivamente.

• Centis ou Percentis

Dividem o rol em cem partes iguais, cada uma com 1% dos elementos. Ao todo

tem-se 99 centis: P1 (1º centil), P2 (2º centil), ... , P99 (99º centil).

1% 1% 1% 1% ... 1% ... 1% ... 1%

P1 P2 P3 P4 P50 P51 P80 P81 P99

Observe que:

• Abaixo do 1º centil tem-se 1% dos elementos;

• Abaixo do 2º centil tem-se 2% dos elementos;

• Abaixo do 3º centil tem-se 3% dos elementos;

• Abaixo do 4º centil tem-se 4% dos elementos; e assim sucessivamente.

Cálculo das medidas separatrizes:

a) Separatrizes para dados não agrupados

Devemos ordenar os elementos, identificar a medida que queremos obter

(quartil, decil ou centil), localizar a posição da medida desejada e identificar o

elemento que ocupa esta posição, de acordo com o esquema a seguir:

Quartil i:

i n

pos ,i 1,2,3

4

×

= =

Decil i:

i n

pos ,i 1,2,...,9

10

×

= =

Centil

...

Baixar como  txt (64 Kb)  
Continuar por mais 40 páginas »