TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

ESTASTITCAS CORRELAÇÃO E REGRESSÃO

Relatório de pesquisa: ESTASTITCAS CORRELAÇÃO E REGRESSÃO. Pesquise 860.000+ trabalhos acadêmicos

Por:   •  14/11/2014  •  Relatório de pesquisa  •  1.103 Palavras (5 Páginas)  •  270 Visualizações

Página 1 de 5

Faculdade Anhanguera de Valparaíso

Curso: Administração

Turma: 4º “B”

Disciplina: eSTATÍSTICA

CORRELAÇÃO E REGRESSÃO

Valparaíso-GO

2013

INTRODUÇÃO

A palavra probabilidade vem do latim, que significa testar, provar. Ela é utilizada em circunstâncias onde queremos identificar um resultado mais específico. Neste estudo veremos a distribuição de probabilidade que associa uma probabilidade a cada resultado numérico de um experimento. Dentre estas distribuições temos a distribuição discreta, que é uma função cujo domínio são os valores da variável, e a imagem são as probabilidades de cada variável assumir cada valor do domínio. Esta função está sempre entre o intervalo de 0 e 1.

Já a distribuição normal é uma das mais importantes distribuições da estatística, conhecida como distribuição de Gauss ou Gaussiana. Ela pode descrever uma série de fenômenos físicos e financeiros. È descrita por seus parâmetros de média ou padrão, conhecendo estes segmentos pode-se determinar qualquer probabilidade de uma distribuição normal.

Ressaltamos também os estudos sobre correlação que é a medida padronizada de relação entre duas variáveis. E regressão linear é a análise de regressão que usa a relação entre uma variável x, e outra y.

RELATÓRIO 4- CORRELAÇÃO E REGRESSÃO LINEAR

A correlação e a medida padronizada da relação entre duas variáveis e indica forca e a direção do relacionamento linear entre duas variáveis aleatórias. Os dados podem ser representados por pares ordenados (x, y), onde X e a variável independente e ou explanatória e Y e a variável dependente ou a resposta.

Pode se determinar uma reta ou curva que representa a relação entre as variáveis, mediante a observação direta do próprio diagrama. O diagrama de dispersão e composto por pares ordenados entre (X, Y), neste diagrama de dispersão os pares são colocados no gráfico como pontos em um plano coordenado. A variável independente X e uma medida pelo eixo horizontal, e a variável. Um diagrama de dispersão pode ser usado para determinar, se existe uma correlação linear entre duas variáveis. Os diagramas de dispersão mostram diversos tipos de correlação, entre ela temos correlação linear negativa, correlação que X aumenta e Y tende a decrescer, correlação linear positiva que X e Y tende a aumentar.

Interpretar a com correlação usando um diagrama de dispersão pode ser subjetivo. Uma maneira mais precisa de se medir o tipo e a forca de uma correlação linear entre duas variáveis e calcular o coeficiente de correlação.

O coeficiente de correlação é uma medida da forca e direção de uma relação linear entre duas variáveis. O símbolo r representa o coeficiente de correlação amostral. A formula para r e:

Onde n é o numero de pares de dados, o coeficiente de correlação populacional é representado por p.

O quociente da variação explicada pela variação total é dominado coeficiente de determinação. Se a variação explicada for nula, isto é, se a variação total não for explicada, esse quociente terá calor compreendido entre zero a um. Como a relação e não negativa ela será representada por . A quantidade de r, e denominada coeficiente de correlação.

Na correlação ordinal em vez de utilizar valores precisos das variáveis, ou quando essa precisão for inútil,os dados poderão ser dispostos em ordem de tamanho de importância etc.,mediante o emprego dos números 1,2.....,N.Se duas variáveis X e Y estão ordenadas dessa maneira , o coeficiente de correlação ordinal e dado por :

A linha de regressão e chamada de linha de melhor ajuste, essa e a linha param qual a soma dos quadros dos resíduos e um mínimo. A variação total sobre uma linha de regressão é a soma dos quadrados das diferenças entre o valor de Y e cada par pedido e a media de Y.

A variação explicada e a soma dos quadrados das diferenças

entre cada valor Y previsto e a media de Y. A variação não explicada e a soma dos quadrados das diferenças entre o valor y de cada par de pedido e cada valor y previsto correspondente.

Nos intervalos de previsão duas variáveis tem uma distribuição normal bivariada se, para quaisquer valores de x fixos, os valores de y correspondentes são normalmente distribuídos. Como as equações de regressão são determinadas usando dados das amostras e porque se supõe que x e y tenham uma distribuição normal bivariada, você pode construir um intervalo de previsão para o valor real de y. Para construir um intervalo de previsão,use uma distribuição t com n-2 graus de liberdade.

Desafio A

A empresa “Vendomundo” é responsável pela importação de 20% das marcas que uma determinada cadeia de lojas de desconto de roupas femininas comercializa. Ao longo de 25 anos, essa cadeia de lojas ampliou sua participação de mercado aumentando o número de pontos de suas lojas no Brasil. Nunca foi utilizado um método sistemático para a seleção desses pontos. A seleção de pontos era baseada, principalmente, no que era considerado um bom aluguel ou uma boa localização. Neste ano, com um planejamento estratégico para abrir diversas lojas novas, foi pedido ao diretor de projetos especiais e de planejamento

um método de previsão de vendas semanais para todas as novas lojas. Os dados a seguir representam as vendas semanais (em milhares de reais) e a área da loja (em metros quadrados) para a amostra de 14 lojas da cadeia:

Loja

Vendas Semanais (em milhares de R$)Y

Área (m²)

X

1

7.394

160

...

Baixar como (para membros premium)  txt (7.5 Kb)  
Continuar por mais 4 páginas »
Disponível apenas no TrabalhosGratuitos.com