TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

A Mineração de dados utilizando a álgebra linear

Por:   •  15/11/2017  •  Trabalho acadêmico  •  632 Palavras (3 Páginas)  •  542 Visualizações

Página 1 de 3

                    UFMG – Universidade Federal de Minas Gerais[pic 1]

[pic 2]

ENGENHARIA CIVIL

 

Aluno: Larissa Valentini

Matrícula: 2014014102

 Mineração de dados utilizando a álgebra linear

Professor:  Marcos Augusto dos Santos

Problema: Wine

[pic 3]

Belo Horizonte

2014


  • Introdução:

O vinho é uma bebida obtida genericamente pela fermentação alcoólica do sumo da uva, feita por vários tipos de leveduras que consomem os açúcares da fruta e os transformam em álcool. Os diversos processos de obtenção do vinho (fermentação parcial, total; uvas inteiras ou esmagadas; etc) remetem a uma grande diversidade de amostras da bebida.

Dessa forma, o vinho pode ser classificado por diversos critérios como aroma, cor, sabor, textura e teor alcoólico. Pode ser dividido também em dois grupos: o tinto e o branco, nos quais os vinhos tintos são feitos de uvas mais escuras e são considerado mais saudáveis do que os brancos.

Ao analisar o vinho quimicamente é possível identificar uma série de características essenciais para a sua classificação. Diante disso, o problema Wine traz a análise química de 178 tipos de vinhos de três culturas distintas de uma determinada região da Itália. As categorias estabelecidas para obter os dados para essa análise foram:

1) Álcool

2)Acidez

3)Ash

4) Alcalinidade

5)Magnésio

6) Antioxidante

7) Flavonoides

8) antocianinas

9) Proantocianidinas

10) Intensidade da cor

11) Aroma

12) OD280/OD315 diluídos no vinho

13) Prolina (aminoácido)

Utilizando os dados dessa análise química é possível determinar a origem dos vinhos, uma vez que cada cultivo possui determinadas características que serão associadas à bebida em questão. Para isso usamos o conceito de Mineração de Dados, que usando análise matemática de uma grande quantidade de informações, determina padrões e tendências que permitem regras de associação ou sequências temporais, detectando relação entre as variáveis. Dessa forma, é possível separar, a partir de suas características, os 178 vinhos computados de acordo com suas respectivas culturas.

  • Entrada e Saída:

A entrada desses dados exige uma matriz de 178x14, sendo que as colunas representam as informações da análise química (itens especificados acima) e as linhas os 178 vinhos do problema. A mineração de dados no matlab, entretanto, produz como saída dois gráficos, sendo que o primeiro consiste na redução de posto e o segundo em um gráfico de dispersão que consiste em 3 conjuntos diferentes de pontos, representando os três cultivos procurados.

  • Metodologia:

Os vinhos podem ser divididos entre os três cultivos a partir do método de decomposição por valores singulares, que consiste na redução de posto, de acordo com o seguinte comando (sendo que U e V são matrizes ortogonais e S é uma matriz diagonal - com seus elementos de forma decrescente):

...

Baixar como (para membros premium)  txt (5.4 Kb)   pdf (238.4 Kb)   docx (306.2 Kb)  
Continuar por mais 2 páginas »
Disponível apenas no TrabalhosGratuitos.com