TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Mineração De Dados: Uma Abordagem Conceitual

Ensaios: Mineração De Dados: Uma Abordagem Conceitual. Pesquise 860.000+ trabalhos acadêmicos

Por:   •  8/11/2013  •  1.883 Palavras (8 Páginas)  •  261 Visualizações

Página 1 de 8

Abstract: The amount of data produced and stored is increasing daily and

Data Mining is highlighted as an intelligent technology and practice of

extracting information, and you can find a variety of studies on the subject.

The article aims to introduce basic concepts of this tool to interested parties

who are beginning their study of such. It presented some concepts about the

techniques involving the discovery of knowledge in large data sets, besides

mentioning the existence of specific software and some applications of this

tool.

Resumo: A quantidade de dados produzidos e armazenados tem aumentado

diariamente e a Mineração de dados é destacada como uma tecnologia

inteligente e prática de extração de informações, sendo possível encontrar

uma variedade de estudos sobre o tema. O artigo possui como objetivo

introduzir conceitos básicos dessa ferramenta a interessados que estão

iniciando o seu estudo sobre tal. É apresentado alguns conceitos sobre as

técnicas que envolvem a descoberta de conhecimento em grandes conjuntos

de dados, além de citar a existência de softwares específicos e algumas

aplicações dessa ferramenta.

1.Introdução

Na atualidade o volume de dados produzidos e armazenados pelos diversos sistemas de

computação tem aumentado expressivamente. Estima-se que a quantidade de

informação no mundo dobra a cada 20 meses e que o tamanho e a quantidade dos

bancos de dados crescem com velocidade ainda maior. É necessário ter ferramentas que

facilitem a análise desses dados de forma inteligente e prática, possibilitando

transformar terabytes em conhecimento. As informações de grande valia estão

implícitas em um grande número de informações e não são facilmente encontradas

utilizando os sistemas convencionais, surgindo a Mineração de dados.

A mineração de dados é uma tecnologia que abrange três áreas: estatística

clássica, inteligência artificial e aprendizado de máquina. Tal ferramenta permite a

extração não trivial de conhecimento previamente desconhecido e potencialmente útil

de um banco dados.

O presente artigo tem como finalidade apresentar conceitos sobre as principais

técnicas que envolvem a descoberta de conhecimento em grandes conjuntos de dados e

descrever algumas características da mineração de dados. Além disso, suas técnicas e as

metodologias estatísticas que as fundamentam.

2. Desenvolvimento

Considere-se que se algum significado especial é atribuído a um dado, ele se transforma

em uma informação (ou fato). Se uma norma é elaborada, a interpretação do confronto

entre o fato e a regra constitui um conhecimento. Como o processo KDD é constituído

de várias etapas que são executadas de forma interativa e iterativa, as etapas são

interativas porque envolvem a cooperação da pessoa responsável pela análise de dados

(conhecimento prévio do domínio orientará a execução do processo). Por outro lado, a

iteração é em decorrência de que, em muitas vezes, esse processo não é executado de

forma sequencial, mas envolve repetidas seleções de parâmetros e conjunto de dados,

como aplicações das técnicas de Mineração de Dados (Data Mining) e posterior análise

dos resultados obtidos. Dessa forma, um resultado mais refinado pode ser extraído,

apresentando maior coerência e confiabilidade.

A Mineração de Dados tem início com o entendimento do domínio da aplicação

e dos objetivos a serem atingidos. Após, há um agrupamento de todos os dados

necessários para alcançar um objetivo específico. Como em toda análise quantitativa, a

qualidade dos dados é essencial para a obtenção de resultados confiáveis. Dessa forma,

dados limpos e compreensíveis são imprescindíveis para o sucesso do Data Mining. A

fim de se assegurar tais objetivos, a limpeza dos dados (Data Cleaning) é realizada por

meio de um pré-processamento. Devido sua grande importância para o processo de

mineração de dados essa etapa pode tomar até 80% do tempo necessário para todo o

processo, devido às dificuldades na integração de bases de dados distintas. Os dados

pré-processados devem passar por outra transformação, que os armazena

adequadamente, visando facilitar o uso das técnicas de Data Mining. Nessa fase, o uso

de Data Warehouses é bastante utilizado. Esse processo é definido utilização de um

depósito central de dados, extraído de dados operacionais, em que a informação é

orientada a assuntos de natureza histórica. Devido a essas características, Data

Warehouses tendem a se tornar grandes fonte de dados extremamente organizados,

facilitando a aplicação do Data Mining. Após essa etapa é que se chega especificamente

à

...

Baixar como (para membros premium)  txt (14.3 Kb)  
Continuar por mais 7 páginas »
Disponível apenas no TrabalhosGratuitos.com