TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

A Mineração de Dados

Por:   •  18/6/2018  •  Seminário  •  3.061 Palavras (13 Páginas)  •  127 Visualizações

Página 1 de 13

[pic 1]

UNIÃO EDUCACIONAL DO NORTE

DEBORA NASCIMENTO

DUANE MARQUES DE SOUZA

GABRIELA MACEDO RODRIGUES

LUIS FARIAS DE PAIVA

MINERAÇÃO DE DADOS

[pic 2]

DEBORA NASCIMENTO

DUANE MARQUES DE SOUZA

GABRIELA MACEDO RODRIGUES

LUIS FARIAS DE PAIVA

MINERAÇÃO DE DADOS

Trabalho apresentado à disciplina SISTEMAS DE INFORMAÇÃO no curso de Administração de Empresas para composição parcial da nota N2. Corresponde à 30% do valor total da nota.  Professor: FERNANDA FIGUEIRA. 

RIO BRANCO

2018

INTRODUÇÃO

Grandes volumes de dados são gerados por grandes corporações, ou por empresas que lidam com engenharia genética e previsão do tempo, por exemplo. Para competir efetivamente, homens de negócio devem ser capazes de compreender seus dados disponíveis. Identificar padrões e tomar decisões em tempo permite que se mantenha a competitividade. A mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados. A mineração de dados usa análise matemática para derivar padrões e tendências que existem nos dados. Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.

MINERAÇÃO DE DADOS

  1. CONCEITO

Na etapa de Mineração de Dados é feita uma busca de conhecimento sobre os dados preparados na etapa anterior, através de técnicas e algoritmos específicos. Primeiro se escolhe a tarefa de mineração a ser realizada, em seguida a técnica, que por conseqüência implica na escolha de um algoritmo para a realização dos trabalhos. Mas o que vem a ser realmente a Mineração de Dados? Existem muitas definições para o termo Mineração de Dados na literatura. Dependendo da abordagem, estas definições podem focar mais nas tecnologias usadas, área de pesquisa Estatística ou Inteligência Artificial, ou mesmo no próprio processo de descoberta de conhecimento. Algumas destas definições abordam a Mineração de Dados como sendo o próprio processo de descoberta de conhecimento. Outras definições mais atuais já consideram a Mineração de Dados como uma etapa do processo KDD . “A mineração de dados é um processo de descoberta automática de informações úteis em grandes depósitos de dados, com o intuito de descobrir padrões úteis e recentes que poderiam de outra forma permanecer ignorados.” Acredita-se ainda acrescenta que a mineração de dados é uma intersecção entre inteligência artificial, aprendizado de máquina e tecnologias de banco de dados, sendo capazes, muitas vezes de predizer resultados futuros a partir de uma gama de dados de entrada. O principal objetivo da Mineração de Dados é, então, a descoberta de conhecimento, usando uma metodologia com o intuito de extrair informações preditivas das bases de dados. O método de descoberta de conhecimento deve ser flexível, eficiente e genérico, e a Mineração de Dados em si, deve ser compreensível por usuários humanos, trazer resultado corretos tanto quanto possível, e ser surpreendente no que tange a descoberta de conhecimento novo, interessante e útil. Para isso, a Mineração de Dados conta com diversas técnicas e algoritmos, uma vez que esse processo está intimamente relacionado à Estatística, Inteligência Artificial e Aprendizado de Máquina. Alguns exemplos podem ser: árvores de decisão, redes neurais, sistemas baseados em regras e programas estatísticos, podendo ser usados isoladamente ou combinados. Essas técnicas podem desempenhar quatro tarefas principais, detalhadas a seguir:

• Modelagem de previsão: Consiste em prever o valor de uma variável alvo baseando-se em uma função das variáveis explicativas, isto é, construir um modelo que obtenha um valor para a variável a ser prevista com menor índice de erro possível, a partir da análise de variáveis históricas disponíveis. Essa modelagem possui dois tipos: classificação, quando a variável alvo é binária, e regressão, quando a variável alvo possui valor contínuo. A modelagem de previsão pode ser usada, por exemplo, para identificar quais clientes responderão a uma campanha de marketing, ou determinar perturbações no ecossistema da Terra, ou ainda julgar a probabilidade de um paciente ter uma doença.

• Análise de associação: Objetiva identificar padrões em que as características das variáveis analisadas estão altamente associadas, de modo a extrair os padrões mais interessantes de forma eficiente. Essa análise pode indicar que quando ocorre um determinado evento, tantos outros eventos ocorrem também, sendo usada, por exemplo, na identificação de genes que funcionam de forma associada ou na determinação de quais páginas da internet serão acessadas juntas por um usuário.

• Análise de grupo: Busca identificar grupos com características semelhantes, intimamente relacionados entre si. Isso através da análise de diversos atributos, traçando e definindo agrupamento de modo que os elementos pertencentes a eles sejam mais parecidos entre si do que com elementos dos outros grupos. A análise de grupo pode ser usada no agrupamento de clientes e para compactar dados.

 • Detecção de anomalias (ou fatores estranhos): Identifica características que sejam significativamente diferentes do restante dos dados, porém evitando rotular dados normais como anômalos. Essa tarefa tem sucesso quando possui uma alta taxa de detecção de elementos anômalos e baixa taxa de alarme falso. Pode ser usada na detecção de fraudes, invasões de redes, doenças e perturbações no meio ambiente. A escolha das técnicas de mineração de dados a serem usadas é muito relativa, dependendo da tarefa específica a ser executada e dos tipos e qualidade dos dados disponíveis (BARBOSA, 2007 e DIAS apud HARRISON, 1998). Essa escolha pode ser norteada seguindo duas etapas, conforme Dias (apud BERRY e LINOFF, 1997) sugerem: i) Traduzir o problema de negócio a ser resolvido em séries de tarefas de mineração de dados; ii) Compreender a natureza dos dados disponíveis em termos de conteúdo e tipos de campos de dados e estrutura das relações entre os registros. A Mineração de Dados, tida como uma pesquisa sobre uma base dados, pode ser feita de três maneiras (BARBOSA, 2007):

...

Baixar como (para membros premium)  txt (21.6 Kb)   pdf (376.5 Kb)   docx (116 Kb)  
Continuar por mais 12 páginas »
Disponível apenas no TrabalhosGratuitos.com