TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Data Warehouse

Pesquisas Acadêmicas: Data Warehouse. Pesquise 784.000+ trabalhos acadêmicos

Por:   •  15/3/2014  •  3.582 Palavras (15 Páginas)  •  255 Visualizações

Página 1 de 15

Modelando Metadados de Qualidade no Data Warehouse

Glenda Carla Moura Amaral

1

, Maria Luiza Machado Campos

2

1

Diretoria de Administração da Marinha

Marinha do Brasil

2

DCC-IM/NCE

Universidade Federal do Rio de Janeiro

glenda@dadm.mar.mil.br, mluiza@nce.ufrj.br

Resumo

Atualmente o Data Warehouse constitui uma importante ferramenta de apoio ao processo de tomada

de decisão.Contudo, para que se possa tirarvantagem dos recursos de informação de forma

satisfatória, é necessário que as informações utilizadas sejam confiáveis, ou que pelo menos, o grau

de confiabilidade das mesmas possa ser considerado durante o processo de tomada de decisão. Para

que os metadados de qualidade possam ser disponibilizados para o usuário final, junto com o

resultado das consultas, é necessário que este tipo de informação seja adequadamente considerada e

modelada como parte integrante da arquiteturade dados do Data Warehouse.O presente artigo

apresenta uma abordagem para a modelagem dos metadados de qualidade no Data Warehouse, que

fundamenta-se, principalmente, nas característicassubjetiva e multidimensional da qualidade.

1. Introdução

Na chamada era das organizações baseadas em conhecimento, ou era do capitalismo

intelectual, a informação é um recurso organizacional crítico. Paraatender a estas novas

necessidades, um novo conjunto de conceitos e ferramentas vem ganhando destaque nos

últimos anos: a tecnologia de Data Warehouse(DW) e suporte ao processamento analítico,

que oferecem às organizações uma maneira flexível e eficiente de obter as informações

necessárias a seus processos decisórios. Devido à crescente utilização do Data Warehouse

(DW) em tomadas de decisão, críticas para o negócio da empresa, adotar uma estratégia para

garantir a qualidade dos dados nesse ambiente é fundamental.

Da mesma forma que uma casa construída sobre alicerces fracos tende a desmoronar,

conclusões baseadas em dados incorretos dificilmente irão produzir os resultados esperados.

Dados de má qualidade podem ocasionar falhas nos processos de negócio e custos

relacionados a pessoas, materiais, tempo, dinheiro e até mesmo a perda definitiva de clientes.

O TDWI (The Data Warehouse Institute) estima que problemas relacionados à qualidade de

dados custam, para os Estados Unidos, mais de $600 bilhões por ano [Eckerson 2002].

O custo da má qualidade de dados pode ser exemplificado pelo caso de uma

companhia de seguros que recebe cerca de 2 milhões de pedidos por mês, onde cada pedido

contém 377 elementos de dados. Supondo que haja uma taxa de erros de 0,001, os dados dos

pedidos conterão mais de 754.000 erros por mês e mais de 9,04 milhões de erros por ano. Se

essa companhia considera que 10% dos elementos de dados são críticos para suas decisões e

processos de negócio, será necessário corrigirquase 1 milhão de erros por ano. Se essa

empresa estima um custo de $10 por erro, o risco a que ela está exposta, em função da má

qualidade de dados, é de $10 milhões por ano [Eckerson 2002].

Uma vez que a qualidade dos dados afeta o resultado das análises, é interessante que o

grau de qualidade das informações analíticas seja considerado durante o processo de tomada

de decisão. Essas informações correspondem a metadados de qualidade e devem estar

disponíveis para serem apresentadas ao usuário final juntamente com o resultado das

consultas. Para isso, é necessário que estes metadados sejam devidamente considerados e

modelados como parte integrante da arquitetura de dados do ambiente em questão.

Neste artigo é apresentada uma abordagem para a modelagem de metadados de

qualidade no Data Warehouse. A modelagem desses metadadosjá foi objeto de estudo de

diversos trabalhos na literatura, contudo nenhuma das propostas encontradas tem como foco a

subjetividade e multidimensionalidade da qualidade de dados. A solução adotada no presente

trabalho fundamenta-se principalmente nestes dois aspectos.

O artigo está organizado daseguinte forma: a seção 2 apresenta alguns trabalhos

relacionados. A seção 3 apresenta a abordagem proposta para a modelagem de metadados de

qualidade no DW. As conclusões e sugestões para trabalhos futuros são discutidas na seção 4.

2. Trabalhos Relacionados

Esta seção apresenta uma breve descrição de algumas pesquisas realizadas sobre a

modelagem da qualidade no DW, segundo a visão de Marco [2000a] [2000b], Rothenberg

[1996] e Kimball [2000].

Marco [2000a] [2000b] adota a utilização de metadados técnicos para armazenar

informações sobre a qualidade dos dados

...

Baixar como (para membros premium)  txt (26.8 Kb)  
Continuar por mais 14 páginas »
Disponível apenas no TrabalhosGratuitos.com