Desenvolva um algoritmo capaz de calcular a distância entre dois pontos na euclidogênese cósmica

Projeto de pesquisa: Desenvolva um algoritmo capaz de calcular a distância entre dois pontos na euclidogênese cósmica. Pesquise 862.000+ trabalhos acadêmicos

Por: csacosta • 13/5/2014 • Projeto de pesquisa • 1.698 Palavras (7 Páginas) • 761 Visualizações

Página 1 de 7

2- Elabore um algoritmo capaz de calcular a distancia ente dois pontos em um espaço euclidianUNIVERSIDADE FEDERAL DE PERNAMBUCO

GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

CENTRO DE INFORMÁTICA

2007.1

Avaliação do Comportamento de Métricas de Distância com Ponderação de Características

PROPOSTA DE TRABALHO DE GRADUAÇÃO EM

APRENDIZAGEM DE MÁQUINA

Aluno – Tiago Buarque Assunção de Carvalho <tbac@cin.ufpe.br>

Orientador – George Darmiton da Cunha Cavalcanti <gdcc@cin.ufpe.br>

Co-Orientador – Tsang Ing Ren <tir@cin.ufpe.br>

Recife, 18 de Maio de 2007.

1. Contexto

O algoritmo de classificação baseado no vizinho mais próximo (Nearest Neighbor – NN) é uma técnica amplamente empregada para reconhecer padrões. O centro de seu funcionamento está em descobrir o vizinho mais próximo de uma dada instância. O algoritmo (k-Nearest Neighbor – k-NN) pertence a um grupo de técnicas denominada de Instance-based Learning. Nesse caso, são encontrados os k vizinhos mais próximos do padrão de consulta, ao invés de apenas o vizinho mais próximo. Dito dessa forma, esse método é bastante simples e de fácil implementação.

O kNN classifica um dado elemento de acordo com as respectivas classes dos k (k ≥ 1) vizinhos mais próximos – pertencentes a uma base de treinamentos dada. O algoritmo calcula a distância do elemento dado para cada elemento da base de treinamento e então ordenar os elementos da base de treinamento do mais próximo ao de maior distância. Dos elementos ordenados selecionam-se apenas os k primeiros, que servem de parâmetro para a regra de classificação. Exemplo: 1-NN é um k-NN sabendo que k = 1, ou seja, seleciona-se apenas o elemento do treinamento mais próximo da instância que se pretende classificar. 5-NN vai usar os cinco elementos mais próximos da instância e baseado nas classes dos cinco elementos, infere-se a classe do elemento de teste.

Dois pontos importantes no k-NN são: a regra de classificação e função que calcula a distância entre duas instâncias. A regra de classificação diz como o algoritmo vai tratar a importância de cada um dos k elementos selecionados – os k mais próximos. À função de distância cabe a tarefa de mensurar a disparidade entre dois elementos de forma a poder identificar quais são os k-NN.

Para k = 1 a regra de classificação é irrelevante, pois só existe um elemento só tem uma classe, logo atribui-se a classe desse elemento àquele que se pretende classificar. Porém, com k > 1, é preciso haver uma regra para discernir a qual classe se atribuirá o elemento. Em [1] são revistas as duas regras de classificação clássicas: maioria na votação e peso pela distância. Na primeira, cada elemento tem uma influência igual, a classe escolhida é aquela que possuir mais representantes entre o k-NN. Já no peso pela distância cada k-vizinho tem um peso inversamente proporcional à sua distância.

Na literatura são as funções de distância são o maior viés de estudo no kNN, pois possibilitam as maiores variações no resultados obtidos por esse algoritmo, podendo inclusive obter resultados em nível de estado da arte nessa área [1], [2], [4] e [6].

Em se tratando de distância entre dois elementos é preciso definir o que são esses elementos: cada elemento tem uma classe – usada na regra de classificação – e um vetor de atributos, e cada um desses atributos tem um tipo que indica quais operações se pode realizar sobre o atributo. E é por meio dessas operações que se torna possível o cálculo das distâncias. Dois elementos do mesmo domínio possuem o mesmo número n de atributos, seja i uma posição no vetor de atributos de um elemento qualquer, 1  i  n, se dois elementos pertencem ao mesmo domínio os atributos da posição i de cada elemento têm o mesmo tipo. Em [1] é listado quatro tipos de atributos: nominal, ordinal, intervalar e racional. Contudo apenas dois são considerados: nominal, também chamado de categórico, e racional, chamado numérico. Um atributo categórico é um nome ou um rótulo, e permite somente as operações de “igualdade” e de “diferença”. O numérico é um número, portanto, pode-se comparar não só a igualdade, mas também “maior”, “menor”, “adição”, “subtração”, “multiplicação” e “divisão”. Exemplo: uma base de canetas pode ser representada por quatro atributos: cor da tinta, fabricante, tamanho da ponta e preço. Caneta1(azul, BIC, 0.7, 0,50) e Caneta2(preta, Faber Castell, 0.5, 1,00). Pode-se definir que o preço é um atributo numérico e os demais são categóricos. Note que o tamanho da ponta apesar de poder ser representado por um número na prática é apenas um rótulo.

Wilson et al. [2] enumeram várias funções de distâncias entre atributos, o exemplo mais clássico é a distância Euclidiana para atributos numéricos e a distância de Hamming para atributos categóricos. Essas distâncias por si só não resolvem o problema de calcular a diferença entre dois vetores de atributos, é preciso combinar estratégias para realizar tal tarefa. Algumas estratégias apresentadas em [1] e em [2] estão aqui listadas: HEOM, HVDM, DVDM e IVDM.

Algumas das funções de distância em [2] servem como base para a comparação com outros resultados, portando valem a pena serem citadas nesse documento:

 HEOM – Heterogeneous Euclidean-Overlap Metric: utiliza distância Euclidiana para atributos numéricos e distância de Hammig(overlap) para atributos categóricos.

 HVDM – Heterogeneous Value Difference Metric: ainda usa distância Euclidiana para atributos numéricos, mas para atributos categóricos emprega vdm – value difference metric. Ambas as funções estão definidas abaixo. Na,x,c é o número de elementos na base de treinamento que, para o atributo de índice a, assumem o valor x e pertencem à classe c e Na,x é o somatório de Na,x,c para todas as classes, ou seja, o número total de elementos que assumem o valor x para a o atributo

...

Baixar como (para membros premium) txt (10.9 Kb)

Continuar por mais 6 páginas »

Disponível apenas no TrabalhosGratuitos.com

Ler documento completo Salvar

Informação

Denunciar este trabalho

Trabalhos relacionados

Elabore um algoritmo que leia dois valores do usuário e a operação
Elabore um algoritmo que leia dois valores do usuário e a operação que ele deseja executar (Operações: soma, subtração, divisão, multiplicação). Execute a operação desejada

1 Páginas • 1371 Visualizações
Algoritmo "Calcular renda"
1. Faça um algoritmo que receba o salário de um funcionário chamado Carlos. Sabe-se que o funcionário João tem um salário equivalente a um terço

2 Páginas • 2762 Visualizações
Calcular dois tipos de Ponto de Equilíbrio
Calcular dois tipos de Ponto de Equilíbrio: o Contábil e o Econômico, e somente do produto Hot-dog, considerando duas informações adicionais: a empresa contabiliza R$

1 Páginas • 714 Visualizações
O plano de estudos empíricos sobre como calcular o custo de produção de dois produtos diferentes
ANHANGUERA EDUC ACIONAL S.A. Faculdade Anhanguera de Taboão da Serra Ciências Contábeis ATPS – Contabilidade de Custos Etapas 3 e 4 Kaleb Aparecido da Silva

4 Páginas • 978 Visualizações
Avaliar Dois Projetos Industriais Independentes, Cujo Investimento Inicial Para O Projeto A é De R$ 1.200.000,00 E Para O Projeto B é De R$ 1.560.000,00. A Projeção é Para 10 Anos, Com Taxa mínima De Atratividade De 10,75% A.a. Calcular A Viabilidad
Considera-se dois investimentos, o A e o B. Investimento A prevê uma Taxa Selic nominal de 21,5% ao ano e uma inflação prevista de 5,85%

2 Páginas • 2338 Visualizações
Elabore Um Algoritmo Que Obtenha O mínimo múltiplo Comum (MMC) Entre Dois números Fornecidos.
ínicio inteiro : x, y , mmc; escreva ("Digite dois números"); leia (x,y); para a de 2 a 9 passo 1 faça ínicio a=1 se

2 Páginas • 4150 Visualizações
Aulas práticas sobre o roteiro sobre como calcular o custo Produção de dois produtos diferentes fabricados por uma empresa fictícia, a indústria de alimentos Showdog Ltda
Produção Acadêmica • Relatórios parciais, com os resultados das pesquisas realizadas nas Etapas 1 á 3. • Relatório Final na Etapa 4. Participação Para a

2 Páginas • 793 Visualizações
Algoritmo "Calcular horários de abertura"
Questão: 1- Algoritmo "Calcula Horas Trabalhadas" // Função: Faça um algoritmo que recebe o numero de horas trabalhadas e o valor //do salario mínimo. Seguindo

2 Páginas • 406 Visualizações
Algoritmo Para Calcular As Raízes Reais De Uma Equação De Segundo Grau
Escreva um algoritmo para calcular as raízes reais de uma equação de segundo grau. Leia a, b e c, calcule delta (b2-a*a*c) e x1e x2,

1 Páginas • 1221 Visualizações
Dados Seis números Inteiros Representando Dois Horários (horas, Minutos E Segundos), Faça Um Algoritmo Para Calcular A Soma Desses Horários. Faça Um Outro Algoritmo Para Calcular A Diferença Entre Esses Horários. O Resultado Deve Ser Apresentado Em
Dados seis números inteiros representando dois horários (horas, minutos e segundos), faça um algoritmo para calcular a soma desses horários. Faça um outro algoritmo para

1 Páginas • 1297 Visualizações

Tópicos similares

Tenha acesso a mais de 862.000 trabalhos e monografias
Junte-se a mais de 3.942.000 outros alunos
Trabalhos e monografias de alta qualidade

Registrar