TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Atividade Mineração de Dados

Por:   •  28/3/2019  •  Trabalho acadêmico  •  438 Palavras (2 Páginas)  •  120 Visualizações

Página 1 de 2

[pic 1]

Universidade Estadual do Tocantins- Unitins

Sistemas de Informação, 6º Período,

Disciplina: Mineração de Dados

Professor: Marco Firmino

Acadêmico: Carlesandro Gaspar

Atividade avaliativa

Data set: Cervical cancer (Risk Factors)

Site: https://archive.ics.uci.edu/ml/datasets/Cervical+cancer+%28Risk+Factors%29

Para cada questão a seguir, apresente um texto descritivo sobre seu procedimento para resolver o problema, o script utilizado e a saída obtida (gráfico, tabela, valor).

Considerando o data set fornecido, que tipo de mineração julga apropriada?

Foi utilizado o modelo SVM (0.97863247...), devido A necessidade de analisar as colunas e verificar a compatibilidade entre a Coluna Exame com as demais após análise de critérios. Além do que no modelo Naves Bayes foi obtido o resultado de Taxa de acerto de 0.96168582..., ou seja, uma taxa de acerto inferior, conforme imagem.

[pic 2]

Após analisar o data set, qual campo pretende utilizar como saída (class) e qual é sua hipótese?

Schiller devido ser um exame especifico para descoberta de câncer de útero, neste caso o objeto em analise são os fatores de risco e fazendo a junção destes riscos e tendo o exame feito de forma singular a tal problema, nota-se um grau de relevância alto.

 

Qual procedimento foi adotado para separar a base de treino e teste?

Foi adotado a porcentagem de 70% para realização do Treino da análise e 30% para Teste do referida tabela de 858 linhas.

[pic 3]

Quais campos são apropriados para entrada na mineração realizada? Justifique a escolha e associe com a hipótese.

Foi realizado um teste de compatibilidade da Coluna Exame em relação a todas as colunas da tabela diagnostico, conforme demonstra imagem, utilizando o comando:

random.forest.importance(Exame ~ . , diagnostico)

[pic 4]

Nisto percebe-se que alguns campos não demonstram importância quando comparadas com a coluna Exame, o critério utilizado foi descartar as comparações com valores negativos.

Como exemplo a comparação da coluna Exame com a coluna Fuma..anos que tem valor de -3,65... ,isso significa que o fato da pessoa fumar em quantidade de anos não tem relação o resultado final do exame Schiller.

Em contraparte, utilizou-se para criação dos modelos os demais Campos, conforme o camando:

modelo = svm(Exame ~ Idade+primeira.relacao.sexual..idade.+Contraceptivos.Hormonais+DIU.years+DSTs..numero.+DST..condilomatose+DST..condilomatose.cervical+DSTs..condilomatose.vaginal+DST..condilomatose.vulvo.perineal+DSTs..sifilis+DSTs..doenÃ.a.inflamatoria.pelvica+DSTs..herpes.genital+STDs.AIDS+STDs.Hepatitis.B+STDs.HPV+Dx.Cancer+Dx.CIN+Hinselmann+Citology+Biopsy, diagnosticoTreino)

...

Baixar como (para membros premium)  txt (3.4 Kb)   pdf (312.8 Kb)   docx (95.6 Kb)  
Continuar por mais 1 página »
Disponível apenas no TrabalhosGratuitos.com