TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Análise de estudantes do ensino superior a partir do ENADE

Por:   •  3/11/2015  •  Artigo  •  3.498 Palavras (14 Páginas)  •  872 Visualizações

Página 1 de 14

[1] 

Análise de estudantes do ensino superior a partir do ENADE

Antônio Correia, Bruno Resende, Fernando Nazareth, Guilherme Paiva, Luiz André, Paulo Adeodato
Centro de Informática – Universidade Federal de Pernambuco
{aac ,brp, fmpn, glmp, lajs}@cin.ufpe.br

Resumo – Este trabalho apresenta uma análise através da mineração de dados sobre estudantes do ensino superior no Brasil, utilizando como base o Enade, prova obrigatória feita a cada três anos por cada área do conhecimento (exatas, saúde e humanas), e o questionário socioeconômico, preenchido antes da prova por cada estudante. As bases de dados estarão no formato de microdados fornecidos pelo INEP disponíveis em seu site. O objetivo desta análise é determinar se um estudante, baseado em seu questionário terá um bom desempenho na prova e quais foram os atributos preponderantes para influir neste resultado. Será utilizado o método de processo CRISP-DM, método próprio para mineração de dados. A ferramenta utilizada será o KNIME, que possui diversos algoritmos implementados como o C4.5 que será detalhado junto aos algoritmos utilizados. O conhecimento extraído será avaliado usando métricas como as curvas ROC e KS.

Palavras-Chave - CRISP-DM, KNIME, INEP, ensino superior, ENADE, Mineração de dados, C4.5, ROC, KS

  1. INTRODUÇÃO

        O Exame Nacional de Desempenho de Estudantes (ENADE) tem como objetivo aferir o desempenho dos estudantes em relação aos conteúdos programáticos previstos nas diretrizes curriculares do respectivo curso de graduação, e as habilidades e competências em sua formação. [14]

        O processo de realização do ENADE é dividido em duas partes: o preenchimento de um questionário socioeconômico e uma prova escrita. O exame é aplicado periodicamente aos estudantes de todos os cursos de graduação, durante o primeiro (ingressantes) e último (concluintes) anos do curso. O exame é obrigatório para todos os alunos selecionados de forma que o aluno só estará em situação regular quando atestada sua participação ou, quando o caso, dispensa oficial pelo Ministério da Educação.   A primeira aplicação ocorreu em 2004 e a periodicidade máxima da avaliação é trienal para cada área do conhecimento (Saúde, Humanas e Exatas).  Assim, por exemplo, uma vez que os alunos de Saúde realizem a prova no ano de 2011 eles só voltarão a realizar uma nova prova três anos depois. [14]

Em geral, no ano posterior ao exame, o INEP (Instituto Nacional de Estudos e Pesquisas), uma autarquia federal vinculada ao MEC (Ministério da Educação) disponibiliza os dados referentes à prova e questionário socioeconômico de todos os alunos que foram selecionados para a realização da prova, independente do comparecimento do estudante ao exame. Essas informações são importantes para que políticas públicas na área de educação possam ser planejadas. Dados como sexo do estudante, instituição do qual o aluno faz parte, indicador de turno, situação econômica atual, grau de escolaridade dos pais são apenas algumas das informações que podemos extrair da base de dados do qual investigamos. [3][4][5]

O objetivo deste artigo é utilizar os dados do questionário socioeconômico e das provas para determinar se um aluno terá ou não um bom desempenho no ENADE, bem como, determinar quais fatores foram preponderantes para um aluno ter adquirido um bom conhecimento durante sua graduação. Para isto, usaremos um modelo de processo para realizarmos mineração de dados denominado CRISP-DM (Cross Industry Standard Process for Data Mining).

O CRISP-DM é um método comumente utilizado por especialistas de mineração de dados, pois ajuda de fato a padronizar projetos de desenvolvimento e descoberta de conhecimento. Este modelo proporciona uma visão do ciclo de vida do projeto, contendo as fases de um projeto, suas respectivas tarefas e as relações entre essas tarefas. Basicamente, o CRISP-DM segmenta o ciclo de processo em seis fases, de forma que o processo de descoberta de conhecimento seja gradual e sequencial.

           Na seção II deste artigo será definido fluxo decisório para este processo de mineração. Na seção subsequente será definida a variável alvo. A seção IV descreve a etapa de pré-processamento de dados. A extração do conhecimento através da regressão logística e da árvore de decisão será explicitada na seção V. Por fim, na seção VI será dada as impressões do projeto na Conclusão.

  1. FLUXO DECISÓRIO

Como mencionado anteriormente, nosso projeto foi baseado no processo CRISP-DM. A primeira etapa foi entender os objetivos do projeto da perspectiva de negócios. Dessa forma dividimos este passo em dois segmentos: a pesquisa por literatura científica que nos ajudasse a entender o contexto do problema e a busca de dados que nos ajudassem a validar a solução para o problema. [1]

Escolhida a base de dados e entendidos o contexto do problema, partimos para segunda etapa do nosso processo, o entendimento dos dados como um todo. O INEP disponibiliza dados do ENADE desde o ano de 2004. No entanto, nossa  escolha de utilizar apenas os dados dos anos de 2010, 2011, 2012 deveu-se por serem os registros mais atuais disponibilizados pelo INEP que possuem  conformidade na estrutura dos dados. Os arquivos estão no formato CSV e TXT e os metadados representados pelas colunas são idênticos. Dessa forma pudemos agrupar todos os registros em uma única tabela. Para dar ainda mais representatividade em nossas informações, decidimos adicionar dados do IGC (Índice Geral de Cursos Avaliados). Esse índice também disponibilizado no site do INEP é calculado anualmente paralelamente ao ENADE e serve para avaliar as instituições de ensino superior do Brasil.[3][4][5]

  1. DEFINIÇÃO DO ALVO

Antes de explicarmos a definição do alvo. Temos que entender como funciona o cálculo do conceito preliminar do curso. Para agregar informação ao processo de avaliação da educação superior critérios objetivos de qualidade e excelência dos cursos, o INEP criou um novo indicador. O Conceito Preliminar de Curso (CPC) vai de 1 a 5 e, como o próprio nome diz, é um indicador prévio da situação dos cursos de graduação no país. Para que os valores se consolidem, e representem efetivamente o que se espera de um curso em termos de qualidade e excelência, comissões de avaliadores farão visitas in loco para corroborar ou alterar o conceito obtido preliminarmente.

...

Baixar como (para membros premium)  txt (24.1 Kb)   pdf (313.7 Kb)   docx (657.4 Kb)  
Continuar por mais 13 páginas »
Disponível apenas no TrabalhosGratuitos.com