Selección de atributos representativos del avance académico de los alumnos universitarios usando técnicas de visualización. Un caso de estudio
DOI:
https://doi.org/10.24215/18509959.0.p.%2042-50Palabras clave:
visualización, rendimiento académico, mineria de datos educativa, educacion, atributo de selecciónResumen
La Minería de Datos Educativa reúne a los distintos métodos que permiten extraer información novedosa y útil a partir de grandes volúmenes de datos provenientes de contextos educativos. El presente trabajo describe el proceso de identificación, a través de técnicas de visualización, de las características más relevantes en lo que se refiere al rendimiento académico de los alumnos de la Facultad de Informática de la Universidad Nacional de La Plata. Este es un paso inicial que ejerce una gran influencia en la eficiencia y eficacia de los métodos que permiten modelar la información ya que los resultados a obtener mejoran al reducir la dimensión del problema. Esto último redunda en una representación más clara y simple de la información disponible. Para lograrlo, en este artículo se propone analizar y aplicar, luego del preprocesamiento de los datos, diferentes visualizaciones de los atributos sobre las clases o respuestas esperadas. Con este enfoque se espera generar una metodología de trabajo que ofrezca resultados fáciles de usar e interpretar. Su aplicación a la información correspondiente a alumnos regulares y no regulares de la UNLP permitió establecer relaciones interesantes acerca del desempeño académico de los alumnos. Esto último impacta directamente en las condiciones por las cuales abandonan sus estudios universitarios.
Descargas
Citas
[2] Nielson, G. M.; Shriver, B.; Rosenblum, Lawrence. Visualization in Scientific Computing. IEEE Computer Society Press.United States of America, 1979.
[3] Ganuza, M.; Larrea, M.; Martig, S.; Castro, S.; Bjerg, E.; Ferracutti, G. Visualización en Ciencias Geológicas, XIV Workshop de Investigadores en Ciencias de la Computación WICC, 2012.
[4] Charnelli, E. Lanzarini, L. Baldino, G. Diaz, F. Determining the profiles of young people from Buenos Aires with a tendency to pursue computer science studies. XX Congreso Argentino de Ciencias de la Computación CACIC, 2014.
[5] P. Cabena, P. Hadjin ian, R. Stadler, J. Verhees, A.Zanasi, Discovering Data Mining From concept to implementation. Prentice Hall 1997
[6] H. Witten, and E Frank. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. San Francisco, CA: Morgan Kaufmann, 2000.
[7] La Red Martínez, D. L., Acosta, J. C., Cutro, L. A., Uribe, V. E., and Rambo, A. R. Data warehouse y data mining aplicados al estudio del rendimiento académico y de perfiles de alumnos. XII Workshop de Investigadores en Ciencias de la Computación. CACIC 2010, pages 162-166.
[8] Luo, Q. Advancing knowledge discovery and data mining. In Knowledge Discovery and Data Mining, WKDD 2008. First International Workshop on.
[9] Valero, S. and Salvador, A. (2009). Predicción de la deserción escolar usando técnicas de minería de datos. In Simposio Internacional en Sistemas Telemáticos y Organizaciones Inteligentes SITOI, 2009.
[10] Rodallegas, E., Torres, A., Gaona, B., Gastelloú, E., Lezama, R., and Valero, S. (2010). Modelo predictivo para la determinación de causas de reprobación mediante minería de datos. In II Conferencia Conjunta Iberoamericana sobre Tecnologías para el aprendizaje CcITA, 2010.
[11] Valero, S., Salvador, A., and García, M. (2010). Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos. In II Conferencia Conjunta Iberoamericana sobre Tecnologías para el aprendizaje CcITA, 2010.
[12]. Wang, J., Lu, Z., Wu, W., and Li, Y. (2012). The application of data mining technology based on teaching information. In Computer Science Education ICCSE, 2012.
[13] Formia S. Evaluación de técnicas de Extracción de Conocimiento en Bases de Datos y su aplicación a la deserción de alumnos universitarios. Tesis de Especialista en Tecnología Informática aplicada en Educación, 2012.
[14] Asif, R. Merceron, A. Pathan K. Investigating Performances’s Progress of Students. CEUR Workshop Proceedings. ISSN 1613-0073, 2014
[15] Bower, A .J. Analyzing the Longitudinal K-12 Grading Histories of Entire Cohorts of Students: Grades, Data Driven Decision Making, Dropping Out and Hierarchical Cluster Analysis, 2010.
[16] Carpendale, M. S. T. Considering Visual Variables as a Basis for Information Visualization. Technical Report. University of Calgary, Department of Computer Science. 2001.
[17] Larrea, M., Martig, S., Castro. Visualización basada en semántica. XII Workshop de Investigadores en Ciencias de la Computación WICC, 2010.
[18] Sebban, M., Nock, R., Chauchat, J.H., Rakotomalala, R.: Impact of learning setquality and size on decision tree performances. Int. Journal of Computers, Systems and Signals 1, 2000.
[19] Thrun, S.B., Bala et al. The monk's problems a performance comparison of diferent learning algorithms. Technical report, 1991.
[20] Inselberg and B. Dimsdale. Parallel coordinates: A tool for visualizing ultidimensional geometry. IEEE Visualization, pages 361–378, 1990.
[21] D. K. Urribarri, S. M. Castro, S. R. Martig. Escalabilidad visual en coordenadas paralelas . VIII Workshop de Investigadores en Ciencias de la Computación CACIC, 2006.
[22] Quinlan, R. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA. 1993
[23] Witten, I. H., & Frank, E. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann. 2005
[24] Rosenblatt, Frank. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Spartan Books, Washington DC. 1961
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor y licencias
Los artículos aceptados para publicación tendrán la licencia de Creative Commons BY-NC. Los autores deben firmar un acuerdo de distribución no exclusiva después de la aceptación del artículo.