Please use this identifier to cite or link to this item: http://hdl.handle.net/11458/4922
Full metadata record
DC FieldValueLanguage
dc.contributor.authorValles Coral, Miguel Angeles_PE
dc.contributor.authorSalazar Ramírez, Luises_PE
dc.contributor.authorInjante Ore, Richard Enriquees_PE
dc.contributor.authorHernandez Torres, Edwin Augustoes_PE
dc.contributor.authorJuárez Díaz, Juanes_PE
dc.contributor.authorNavarro Cabrera, Jorge Raules_PE
dc.contributor.authorPinedo Tuanama, Lloy Pooles_PE
dc.contributor.authorVidaurre Rojas, Pierrees_PE
dc.date.accessioned2023-04-17T14:38:28Z-
dc.date.available2023-04-17T14:38:28Z-
dc.date.issued2022-11-
dc.identifier.urihttp://hdl.handle.net/11458/4922-
dc.description.abstractCompliance with the basic conditions of quality in higher education implies the design of strategies to reduce student dropout, and Information and Communication Technologies (ICT) in the educational field have allowed directing, reinforcing, and consolidating the process of professional academic training. We propose an academic and emotional tracking model that uses data mining and machine learning to group university students according to their level of dropout risk. We worked with 670 students from a Peruvian public university, applied 5 valid and reliable psychological assessment questionnaires to them using a chatbot-based system, and then classified them using 3 density-based unsupervised learning algorithms, DBSCAN, K-Means, and HDBSCAN. The results showed that HDBSCAN was the most robust option, obtaining better validity levels in two of the three internal indices evaluated, where the performance of the Silhouette index was 0.6823, the performance of the Davies–Bouldin index was 0.6563, and the performance of the Calinski–Harabasz index was 369.6459. The best number of clusters produced by the internal indices was five. For the validation of external indices, with answers from mental health professionals, we obtained a high level of precision in the F-measure: 90.9%, purity: 94.5%, V-measure: 86.9%, and ARI: 86.5%, and this indicates the robustness of the proposed model that allows us to categorize university students into five levels according to the risk of dropping out.es_PE
dc.description.abstractEl cumplimiento de las condiciones básicas de calidad en la educación superior implica el diseño de estrategias para disminuir la deserción estudiantil, y las Tecnologías de la Información y la Comunicación (TIC) en el ámbito educativo han permitido orientar, reforzar y consolidar el proceso de formación académica profesional. Proponemos un modelo de seguimiento académico y emocional que utiliza minería de datos y aprendizaje automático para agrupar a los estudiantes universitarios según su nivel de riesgo de abandono. Trabajamos con 670 estudiantes de una universidad pública peruana, les aplicamos 5 cuestionarios de evaluación psicológica válidos y confiables usando un sistema basado en chatbot y luego los clasificamos usando 3 algoritmos de aprendizaje no supervisado basados ​​en densidad, DBSCAN, K-Means y HDBSCAN. Los resultados mostraron que HDBSCAN era la opción más robusta, obteniendo mejores niveles de validez en dos de los tres índices internos evaluados, donde el rendimiento del índice de Silhouette fue de 0,6823, el rendimiento del índice de Davies-Bouldin fue de 0,6563 y el rendimiento del índice de Calinski-Harabasz fue de 369,6459. El mejor número de conglomerados producidos por los índices internos fue cinco. Para la validación de índices externos, con respuestas de profesionales de la salud mental, obtuvimos un alto nivel de precisión en la medida F: 90,9%, pureza: 94,5%, medida V: 86,9% y ARI: 86,5%, y esto indica la robustez del modelo propuesto que permite categorizar a los estudiantes universitarios en cinco niveles según el riesgo de deserción.es_PE
dc.formatapplication/pdfes_PE
dc.language.isoenges_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.uriCC BYes_PE
dc.subjectAgrupamientoes_PE
dc.subjectDBSCANes_PE
dc.subjectHDBSCANes_PE
dc.subjectK-mediases_PE
dc.subjectMinería de datoses_PE
dc.titleDensity-Based Unsupervised Learning Algorithm to Categorize College Students into Dropout Risk Levelses_PE
dc.title.alternativeAlgoritmo de aprendizaje no supervisado basado en la densidad para categorizar a los estudiantes universitarios en niveles de riesgo de abandono escolares_PE
dc.typeinfo:eu-repo/semantics/articlees_PE
dc.identifier.doi10.3390/data7110165es_PE
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_PE
dc.publisher.countryCHes_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_PE
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.languageiso639-1en-
item.openairetypeinfo:eu-repo/semantics/article-
Appears in Collections:Scopus
Files in This Item:
File Description SizeFormat 
Artículo científico.pdf2.68 MBAdobe PDFView/Open
Show simple item record

Google ScholarTM

Check

Altmetric


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.