SCIÉNDO INGENIUM  
ISSN 1810-6781 Sci. ingen. 21(3): 31-42, (2025)  
Análisis de preguntas abiertas en la evaluación del desempeño  
docente utilizando Minería de Texto en R y Chat GPT  
Analysis of Open-Ended Questions in Teacher Performance Evaluation  
Using Text Mining in R and Chat GPT  
Byron Jiménez Oviedo 1,*  
; Katalina Oviedo Rodríguez 1  
Jorge Arroyo Hernández 1  
; Federico Mora Mora 1  
; Rita Hernández Gómez 2  
Kendall Ruíz Benavides 2  
Giselle Ñurinda Montoya 2  
1 Facultad de Ciencias Exactas y Naturales, Escuela de Matemática, Universidad Nacional, Costa Rica.  
2 Vicerrectoría de Docencia, Universidad Nacional, Costa Rica.  
* Autor correspondiente: byron.jimenez.oviedo@una.cr (B. Jiménez)  
RESUMEN  
Este estudio analiza comparativamente las aplicaciones de Minería de Texto en R y el modelo de lenguaje  
ChatGPT para el procesamiento de respuestas abiertas en evaluaciones del desempeño docente en la Univer-  
sidad Nacional (UNA) de Costa Rica. Se emplearon datos simulados basados en evaluaciones históricas del  
estudiantado, garantizando la confidencialidad. El análisis en R incluyó técnicas de tokenización, frecuencia  
de términos, asociación de palabras y análisis de sentimientos, mientras que ChatGPT se utilizó para la inter-  
pretación semántica, la generación de resúmenes y la categorización automática de fortalezas y áreas de me-  
jora. Los resultados evidencian que R ofrece precisión estadística y capacidad para explorar patrones textua-  
les, mientras que ChatGPT destaca por su flexibilidad interpretativa y su potencial para automatizar la gene-  
ración de reportes analíticos. La correlación alta entre ambos enfoques en la detección de emociones y temas  
clave demuestra la complementariedad de sus resultados. Se concluye que la integración de herramientas de  
minería de texto y modelos de lenguaje puede optimizar el análisis cualitativo en contextos educativos, pro-  
moviendo procesos de evaluación más objetivos, eficientes y basados en evidencia. Este enfoque ofrece un  
marco replicable para fortalecer la gestión académica y la mejora continua de la docencia universitaria.  
Palabras clave: Minería de Texto; chat GPT; Desempeño docente; Preguntas abiertas; Análisis automatizado  
de texto.  
ABSTRACT  
This study presents a comparative analysis of Text Mining applications in R and the ChatGPT language  
model for processing open-ended responses in teaching performance evaluations at the National University  
(UNA) of Costa Rica. Simulated data based on historical student evaluations were used to ensure confidenti-  
ality. The analysis in R included techniques such as tokenization, term frequency analysis, word association,  
and sentiment analysis, while ChatGPT was employed for semantic interpretation, summary generation, and  
automatic categorization of strengths and areas for improvement. The results show that R provides statistical  
precision and the ability to explore textual patterns, whereas ChatGPT excels in interpretative flexibility and  
its potential to automate analytical report generation. The high correlation between both approaches in the  
detection of emotions and key topics demonstrates the complementarity of their outcomes. It is concluded  
that integrating text mining tools and language models can optimize qualitative analysis in educational con-  
texts, promoting more objective, efficient, and evidence-based evaluation processes. This combined approach  
offers a replicable framework to strengthen academic management and foster continuous improvement in  
university teaching quality.  
Keywords: Text Mining; Chat GPT; Teacher Performance; Open-Ended Questions; Automated Text Analy-  
sis.  
Fecha de envío: 24-07-2025 Fecha de aceptación: 05-11-2025  
Fecha de publicación: 07-11-2025  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
1. INTRODUCCIÓN  
La evaluación del desempeño docente en la Universidad Nacional (UNA, Costa Rica) comenzó en 1999 con  
la creación del Programa de Evaluación Académica, cuyo objetivo era identificar fortalezas y debilidades del  
personal docente para mejorar los procesos académicos. Inicialmente, la evaluación se aplicó a solicitud de  
las direcciones académicas; sin embargo, a partir de 2003, se estableció como un proceso institucional regu-  
lar. En 2004, se introdujo un sistema de evaluación basado en áreas temáticas para mejorar la interpretación  
de los datos y fortalecer las competencias docentes, promoviendo la autoevaluación y el desarrollo profesio-  
nal. En 2006, el Programa de Evaluación y Desarrollo Profesional Docente se consolidó como un sistema  
integral para la mejora continua de la docencia, reconociendo la complejidad de este proceso. Este programa,  
ahora conocido como Sistema de Evaluación del Desempeño Académico (SEDA), asesora a las direcciones  
de las unidades académicas en aspectos de evaluación docente, ofrece criterios y elementos para construir  
modelos de evaluación en la UNA, diseña y rediseña instrumentos de evaluación, y propone opciones para  
mejorar las prácticas docentes. Al abarcar aspectos técnicos, académicos y sociales, el SEDA busca promo-  
ver una evaluación integral que permita identificar fortalezas y debilidades en el desempeño docente.  
En la educación superior, la evaluación docente por parte de los estudiantes es crucial para la mejora continua  
de la calidad educativa. Según Pacheco et al. (2018), la evaluación del desempeño docente es un “ejercicio  
sistemático que, con fundamento en un conjunto de evidencias, juzga cómo llevan a cabo su labor los profe-  
sores” (p. 1). Martínez & García (2017) señalan que el desempeño docente se refiere a las operaciones reali-  
zadas por las personas docentes durante el proceso de enseñanza. Rodríguez et al. (2021) enumeran varias de  
estas operaciones, como la planificación y estructuración de los contenidos, las estrategias didácticas, la co-  
municación efectiva, el manejo de nuevas tecnologías, el desarrollo de tareas instructivas con retroalimenta-  
ción, la relación asertiva con los estudiantes para asegurar su maduración y desarrollo personal, el acompa-  
ñamiento en la formación, la evaluación, la inclinación hacia la reflexión y la investigación, y el trabajo en  
equipo.  
La UNA define la evaluación del desempeño docente como un proceso que recoge evidencias de validez y  
confiabilidad, permitiendo valorar las funciones, tareas y roles del quehacer docente, y relacionar actitudes,  
valores, saberes y habilidades desde una perspectiva personal, disciplinar y pedagógica en el proceso de en-  
señanza-aprendizaje, tanto dentro como fuera del aula.  
En este contexto, el SEDA diseña instrumentos de evaluación del desempeño docente con el objetivo de ob-  
tener información consistente y sistemática, tanto cuantitativa como cualitativa, para reflexionar y promover  
cambios en la enseñanza y el aprendizaje. Como parte del diseño de estos instrumentos, se utilizan ítems  
abiertos, que representan un reto para el análisis debido al tipo de dato (textual) y al volumen de estos por  
periodo de evaluación.  
Dado lo anterior, surge como objetivo para este estudio comparar las aplicaciones de Minería de Texto en R  
y ChatGPT para el análisis de ítems abiertos en evaluaciones del desempeño docente. Sumado a esto, se pre-  
tende mostrar las capacidades de análisis de texto disponibles en R para procesamiento de texto (como toke-  
nización, análisis de sentimientos y extracción de temas) con las capacidades de generación y análisis de tex-  
to de ChatGPT y describir la eficiencia y facilidad de implementación de cada una de estas herramientas (A  
Fuller et al., 2024; Li et al., 2024; Mamo et al., 2024).  
Para alcanzar estos objetivos, hay que profundizar en los instrumentos que miden el desempeño docente, di-  
señados por especialistas en psicometría del SEDA. El instrumento que explora la percepción estudiantil es  
uno de los recursos más utilizados por las instituciones de educación superior para evaluar la labor del profe-  
sorado universitario (Gómez & Valdés, 2019). Este tipo de instrumento se basa en un modelo orientado a los  
resultados, en el que el estudiantado, como receptor del servicio, evalúa el desempeño del profesorado a par-  
tir de su percepción (Montoya et al., 2014). Su popularidad se debe a factores como la facilidad de aplicación  
y el procesamiento eficiente de la información. Hoy se utilizan cuestionarios en línea, lo que agiliza el proce-  
samiento de los datos, ya que los programas informáticos permiten generar gráficos, realizar comparaciones  
de puntajes, entre otros (Wellein et al., 2009).  
El instrumento incluye una sección cuantitativa, compuesta exclusivamente por ítems cerrados, que permite  
asignar una calificación final al docente. Sin embargo, también se utilizan ítems abiertos, en los que el estu-  
diantado puede escribir en prosa su percepción sobre aspectos relacionados con la práctica docente. Las res-  
puestas a estos ítems abiertos son difíciles de cuantificar y, normalmente, son revisadas manualmente por un  
superior jerárquico, quien proporciona retroalimentación al docente (Peña-Torres, 2024).  
El proceso de revisión de preguntas abiertas puede ser laborioso, dependiendo del número de docentes en  
cada escuela o unidad académica. Tradicionalmente, la recopilación y análisis de estas evaluaciones se ha  
realizado mediante métodos convencionales, que resultan limitados en cuanto a la profundidad del análisis.  
32  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
No obstante, con los avances en técnicas de minería de texto e inteligencia artificial, se presentan nuevas  
oportunidades para extraer información significativa de grandes volúmenes de comentarios estudiantiles de  
forma más eficiente y efectiva (Buenano-Fernandez et al., 2020; Caballero & Enciso, 2022; Meléndez et al.,  
2023). En este sentido, el análisis de respuestas a preguntas abiertas puede facilitarse mediante técnicas  
computacionales, como la Minería de Texto.  
La Minería de Texto es el proceso de extraer patrones o conocimientos previamente desconocidos, compren-  
sibles y prácticos de colecciones de datos textuales (Zhang et al., 2015). Hotho et al. (2005) la definen como  
la aplicación de algoritmos y métodos provenientes del aprendizaje automático y la estadística para encontrar  
patrones útiles en textos. La minería de textos es un campo multidisciplinario que abarca la recuperación de  
información, el análisis de textos, la extracción de información, la categorización, la agrupación, la visualiza-  
ción, la minería de datos y el aprendizaje automático (Dang & Ahmad, 2014). El uso de técnicas de minería  
de datos tiene muchos beneficios en el manejo de información no estructurada; Ngai & Lee (2016) mencio-  
nan que las aplicaciones de minería de textos ayudan a los responsables de políticas a procesar información y  
descubrir nuevos conocimientos a bajo costo, además de aumentar la efectividad y eficiencia de estos proce-  
dimientos en las tomas de decisiones.  
Dentro de la Minería de Texto se encuentra la Minería de Opiniones o Text Opinion, la cual permite analizar  
los sentimientos expresados de manera escrita. El análisis de los sentimientos consiste en determinar y anali-  
zar las emociones que se plasman en un texto en relación con un tema o campo específico. Liu (2010) men-  
ciona que la investigación en este campo comenzó con la clasificación de sentimientos y de la subjetividad,  
en donde se trataban problemas de clasificación de textos. La clasificación de sentimientos determina si un  
documento con opiniones (por ejemplo, reseñas de productos) expresa una opinión positiva o negativa. Ac-  
tualmente, este campo de estudio analiza las opiniones de las personas, los sentimientos, las evaluaciones  
(Liu, 2022), actitudes y emociones hacia entidades, como productos, servicios, organizaciones, individuos,  
entre otros. Zhang et al. (2022) presentan una revisión completa sobre el avance de investigaciones en esta  
área, exponiendo los conjuntos de datos comúnmente utilizados, las métricas de evaluación, el proceso de  
desarrollo y las tendencias de investigación que incluyen métodos tradicionales de machine learning y méto-  
dos de deep learning.  
Recientemente, otra herramienta utilizada para el análisis de texto han sido las inteligencias artificiales, una  
de las más conocidas es ChatGPT, desarrollada por OpenAI. Este chat utiliza lenguaje artificial y compu-  
tación cognitiva y está basado en el preentrenamiento generativo GPT (Radford et al., 2018). Respecto a su  
uso para el análisis de sentimiento en textos escritos, Wang et al. (2023) presentan un análisis preliminar de  
su rendimiento, determinando que ChatGPT tiene una capacidad notable para inferir sentimientos, mostrando  
un rendimiento similar a los modelos supervisados de última generación (A Fuller et al., 2024).  
2. METODOLOGÍA  
Se realizó un estudio comparativo, entre R y el ChatGPT, con el fin de conocer las capacidades de análisis de  
texto con respecto a preguntas abiertas del instrumento de evaluación del desempeño docente. En aras de  
proteger la privacidad de datos sensibles, las respuestas que se analizaron fueron simuladas a partir de res-  
puestas dadas por estudiantes de la UNA para un profesor específico. Posteriormente, se analizaron las res-  
puestas simuladas utilizando las herramientas ya mencionadas.  
2.1 Simulación de datos  
La simulación se hizo con patrones históricos de preguntas abiertas de evaluaciones del desempeño de un  
docente de la UNA, correspondientes al periodo 2018-2024. El reporte para este profesor, en este periodo,  
daba un total de 770 respuestas, lo que equivale, en este caso, a 13791 palabras, para un aproximado de 40  
páginas en una configuración estándar de Word. A manera de ejemplo, se muestran dos de las preguntas del  
instrumento de evaluación:  
1. En su opinión, ¿qué fortalezas reconoce en la persona docente en el desarrollo de este curso específico?  
(Respuesta abierta)  
2. En su opinión, ¿qué áreas de mejora tiene la persona docente para el desarrollo de este curso específico?  
(Respuesta abierta)  
Para la simulación se utilizaron estos datos históricos y el ChatGPT, realizando el siguiente procedimiento:  
Primero, como la cantidad de palabras es muy grande el ChatGPT no logra procesarlo, por lo cual, se debió  
realizar una segmentación del texto en cuatro partes. Luego, para cada uno de estos tractos, se le pidió al  
33  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
ChatGPT simular un nuevo texto, manteniendo las mismas ideas de los comentarios y la misma cantidad de  
palabras. Posteriormente, se tomaron los datos simulados y se colocaron en un texto plano para su análisis.  
2.2 Herramientas y versiones utilizadas  
Los análisis estadísticos y de procesamiento de texto se realizaron utilizando R versión 4.4.1. Para la manipu-  
lación y visualización de datos se emplearon las librerías ggplot2 y RColorBrewer, que facilitaron la creación  
de gráficos claros y estéticamente consistentes. El análisis de texto y minería de información se llevó a cabo  
utilizando NLP y tm para la preparación y limpieza de los textos, SnowballC para la normalización de pala-  
bras mediante stemming, wordcloud para la representación visual de frecuencias y syuzhet para el análisis de  
sentimientos. Por su parte, el análisis con ChatGPT se realizó utilizando la plataforma de OpenAI, corres-  
pondiente al modelo GPT-5.  
2.3 Preprocesamiento para R  
Para analizar el texto mediante R (ver código en GitHub) se procesaron y limpiaron los datos. Seguido, se  
cargó el corpus y sus metadatos. Una vez hecho este proceso se realizaron algunas transformaciones como,  
por ejemplo: se quitaron espacios en blanco extras, se substituyeron por espacios en blanco caracteres como  
‘|’, ’/’ ,‘@’ o números, se pasaron todas las letras mayúsculas a minúsculas (tolower), se eliminaron palabras  
vacías (stopwords), se redujeron las palabras a su raíz (stemming), y por último, se removieron signos de  
puntuación y palabras específicas que no aportaran información importante, por ejemplo: área, toda, hace,  
estudiante, práctica, profesor, curso, materia, laboratorio, clase, tema.  
Cabe destacar que como las preguntas abiertas fueron contestadas en español se utilizó dicho idioma para las  
transformaciones o eliminaciones. A modo de ejemplo, se presenta la comparación de un texto antes y des-  
pués de su limpieza.  
Tabla 1. Ejemplo respuesta simula y procesada.  
Respuesta simulada  
Respuesta procesada  
Expresa un verdadero entusiasmo por que sus estudian- expresa verdadero entusiasmo estudiantes comprendan  
tes comprendan y se adentren en el tema, brindando adentren brindando ejemplos claros siempre dispuestos  
ejemplos claros y estando siempre dispuesto a respon- responder preguntas manera eficiente.  
der preguntas de manera eficiente.  
Como último paso, se realizó la tokenización, que se refiere al proceso de dividir texto en unidades más pe-  
queñas llamadas tokens. El tamaño de un token puede ser variado, desde una sola letra o carácter hasta pala-  
bras completas.  
2.3 Preprocesamiento para chatGPT  
Por otro lado, el preprocesamiento para modelos como ChatGPT se centra en optimizar el texto de entrada  
para la generación de respuestas naturales y coherentes. Se debe considerar la coherencia semántica y el esti-  
lo del texto, asegurando que las respuestas generadas mantengan fluidez y relevancia en el contexto. Por esta  
razón, para efecto de este estudio, se utilizaron los datos en minúsculas, sin los signos de puntuación y sin los  
stopwords. Además, en este caso se debe considerar el número de palabras (más de 3000) pues, como ya se  
mencionó, el ChatGPT en una sola corrida solo puede procesar hasta un máximo de 2000 palabras, por lo que  
se debe considerar realizar el análisis en segmentos de texto.  
Tabla 2. Ejemplo respuesta simula y procesada.  
Respuesta simulada  
Respuesta procesada  
Expresa un verdadero entusiasmo por que sus estudian- expresa un verdadero entusiasmo por que sus estudiantes  
tes comprendan y se adentren en el tema, brindando comprendan y se adentren en el tema brindando ejemplos  
ejemplos claros y estando siempre dispuesto a respon- claros y estando siempre dispuesto a responder preguntas de  
der preguntas de manera eficiente.  
manera eficiente.  
Cada enfoque se adapta a las necesidades y objetivos particulares del análisis de datos y a la generación de  
texto, garantizando que los datos preparados sean efectivos para el análisis estadístico riguroso o en la crea-  
ción de contenido textual inteligente. A pesar de los diferentes enfoques finales de cada aplicación (análisis  
34  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
estadístico versus generación de texto), el proceso de preprocesamiento puede ser similar y se centra en op-  
timizar los datos para su uso efectivo en cada contexto específico.  
3. RESULTADOS Y DISCUSIÓN  
3.1 Resultados usando R  
El análisis de frecuencias permitió identificar patrones en las respuestas simuladas respecto a la percepción  
de los estudiantes hacia sus docentes y el curso. Se contabilizó un total de 3,885 palabras, de las cuales 1,460  
eran únicas, lo que refleja una diversidad moderada en el vocabulario utilizado.  
Entre las palabras más frecuentes, se destacan: excelente (83; 2,14%), bien (64; 1,65%), explica (59; 1,52%),  
manera (40; 1,03%), paciencia (36; 0,93%), conocimiento (30; 0,77%), atento (26; 0,67%), interés (26;  
0,67%), sabe (23; 0,59%) y comprensivo (23; 0,59%). Estos resultados evidencian una valoración general  
positiva, centrada en la claridad de las explicaciones, la paciencia y el conocimiento de los docentes. Como  
parte de la interpretación, estos datos señalarían la importancia que los estudiantes otorgan al dominio de los  
contenidos por parte de las personas docentes, así como a su habilidad para explicar y la disposición mostra-  
da hacia el aprendizaje. La alta frecuencia de términos como explica y paciencia puede sugerir el compromi-  
so por parte de las personas docentes en proporcionar una experiencia educativa de calidad.  
La Figura 1 muestra un gráfico de barras con las nueve palabras más frecuentes, donde excelente se posiciona  
como la de mayor frecuencia, mientras que sabe es la menos mencionada.  
Figura 1. Frecuencia de palabras.  
La nube de palabras (Figura 2) refleja visualmente la prominencia de los términos más relevantes. Las palabras más  
grandes, como excelente, bien, explica, manera y paciencia, destacan la percepción positiva sobre el desempeño de los  
docentes y su disposición hacia los estudiantes.  
35  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
Figura 2. Nube de frecuencia de palabras.  
3.1.1 Análisis de asociación entre términos claves  
Para profundizar en las respuestas simuladas respecto al análisis de la percepción, se realizó un análisis de  
asociación entre términos clave en las respuestas obtenidas. Los resultados revelaron conexiones significati-  
vas que reflejarían los aspectos mejor valorados por los estudiantes en la enseñanza universitaria.  
Tabla 3. Asociación entre términos.  
Términos  
Asociación  
Valor  
Conocimiento Amplio  
Posee  
0,31  
0,26  
Interés  
Excelente  
Claras  
Comprenda  
Explicaciones  
Súper  
0,33  
0,29  
0,25  
0,25  
0,25  
Bien  
Explica  
0,35  
Entre las asociaciones más destacadas, se encontró que la palabra conocimiento está fuertemente asociada  
con el término amplio (coeficiente = 0,31), lo que indicaría que los estudiantes valoran un conocimiento ex-  
tenso por parte de sus docentes. Además, la palabra explicación mostró asociaciones positivas con términos  
como posee con coeficiente 0,26, subrayando la importancia del dominio del contenido.  
Por otro lado, en relación con la palabra interés, se observaron asociaciones significativas con términos como  
excelente, claras, comprenda y súper (coeficientes entre 0,25 y 0,33), lo que indicaría que el estudiantado  
valora que la persona docente tenga interés en explicaciones claras y de que el estudiantado comprenda.  
Finalmente, en cuanto a la palabra bien se le asocia la palabra explica con un coeficiente de 0,35 resaltando  
que se valora la disposición y el esfuerzo del profesor de intentar facilitar el aprendizaje.  
3.1.2 Análisis de sentimientos  
El análisis de sentimientos permitió identificar la polaridad y frecuencia de emociones presentes en las res-  
puestas. Según el método Syuzhet, el promedio del sentimiento fue de -0,031 con una desviación estándar de  
0,221, indicando un leve sesgo negativo, aunque cercano a la neutralidad. Los análisis Bing y Afinn mostra-  
36  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
ron promedios similares: -0,009 y -0,129, respectivamente, lo que refuerza la tendencia a una percepción  
predominantemente neutral-positiva.  
La distribución de emociones según el método NRC evidenció que confianza (43,88%), alegría (16,53%) y  
tristeza (15,17%) fueron las emociones más frecuentes, mientras que ira (1,67%) y disgusto (1,78%) fueron  
poco mencionadas. Estas frecuencias sugieren que los estudiantes valoran principalmente la seguridad y con-  
fianza transmitida por sus docentes (ver Figura 3).  
Emociones detectadas  
Confianza  
Alegría  
Tristeza  
Anticipación  
Miedo  
Sorpresa  
Disgusto  
Ira  
0
200  
400  
600  
800  
Frecuencia  
Figura 3. Frecuencia de diferentes sentimientos.  
En términos de polaridad, la cantidad de respuestas positivas fue mayor, con 1,487 palabras frente a 371 pa-  
labras negativas, mostrando una clara tendencia positiva en el texto.  
Los puntajes promedio de sentimiento obtenidos con Syuzhet muestran un valor cercano a cero (-0,031), lo  
que indica que, aunque hay una mayor cantidad de palabras positivas, el sentimiento global del texto se man-  
tiene cercano a la neutralidad. La desviación estándar de 0,221 refleja que existen variaciones locales de sen-  
timientos positivos y negativos dentro del contenido.  
37  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
Figura 4. Frecuencia de los sentimientos positivos o negativos.  
3.2 Resultados usando el ChatGPT  
En primera instancia, se solicitó al ChatGPT un análisis y un reporte del texto, sin embargo, se obtuvo el si-  
guiente mensaje "The message you submitted was too long, please reload the conversation and submit so-  
mething shorter" lo que refleja una restricción técnica en la plataforma de análisis, probablemente implemen-  
tada para optimizar el procesamiento eficiente de consultas. Esta limitación puede afectar la capacidad de  
analizar textos extensos de manera inmediata. Para abordar esta limitación, el ChatGPT en el mismo mensaje  
sugiere dividir el texto en secciones más manejables o proporcionar un resumen conciso, facilitando así una  
mejor interacción con la herramienta de análisis.  
Como la primera instrucción no se pudo completar, se dio la siguiente instrucción al ChatGPT: "Te propor-  
cionaré extractos de textos de una encuesta de evaluación docente en trozos. Por favor, pregúntame cada vez  
si he terminado de darte todo el fragmento. Cuando te indique que sí, procede a darme tu percepción objetiva  
en forma de reporte."  
Sin embargo, el ChatGPT no ejecutó la instrucción correctamente. Originalmente se tenían previstos 4 trozos  
de texto, pero en el segundo ingreso, el ChatGPT proporcionó el reporte anticipadamente. Fue necesario indi-  
carle que aún faltaban dos trozos más. Una vez ingresados estos, el chat arrojó un resumen en forma de re-  
porte. Un extracto del texto es el siguiente:  
“El profesor es altamente valorado por su conocimiento, paciencia y actitud positiva. Sin embargo, mejorar la  
velocidad de la enseñanza, la claridad en la presentación y el enfoque de las evaluaciones podría mejorar sig-  
nificativamente la experiencia de aprendizaje para todos los estudiantes.”  
Luego de esto, se hizo otro intento sin darle ninguna instrucción específica. Se ingresaron los cuatros extrac-  
tos de texto, y para cada ingreso el chat generó un reporte de análisis del texto, con un resumen de aspectos  
positivos, áreas de mejora, sugerencia para la cátedra y una conclusión general. A continuación, se presentan  
los aspectos positivos que menciona el chat:  
1. Dominio del Tema: Los comentarios destacan consistentemente que el profesor tiene un profundo conoci-  
miento de la materia y un excelente manejo del contenido del curso.  
2. Paciencia y Disponibilidad: El profesor es descrito como muy paciente y dispuesto a explicar los concep-  
tos tantas veces como sea necesario para asegurar la comprensión.  
3. Claridad en la Explicación: Se valora mucho su capacidad para explicar de manera clara y detallada, así  
como su disposición para aclarar dudas.  
38  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
4. Interés en los Estudiantes: El profesor muestra un interés genuino en el aprendizaje y el éxito de sus estu-  
diantes, lo que se refleja en su actitud alentadora y su esfuerzo por ayudar.  
5. Actitud Positiva: La actitud respetuosa, carismática y comprensiva del profesor es frecuentemente elogiada,  
creando un ambiente de aprendizaje positivo.  
Este último reporte fue mejor que el dado en un inicio, de lo que se concluye que la instrucción para el chat  
debe ser clara y guiada.  
Se le pidió también hacer una tabla para cuantificar las fortalezas y debilidades o puntos de mejora. Los re-  
sultados que se obtuvieron fueron los siguientes.  
Tabla 4. Cuantificación de las fortalezas.  
Categoría  
Frecuencia estimada Porcentaje aproximado  
Paciencia / claridad en la explicación  
Dominio de la materia / conocimiento  
Actitud positiva / carisma / motivación  
Empatía / humanismo / comprensión  
Preparación / organización de la clase  
Dinamismo / interacción en clase  
85  
50  
60  
70  
25  
20  
30%  
18%  
21%  
25%  
9%  
7%  
Tabla 5. Cuantificación de áreas a mejorar.  
Categoría  
Frecuencia estimada Porcentaje aproximado  
Evaluaciones (tipo y cantidad)  
Tiempo de quices / exámenes / clases largas  
Organización de materiales y aula virtual  
Manejo de participación en clase  
40  
20  
15  
10  
8
35%  
17%  
13%  
9%  
Profundización de contenidos en horas de consulta  
Puntualidad en subir documentos / recursos  
7%  
7
6%  
Estos resultados son importantes porque se puede visualizar como el estudiantado valora la paciencia, clari-  
dad y empatía del docente, así como su dominio de la materia y actitud motivadora. Además, pone en evi-  
dencia aspectos a mejorar como la cantidad y tipo de evaluaciones, el tiempo en quices y clases largas, lo que  
sugiere la necesidad de ajustar la evaluación sin comprometer la calidad pedagógica.  
3.3 Comentarios finales  
Finalmente, se solicitó al chat realizar un análisis de sentimientos similar al que produce R, utilizando la lista  
de emociones de la biblioteca NRC, con el objetivo de comparar directamente los resultados. Una vez reali-  
zado este procedimiento, se obtuvieron los resultados mostrados en la siguiente tabla, los cuales refuerzan las  
observaciones preliminares sobre la percepción de los estudiantes:  
Tabla 6. Comparación de sentimientos.  
Emoción  
Ira  
R
Chat Diferencia  
1,67 2,0  
0,33  
-0,63  
-0,18  
-0,33  
0,47  
Anticipación 12.13 11,5  
Disgusto  
Miedo  
1,78 1,6  
5,13 4,8  
16,53 17,0  
15,17 15,0  
3,71 4,0  
43,88 44,1  
Alegría  
Tristeza  
Sorpresa  
Confianza  
-0,17  
0,29  
0,22  
Con estos resultados se obtuvo una correlación cercana a 1, indicando que el análisis realizado por el chat  
reproduce de manera muy similar los valores obtenidos por R. Las diferencias observadas son mínimas, lo  
que refuerza la confiabilidad de los hallazgos y confirma que las emociones predominantes entre los comen-  
39  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
tarios de los estudiantes son confianza y alegría, mientras que emociones negativas como ira, disgusto y mie-  
do se presentan en menor medida.  
El uso de R como del chat representan opciones válidas y efectivas para el análisis de respuestas a preguntas  
abiertas. Ambas herramientas permiten cuantificar emociones, identificar patrones y generar visualizaciones  
de manera rápida, lo que facilita la interpretación de grandes volúmenes de comentarios. Además, su uso  
puede ofrecer múltiples beneficios, como ahorrar tiempo en el procesamiento de datos, estandarizar criterios  
de análisis y complementar la evaluación cualitativa con resultados más objetivos.  
4. CONCLUSIONES  
Analizar las respuestas a preguntas abiertas en evaluaciones docentes, proporciona perspectivas valiosas so-  
bre la percepción de los estudiantes hacia sus profesores, asimismo, ofrece una guía práctica para mejorar  
continuamente la calidad docente en la educación superior. Comúnmente, estas respuestas son analizadas de  
forma manual por las direcciones de las unidades académicas, lo que representa un trabajo arduo y que puede  
tomar mucho tiempo. Aunque las respuestas abiertas suelen ser breves, el volumen total de respuestas hace  
lento y laborioso el proceso de análisis. En este contexto, la automatización del análisis resulta ser una solu-  
ción eficiente, al liberar tiempo y esfuerzo de la persona responsable del análisis.  
El uso de herramientas como R y modelos de lenguaje como ChatGPT para analizar texto, presenta diversas  
fortalezas y limitaciones. Por un lado, R permite realizar análisis exhaustivos y detallados de grandes volú-  
menes de texto, utilizando técnicas estadísticas avanzadas y herramientas gráficas para explorar patrones y  
relaciones. Este lenguaje de programación es adecuado para tareas como el análisis de frecuencia de palabras,  
la detección de temas y el modelado predictivo basado en texto, permitiendo profundizar en la estructura y el  
contenido de los datos textuales con un alto grado de precisión y flexibilidad.  
Por otro lado, el ChatGPT genera respuestas coherentes en lenguaje natural, lo que facilita la interpretación y  
comunicación de resultados complejos de manera accesible. Esto puede representar una ventaja en el análisis  
de datos textuales, para personas que no manejen técnicas avanzadas de análisis de texto. Además, esta capa-  
cidad de generar texto natural también puede ser útil en la creación automática de resúmenes o reportes de  
evaluaciones, como lo es el caso de las evaluaciones a docentes.  
A pesar de estas ventajas, el ChatGPT presenta limitaciones en comparación con R, especialmente en térmi-  
nos de capacidad para realizar análisis estadísticos, modelado predictivo avanzado o visualización gráfica  
detallada. La dependencia del contexto de los datos y la calidad del modelo subyacente pueden afectar la pre-  
cisión y consistencia de las respuestas generadas por el ChatGPT.  
Por lo tanto, la elección entre R y ChatGPT depende del objetivo específico del análisis de texto y las habili-  
dades técnicas del usuario. La combinación de ambos enfoques puede ofrecer un marco integral para el análi-  
sis de datos textuales.  
Gracias a los insumos obtenidos del análisis comparativo entre R y el ChatGPT, se abre la posibilidad de  
implementar técnicas que permitan a las direcciones académicas y otras autoridades obtener un panorama  
justificado estadísticamente de la evaluación en preguntas abiertas del desempeño docente. Esto no solo faci-  
litaría la identificación de patrones y tendencias en los datos textuales, sino que también optimizaría el proce-  
so de evaluación al ahorrar tiempo y recursos significativos. La automatización de estas tareas mediante las  
herramientas mencionadas no solo mejoraría la eficiencia operativa, sino que también ofrecería perspectivas  
más profundas y contextualizadas para la toma de decisiones informadas.  
El uso de estas herramientas tiene un impacto directo en las personas docentes y principalmente a las direc-  
ciones de las unidades académicas. En efecto, permiten identificar fortalezas y áreas de mejora de manera  
objetiva, optimiza la eficiencia en el procesamiento de datos y contribuye a sistemas de evaluación más  
transparentes, equitativos y basados en evidencia. En última instancia, la automatización del análisis de res-  
puestas abiertas no solo mejora la eficiencia operativa, sino que también enriquece la comprensión de la ex-  
periencia educativa, potenciando decisiones más informadas y estratégicas para la mejora de la enseñanza.  
5. AGRADECIMIENTOS  
Agradecemos a la Vicerrectoría de Docencia por proporcionarnos los datos utilizados en este estudio y por  
confiar en que es posible mejorar mediante el uso de la tecnología. Su apoyo fue fundamental para el desarro-  
llo de este trabajo.  
40  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
REFERENCIAS BIBLIOGRÁFICAS  
A Fuller, K., Morbitzer, K. A., Zeeman, J. M., M Persky, A., C Savage, A., & McLaughlin, J. E. (2024). Ex-  
ploring the use of ChatGPT to analyze student course evaluation comments. BMC Medical Education,  
Buenano-Fernandez, D., Gonzalez, M., Gil, D., & Lujan-Mora, S. (2020). Text mining of open-ended ques-  
tions in self-assessment of university teachers: An LDA topic modeling approach. IEEE Access: Practical  
Innovations, Open Solutions, 8, 3531835330. https://doi.org/10.1109/access.2020.2974983  
Caballero, J. & Enciso, J. E. (2022). Minería de texto aplicado en preguntas abiertas sobre evaluación docen-  
Dang, S., & Ahmad, P. H. (2014). Text mining: Techniques and its application. International Journal of En-  
gineering & Technology Innovation, 1(4), 2225.  
Gómez, L. F., & Valdés, M. G. (2019). La evaluación del desempeño docente en la educación superior.  
Propósitos y Representaciones, 7(2), 479515.  
Hotho, A., Nürnberger, A., & Paaß, G. (2005). A brief survey of text mining. Journal of Language Technolo-  
gy and Computational Linguistics, 20(1), 1962.  
Liu, B. (2010). Sentiment analysis: A multi-faceted problem. IEEE Intelligent Systems, 25(3), 7680.  
Liu, B. (2022). Sentiment analysis and opinion mining. Springer Nature.  
Li, L., Ma, Z., Fan, L., Lee, S., Yu, H., & Hemphill, L. (2024). ChatGPT in education: a discourse analysis of  
worries and concerns on social media. Education and Information Technologies, 29(9), 1072910762.  
Mamo, Y., Crompton, H., Burke, D., & Nickel, C. (2024). Higher education faculty perceptions of ChatGPT  
and the influencing factors: A sentiment analysis of X. TechTrendsꢀ: For Leaders in Education & Training,  
Martínez, S., & García, J. (2017). Aproximación al concepto de desempeño docente, una revisión conceptual  
sobre su delimitación. Congreso Nacional de Investigación Educativa.  
Meléndez, N., Briceño, M., Giberton, J., & Lucente, R. (2023). MINERÍA DE TEXTO APLICADO AL  
ANÁLISIS DE SENTIMIENTOS PARA LA BÚSQUEDA DE PATRONES DE MOTIVACIÓN EN  
PROGRAMA DE ACTUALIZACIÓN DOCENTE. Revista Académica Creatividad e Innovación En Ed-  
Montenegro-Rueda, M., Fernández-Cerero, J., Fernández-Batanero, J. M., & López-Meneses, E. (2023). Im-  
pact of the implementation of ChatGPT in education: A systematic review. Computers, 12(8), 153.  
Montoya, J., Arbesú, I., Contreras, G., & Conzuelo, S. (2014). Evaluación de la docencia universitaria en  
México, Chile y Colombia: Análisis de experiencias. Revista Iberoamericana de Evaluación Educativa,  
Ngai, E. W., & Lee, P. T. Y. (2016). A review of the literature on applications of text mining in policy mak-  
ing.  
Pacheco, M. L. C., Ibarra, I., Iñiguez, M. E., Lee, H., & Sánchez, C. V. (2018). La evaluación del desempeño  
docente en la educación superior. Revista Digital Universitaria (RDU), 19(6), 111.  
Peña-Torres, J. A. (2024). Towards an improved of teaching practice using Sentiment Analysis in Student  
Radford, A., Narasimhan, K., Salimans, T., & Sutskever, I. (2018). Improving language understanding by  
Rodriguez Siu, J. L., Rodríguez Salazar, R. E., & Fuerte Montaño, L. (2021). Habilidades blandas y el des-  
empeño docente en el nivel superior de la educación. Propósitos y Representaciones, 9(1).  
Wang, Z., Xie, Q., Feng, Y., Ding, Z., Yang, Z., & Xia, R. (2023). Is ChatGPT a good sentiment analyzer? A  
preliminary study. arXiv. https://arxiv.org/abs/2304.04339  
Wellein, M. G., Ragucci, K. R., & Lapointe, M. (2009). A peer review process for classroom teaching.  
American Journal of Pharmaceutical Education, 73(5), 17. https://doi.org/10.5688/aj730579  
41  
Jiménez, B. et al.; revista Sciéndo ingenium, v. 21, n. 3, pp. 31 42, 2025.  
Zhang, Y., Chen, M., & Liu, L. (2015). A review on text mining. In 2015 6th IEEE International Conference  
on Software Engineering and Service Science (ICSESS) (pp. 681685).  
Zhang, W., Li, X., Deng, Y., Bing, L., & Lam, W. (2022). A survey on aspect-based sentiment analysis:  
Tasks, methods, and challenges. IEEE Transactions on Knowledge and Data Engineering, 35(11), 11019–  
11038.  
42