Estudiante del IPN creó un software para detectar el plagio académico

Estudiante del IPN creó un software para detectar el plagio académico
En la gaceta del Instituto Politécnico Nacional Año LI, Vol. 17, Núm. 1128

Por el desarrollo de un modelo de detección de plagio, Miguel Ángel Sánchez Pérez, alumno de doctorado, así como Alexander Gelbukh y Grigori Sidorov, científicos del Centro de Investigación en Computación (CIC), obtuvieron el primer lugar en la categoría de alineación de textos del 11th Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse, celebrado en la Universidad de Sheffield, Inglaterra.

Esta tecnología, ideada por Miguel Ángel Sánchez con la asesoría de Gelbukh y Sidorov para obtener el grado de Maestro en Ciencias de la Computación, superó a trabajos desarrollados por competidores de Chile, Estados Unidos, España, Alemania, China y Reino Unido.

Miguel Ángel Sánchez señaló que descubrir un plagio implica la búsqueda y conocimiento de una amplia cantidad de textos en fuentes originales, por ello científicos de todo el mundo centran sus investigaciones en la generación de modelos para la detección automática de plagio.

Explicó que la localización de fragmentos de texto semejantes entre dos documentos se denomina alineación de textos. Por ejemplo, si el primer párrafo del texto corresponde al tercer párrafo de otro escrito. “Ese es el objetivo del modelo”, puntualizó.

Para competir, el modelo debe llevarse a un sistema o software con alto grado de eficiencia, porque se evalúan miles de documentos, se practica un gran número de comparaciones entre textos en busca de fragmentos plagiados. “En el certamen se proporciona a los equipos competidores un corpus (base de datos) aproximado de 5 mil pares de documentos a comparar, los cuales pueden o no contener plagio”, indicó.

El galardonado comentó que el proceso del concurso consistió en encontrar con el modelo desarrollado los fragmentos similares entre un par de documentos que les proporcionan.

“Para evaluar qué tan bien encontramos un par de fragmentos similares, las medidas usadas son: precisión y exhaustividad. Precisión se refiere a cuántos caracteres del fragmento que detecté realmente fueron plagiados, mientras que exhaustividad se refiere a cuántos, de la cantidad de caracteres que fueron plagiados, detecté. La combinación de esos dos parámetros nos permitió ganar el concurso”, expresó.

Después de que Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse evaluó el trabajo y resultó ser mejor que los otros, Sánchez Pérez estimó que el modelo puede tener alcances importantes. “El sistema podría usarse, por ejemplo, en un administrador de bases de datos de Scopus o de Thomson & Reuters. Cuando se publica un documento el sistema es capaz de decir a qué documentos se parece y solicitar al editor que lo verifique”, concluyó.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s