Synopses & Reviews
Synopsis
En el Aprendizaje Automatizado es una necesidad el preprocesamiento de la informaci n, la selecci n, la limpieza, el enriquecimiento, la reducci n y la transformaci n de las bases de datos. La Teor a de los Conjuntos Aproximados (RST) abri una nueva direcci n en el desarrollo de teor as sobre la informaci n incompleta y es una poderosa herramienta para el an lisis de datos. En esta investigaci n se demuestra la posibilidad de usar esta teor a en el preprocesamiento de los datos, para editar conjuntos de entrenamiento para resolver problemas de clasificaci n supervisada. Se propone un nuevo m todo (EditCenter) basado en los conceptos de aproximaci n de la RST y relaciones de similitud. El m todo propuesto ha sido estudiado experimentalmente usando bases de datos internacionales. Se realizan pruebas de efectividad en la clasificaci n con los m todos de los K-Vecinos m s Cercanos (k-NN) y C4.5 por ser de los m s referenciados, lo cual permite corroborar que es factible utilizar la Teor a de los Conjuntos Aproximados en la edici n de conjuntos de entrenamiento.