En este proyecto se pide realizar la clasificación de propiedades en Colombia por encima y por debajo de un valor (definido como la media de los precios de las propiedades en el DataSet de entrenamiento) Para ejecutar estos archivos se deberá descargar los DataSets tanto de entrenamiento como de testeo: https://drive.google.com/drive/folders/16LE3ne9jZqqw6d7rLWnh3FVLhYD3KYgM?usp=sharing Esto se debe a una limitación del tamaño de archivo que permite cargar github en su plataforma de manera gratuita.
Se realizó un Árbol de Decisión como modelo predictivo, en el Archivo 3 se puede encontrar su código y puede ser ejecutado sin necesidad de descargar los archivos del Drive.
La totalidad del código se encuentra explicado y justificado. Posteriormente se podría sumar valor al trabajo utilizando Procesamiento de Lenguaje Natural. Y de esta manera utilizar las descripciones de las propiedades para poder superar la mayor falencia que tienen los datasets, que son los faltantes de features fundamentales como Superficie cubierta de la propiedad o cantidad de habitaciones.