Skip to content

Proyecto de datos Geoespaciales en Google Earth Engine con Sentinel 2 y 1. Modelo de predicción impulsado por Random Forest.

Notifications You must be signed in to change notification settings

AESMatias/IMT2118-ProyectoManhattan

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🌆 IMT2118-Proyecto-Manhattan 🌆

Análisis Geoespacial de Propiedades en Nueva York

El distrito de Manhattan es conocido por ser la zona residencial más costosa de toda la ciudad de New York, contando con un aproximado de 8,6 millones de habitantes, y, según la página tinsa en 2013, también es conocido por ser una de las zonas de tiendas más caras y exclusivas de todo el mundo. Un ejemplo concreto de esto ocurrió con la empresa Zara, que gastó una suma total de 324 millones de dólares por un local de este distrito. Las razones del precio de sus residencias son variadas, pero destaca por sobre todo en ser un lugar lujoso y turístico, y no es para menos, puesto que ((alberga varias atracciones tur´ısticas famosas, como el Empire State Building, el Chrysler Building, el Rockefeller Center, el World Trade Center, el puente de Brooklyn y Central Park)).

Manhattan es uno de los lugares más caros para vivir, por ende, la meta de este proyecto consiste principalmente en poder facilitar la localización de los lugares potencialmente más efectivos para poder proliferar adecuadamente en esta ciudad, segúun los intereses de un potencial interesado en adquirir una vivienda. Se intenta responder a la pregunta ¿En qué zonas es más probable encontrar pro- piedades en venta que sean favorables para un futuro comprador, considerando factores económicos, índices delictivos, cercanía a servicios de transporte, de salud y educación, entre otros?

Este proyecto fue realizado en Google Colab, hay que seguir la estructura de directorios y ficheros indicada en el repositorio, y simplemente ejecutar el .ipynb. En caso de utilizar otro entorno, probablemente habrá que instalar librerías faltanes.

Funcionamiento general del proyecto, a grandes rasgos.

Primero que nada, la estructura del proyecto está dividida en:

  • Los directorios, donde los datasets y los archivos vectoriales necesarios están en los directorios "datasets" y "shapefiles", respectivamente. Mientras que en el directorio "Informe" se encuentra el .zip trabajado para generar el fichero del informe, llamado "Informe.pdf", que está en la raíz del proyecto. En el directorio "Presentation" se pueden encontrar el PPTX de la presentación. Finalmente, el fichero "Entrega_1V12.ipynb", contiene el código principal de todo el proyecto.

El proyecto se divide en tres grandes etapas:

  1. Preparación de datos, esto incluye la proyección, geodoficación, limpieza, operaciones geoespaciles de los GeoDataFrames como la unión espacial, entre otros.

  2. Creación del modelo predictivo usando el algoritmo Random Forest con el GeoDataFrame resultante de la unión de todos los parámetros (obtenidos de los diferentes datasets). Con el dataset ya enriquecido, se entrena un modelo de aprendizaje automático (Random Forest). Este modelo aprende la relación entre las características de una propiedad, como su tamaño, antigüedad, cercanía a servicios básicos de salud, e incluso variables categóricas como la ubicación, entre otras. Esto lo relaciona con el precio de venta final e intenta predecir una aproximación del precio de venta, determinándolo según los parámetros entregados en el entrenamiento.

  3. En los resultados, finalmente, se entrega un simulador interactivo y una visualización dinámica, junto con los resultados del entrenamiento y las visualizaciones generadas en el transcurso de los análisis que fueron realizados a los datos geoespaciales, de tipo vectorial y raster.

About

Proyecto de datos Geoespaciales en Google Earth Engine con Sentinel 2 y 1. Modelo de predicción impulsado por Random Forest.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%