Ejemplo de Análisis usando Google Colab y Python
Ejemplo de Análisis usando Google Colab y Python
Propósito
El ejercicio usa data Kaggle para ejecutar el proceso de análisis de información recuperada vía IoT de un sembradío de Lechuga, la idea es encontrar las condiciones ideales que señalen el máximo crecimiento posible de las lechugas.
El análisis es realizado en colab y utilizando librerías Python mostradas enseguida.
Acerca del Conjunto de Datos
Este conjunto de datos integral proporciona información valiosa sobre los patrones de crecimiento de diversas plantas bajo distintas condiciones ambientales. Recopilado a lo largo del tiempo, ofrece una visión detallada de cómo factores como la temperatura, la humedad, el nivel de pH y los Sólidos Disueltos Totales (TDS) influyen en las etapas de crecimiento y desarrollo de estas plantas."
CÓDIGO
RESULTADOS
Obtención de datos...
Ruta a los archivos del dataset: /root/.cache/kagglehub/datasets/jjayfabor/lettuce-growth-days/versions/6
Plant_ID,Date,Temperature (°C),Humidity (%),TDS Value (ppm),pH Level,Growth Days
1,8/3/2023,33.4,53,582,6.4,1
1,8/4/2023,33.5,53,451,6.1,2
1,8/5/2023,33.4,59,678,6.4,3
1,8/6/2023,33.4,68,420,6.4,4
1,8/7/2023,33.4,74,637,6.5,5
1,8/8/2023,32.3,77,478,6.8,6
1,8/9/2023,32.3,75,682,6,7
1,8/10/2023,22.7,63,576,6.3,8
1,8/11/2023,31.9,69,662,6.1,9
Analizando archivo: lettuce_dataset.csv
Tamaño del archivo: 99.42 KB
Última modificación: 2025-03-18 22:11:31
Archivo leído exitosamente con codificación: latin-1
== ESTRUCTURA DEL DATASET ==
Plant_ID Date Temperature (°C) Humidity (%) TDS Value (ppm) \
0 1 8/3/2023 33.4 53 582
1 1 8/4/2023 33.5 53 451
2 1 8/5/2023 33.4 59 678
3 1 8/6/2023 33.4 68 420
4 1 8/7/2023 33.4 74 637
pH Level Growth Days
0 6.4 1
1 6.1 2
2 6.4 3
3 6.4 4
4 6.5 5
== INFORMACIÓN DEL DATASET ==
Número de filas: 3169
Número de columnas: 7
== TIPOS DE DATOS ==
Plant_ID int64
Date object
Temperature (°C) float64
Humidity (%) int64
TDS Value (ppm) int64
pH Level float64
Growth Days int64
dtype: object
== DATOS NULOS ==
No hay datos nulos
== TRANSFORMACIÓN DE DATOS ==
Columnas originales: ['Plant_ID', 'Date', 'Temperature (°C)', 'Humidity (%)', 'TDS Value (ppm)', 'pH Level', 'Growth Days']
Columnas normalizadas: ['Plant_ID', 'Date', 'Temperature', 'Humidity', 'TDS', 'pH', 'Growth_Days']
Columna 'Temperature' convertida a numérica. Valores nulos: 0
Columna 'Humidity' convertida a numérica. Valores nulos: 0
Columna 'TDS' convertida a numérica. Valores nulos: 0
Columna 'pH' convertida a numérica. Valores nulos: 0
Columna 'Growth_Days' convertida a numérica. Valores nulos: 0
Columnas numéricas disponibles para el análisis: ['Temperature', 'Humidity', 'TDS', 'pH', 'Growth_Days']
== ESTADÍSTICAS DESCRIPTIVAS ==
count mean std min 25% 50% 75% max
Temperature 3169.0 28.142222 4.670521 18.0 23.6 30.2 31.5 33.5
Humidity 3169.0 64.873462 8.988985 50.0 57.0 65.0 73.0 80.0
TDS 3169.0 598.045440 115.713047 400.0 498.0 593.0 699.0 800.0
pH 3169.0 6.399211 0.234418 6.0 6.2 6.4 6.6 6.8
Growth_Days 3169.0 23.140107 13.075415 1.0 12.0 23.0 34.0 48.0
== ESTADÍSTICAS DESCRIPTIVAS CON MEDIANA, RANGO Y CV ==
count mean std min 25% 50% 75% max \
Temperature 3169.0 28.14 4.67 18.0 23.6 30.2 31.5 33.5
Humidity 3169.0 64.87 8.99 50.0 57.0 65.0 73.0 80.0
TDS 3169.0 598.05 115.71 400.0 498.0 593.0 699.0 800.0
pH 3169.0 6.40 0.23 6.0 6.2 6.4 6.6 6.8
Growth_Days 3169.0 23.14 13.08 1.0 12.0 23.0 34.0 48.0
mediana rango cv
Temperature 30.2 15.5 16.60
Humidity 65.0 30.0 13.86
TDS 593.0 400.0 19.35
pH 6.4 0.8 3.66
Growth_Days 23.0 47.0 56.51
Comentarios finales
El análisis de datos permite visualizar el rango de optimalidad de las variables ambientales. La versatilidad de las librerías permiten evidenciar los patrones y comportamientos de los datos históricos y con ellos llegar a conclusiones eficientes en razón del objetivo buscado, que en este caso se pretende identificar la combinación de variables que propicien más el crecimento de la cosecha.