Herramientas para el procesamiento de datos

Miguel Alejandro Salgado Zapien

2021-05-13

Continuación

Ya tenemos instaladas la mayoría de las dependencias que necesitaremos durante el curso.

Ahora sigue continuar utilizándolas para ganar familiaridad y experiencia.

Manejo de archivos CSV.

Python tiene un lector de CSV pre instaladas, dentro de su librería nativa.

Intentaremos abrir uno, para ello importaremos csv.

Utilizar el archivo cities.csv.

import csv

with open('jupyter/cities.csv', newline='') as csvfile:
    reader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for n, row in enumerate(reader):
        print('\t'.join([str(n), *row]))

Este CSV tiene las columnas nombradas y el ultimo renglón se encuentra vació.

Ahora el manejo de csv utilizando el modulo pandas.

import pandas as pd

df = pd.read_csv("jupyter/cities.csv")
print(df)

Este método nos permite leer csv directo a marcos de datos.

El manejo de json y diccionarios

Los objetos tipo json son similares a los diccionarios de Python, debido a la característica de ser almacenes de llave valor esto permite poder leer un json y un dict de maneras muy parecidas.

La diferencia cae en que un dict de Python permite cualquier tipo de objeto para su llave, siempre que permita un hash y javascript son exclusivamente string.

En el lenguaje Python es común utilizar todo tipo de objetos como llave de un Diccionario.

Seguir diapositivas de ../utt-ibd/diary/2021-05-11.html