python_pandas_excel

Convertir un objeto dataframe de Python a excel: hacer una conversión de dataframe a excel es posible gracias a la clase ExcelWriter de Python Pandas. Con este procedimiento se pueden manipular ficheros .xslx, por ejemplo para poder extraer los datos de excel, minarlos en Python y volcar esos datos de nuevo en un fichero Excel, algo que a buen seguro agradecerán los usuarios no programadores.

En el post de hoy vamos a proceder a crear un fichero excel (.xslx) a partir de un DataFrame de Pandas. Empezaremos por una lectura en un fichero .csv, un standart al igual que los ficheros TXT, JSON o XML.

ExcelWriter es la clase en la que convertimos el fichero .xlsx para poder trabajar sobre él.

.to_excel es el método que permite grabar en Excel, a partir de la clase ExcelWriter. Con el parámetro sheet_name identificamos las diferentes pestañas del fichero que estamos elaborando.

os.chdir('/Users/ruizg/OneDrive/Documentos/python/Python - Handbook') # la ruta de trabajo
df = pd.read_csv('world.csv') # lectura de fichero csv
df['Total'] = 1 # Añadimos una columna total con valor 1
df['population'] = df['population'] / 1_000 # opero una columna (por ejemplo)
writer = pd.ExcelWriter('file_data.xlsx') # identifico un fichero de datos
df['Name'].to_excel(writer, sheet_name="Name", index=False) # Pestaña 1: Guarda la columna Name
df['Continent'].to_excel(writer, sheet_name="Continent", index=False) # identifico una columna y una pestaña
df['Region'].to_excel(writer, sheet_name="Region", index=False) # identifico una columna y una pestaña
df['population'].to_excel(writer, sheet_name="Population", index=False) # identifico una columna y una pestaña
df[['Name','Continent','Region','population','Capital']].to_excel(writer, sheet_name="DataFrame", index=False) # identifico varias columnas y varias pestaña
writer.save()
writer.close()

El pantallazo se vería así en Spyder:

Python Pandas to dataframe
En el ejercicio, se construye un fichero excel de 5 pestañas. En las primeras 4 hemos escrito una sola columna, en la última hemos incluido 5 columnas del dataframe de Pandas.

La visualización del fichero Excel en su quinta pestaña, se vería del siguiente modo, contiene los 5 campos del dataframe al que hemos llamado con dobles corchetes:

From Python-Pandas DataFrame to MS Excel
Salida excel del dataframe de Python Pandas. En la parte inferior de la imagen pueden verse las pestañas creadas.

Convertir un objeto dataframe de Python Pandas es muy sencillo como has podido ver.

De esta manera se pueden crear ficheros excel sin tan siquiera necesidad de tener el MS Office en tu ordenador.

Si quieres estudiar Python puedes hacerlo aquí, hay muchos más tutoriales esperándote -> Python

Más información sobre pandas.DataFrame.to_excel -> dataframe to excel

Excel es un software ideal para compartir ficheros y ser utilizado como hoja de cálculo para usuarios no informáticos. Sin embargo, no es eficiente administrando gran cantidad de datos y realizando tareas mecanizadas. Por este motivo en Ciencia de Datos aunque sigue siendo necesario editar y manipular ficheros excel de cara a clientes o compañeros de trabajo, es mejor utilizar otras herramientas capaces de administrador datos de un modo más eficiente, veloz, potente y escalable, como Spyder.

En Ciencia de Datos Python y R son los capos en proceso de datos. Por su habilidad en la manipulación y secuenciación de procesos, funciones y rutinas, evitando errores y en la medida de lo posible la constante repetición de tareas.

Python is awesome!

Autor: ignacio

Profesor de Sistemas de Gestión de Información

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *