Please enable JavaScript.
Coggle requires JavaScript to display documents.
2.9 Transformación de datos. - Coggle Diagram
2.9 Transformación de datos.
Es un proceso fundamental en el análisis de datos y la programación en general. Puedes transformar datos de diversas maneras, como cambiar el formato, limpiarlos, filtrarlos, combinarlos o aplicarles operaciones matemáticas o estadísticas.
Pandas:
Es una biblioteca de Python ampliamente utilizada para la manipulación y análisis de datos. Proporciona estructuras de datos flexibles y permite realizar operaciones de transformación, limpieza y manipulación de datos de manera eficiente.
import pandas as pd
Cargar datos desde un archivo CSV
data = pd.read_csv('datos.csv')
Filtrar filas según una condición
data_filtrada = data[data['columna'] > 10]
Aplicar una función a una columna
data['columna_transformada'] = data['columna'].apply(lambda x: x * 2)
Agregar nuevas columnas
data['nueva_columna'] = data['columna1'] + data['columna2']
Eliminar columnas
data = data.drop(columns=['columna_a_eliminar'])
NumPy
Es una biblioteca fundamental para la computación numérica en Python. Proporciona estructuras de datos eficientes para trabajar con matrices y arreglos multidimensionales, lo que es útil para realizar operaciones matemáticas en grandes conjuntos de datos.
import numpy as np
Crear un array
array = np.array([[1, 2, 3], [4, 5, 6]])
Transponer el array
array_transpuesto = np.transpose(array)
Aplicar una función a todos los elementos del array
array_transformado = np.sqrt(array)
Operaciones matemáticas entre arrays
resultado = array + array_transpuesto
Transformaciones básicas de Python
Python proporciona funciones y métodos integrados para realizar transformaciones básicas en listas, diccionarios y otros tipos de datos.
Filtrar elementos de una lista
lista = [1, 2, 3, 4, 5]
lista_filtrada = [x for x in lista if x > 2]
Map y lambda para aplicar una función a una lista
lista_transformada = list(map(lambda x: x * 2, lista))
Comprehension de diccionarios para filtrar claves
diccionario = {'a': 1, 'b': 2, 'c': 3}
diccionario_filtrado = {k: v for k, v in diccionario.items() if v > 1}