Please enable JavaScript.
Coggle requires JavaScript to display documents.
Manipulación de Datos con R - Coggle Diagram
Manipulación de Datos con R
ggplot2
Es una librería para crear gráficos de forma declarativa, basado en The Grammar of Graphics.
Es un paquete de trazado que proporciona comandos útiles para crear trazados complejos a partir de datos en un marco de datos.
Ademas
Proporciona una interfaz más programática para especificar qué variables trazar, cómo se muestran y propiedades visuales generales
Instalaciòn
La forma más fácil de obtener ggplot2 es instalar todo el tidyverse: install.packages("tidyverse")
Otra opción es instalar sólo ggplot2:
install.packages("ggplot2")
O se puede instalar la versión de desarrollo de GitHub, install.packages("pak")
pak::pak("tidyverse/ggplot2")
Uso
Los gráficos de ggplot se construyen capa por capa agregando nuevos elementos. Agregar capas de esta manera permite una gran flexibilidad y personalización de los gráficos.
Los gráficos importantes en la visualización de datos con ggplot2 son
Funciones ùtiles
Cheat Sheet 1:
https://bit.ly/46o3wKK
Cheat Sheet 2:
https://bit.ly/3MfpRlJ
Gráfico de barras
Tramas de violín
Gráficos de densidad
Diagramas de caja
*Gráfico circular
Gráfico de barras apiladas
Gráfico de dispersión
Gráficos de frecuencia
Utilice ggplot2 para visualizar datos de series temporales y sus componentes como estacionalidad, tendencias y otros.
dplyr
Es una librería de herramientas para las tareas de manipulación de datos, diseñado para trabajar con data frame.
Instalación
Se debe instalar con el comando
install.packages("dplyr") ## install
Pero
Se suele recomendar instalar el paquete tidyverse
ya que es una colección de algunos paquetes útiles para la ciencia de datos
Para utilizar la librería se necesita el comando
library("dplyr") ## load
Se necesita instalar el paquete una vez, pero se debe cargar cada vez que se abre una nueva ventana en R.
Uso
Manejar grandes cantidades datos y realizar algunas operaciones comunes.
Esta biblioteca opera con datos estructurados tabulares llamados marcos de datos o data frames.
Para crear un marco de datos desde cero, se puede utilizar la siguiente sintaxis
df<-data.frame(name = c("Alice", "Bob", "Charlie"), age = c(25, 30, 35), occupation = c("Software Engineer", "Data Scientist", "Product Manager"))
Funciones denominadas verbos
Verbos en columnas
Para eligir un subconjunto de columnas:
select()
Para cambiar el nombre de las columnas:
rename()
Para cambiar los valores de las columnas y crea nuevas columnas:
mutate()
Para reordenar de las columnas:
relocate()
Group By
Para convertir una tabla en una tabla agrupada:
group_by()
Para expandir una tabla agrupada en una tabla:
ungroup()
Para colapsar un grupo en una sola fila:
summarize()
Verbos en filas
Para seleccionar filas por desplazamiento:
slice()
Para ordenar filas por valores de una columna:
arrange()
Para seleccionar filas por valores de columna:
filter()
Otras funciones
Cheat Sheet 1:
https://bit.ly/46mRdy2
Cheat Sheet 2:
https://bit.ly/46qfnYz