Gráficos de dispersión, histogramas y densidad

Este script en R se centra en la visualización y análisis de datos utilizando diversas técnicas gráficas. A continuación se explica paso a paso cada sección del script, resaltando las funciones importantes utilizadas y su propósito.

Importación de Datos

Primero, se importan los datos desde un archivo de Excel utilizando la función read_excel() del paquete readxl. Los datos se leen desde la hoja “fungicida_campo” del archivo “dados-diversos.xlsx” y se asignan al data frame fungicida_campo.

Codigo

library(tidyverse)
library(readxl)

fungicida_campo <- read_excel("dados-diversos.xlsx", "fungicida_campo")

Scatterplots

Los scatterplots son gráficos que muestran la relación entre dos variables numéricas. Se utilizan para identificar patrones o correlaciones entre ellas.

Scatterplot básico con `geom_jitter()` y `stat_summary()`

En este bloque de código, se crea un scatterplot que muestra la dispersión de los datos de sev (severidad) versus trat (tratamiento), con puntos distribuidos de manera jittered para evitar superposiciones y se añade la media utilizando stat_summary().

Codigo

fungicida_campo |> 
  ggplot(aes(trat, sev)) +
  geom_jitter(width = 0.1, color = "gray60") +
  stat_summary(fun = mean, color = "red")+
  theme_few()

Scatterplot con intervalo de confianza

Este scatterplot añade un intervalo de confianza alrededor de la media utilizando stat_summary() con fun.data = mean_se.

Codigo

fungicida_campo |> 
  ggplot(aes(trat, sev)) +
  geom_jitter(width = 0.1, color = "gray60") +
  stat_summary(fun.data = mean_se, color = "red")+
  theme_few()

Scatterplot cambiando variables y estética

En este ejemplo, se cambia la variable sev al eje x y yld (rendimiento) al eje y, y se colorea por trat utilizando scale_color_colorblind(). Además, se ajusta la transparencia de los puntos usando alpha.

Codigo

library(ggthemes)

fungicida_campo |> 
  ggplot(aes(sev, yld, color = trat)) +
  geom_point(size = 3, alpha = 0.8) +
  scale_color_colorblind()+
  theme_few()

Scatterplot con línea de tendencia

Aquí se añade una línea de tendencia lineal utilizando geom_smooth() con method = "lm" y se = FALSE para eliminar la visualización del intervalo de confianza.

Codigo

fungicida_campo |> 
  ggplot(aes(sev, yld)) +
  geom_point(size = 3, alpha = 0.8) +
  geom_smooth(method = "lm", se = FALSE, color = "black", linetype = "solid", size = 2) +
  scale_color_colorblind()+
  theme_few()

Gráficos de dispersión para análisis factorial

En esta sección, se cambia el subconjunto de datos a milho y se crea un scatterplot que muestra la variación del rendimiento (yield) de diferentes híbridos de maíz (hybrid) según el método de inoculación (method). Se utiliza facet_wrap() para separar los gráficos por hybrid.

Codigo

milho <- read_excel("dados-diversos.xlsx", "milho")

milho |> 
  ggplot(aes(hybrid, yield, color = method)) +
  geom_jitter(size = 2) +
  facet_wrap(~hybrid)+
  theme_few()+
  scale_color_few()

Histogramas

Los histogramas se utilizan para visualizar la distribución de una variable numérica. Se construyen con geom_histogram().

Histograma de `yield`

En este ejemplo, se crea un histograma para la variable yield con 10 bins, y se cambia el color del borde (color) y el color de relleno (fill) de las barras.

Codigo

p_yield <- milho |> 
  ggplot(aes(x = yield)) +
  geom_histogram(bins = 10, color = "black", fill = "green")+
  theme_few()+
  scale_color_few()

p_yield

Histograma de `index`

Se crea un histograma similar para la variable index, cambiando los colores de las barras.

Codigo

p_index <- milho |> 
  ggplot(aes(x = index)) +
  geom_histogram(bins = 10, color = "black", fill = "blue")+
  theme_few()+
  scale_color_few()
p_index

Combinación de histogramas con `patchwork`

Se combinan los histogramas de yield y index utilizando patchwork, organizándolos en una única visualización.

Codigo

library(patchwork)

(p_yield + p_index) +
  plot_annotation(tag_levels = "A")

Codigo

ggsave("figs/histograms.png", bg = "white")

Gráfico de densidad

Los gráficos de densidad muestran la distribución de probabilidad de una variable continua. Se utilizan geom_density().

Gráfico de densidad de `index`

En este ejemplo, se crea un gráfico de densidad para la variable index.

Codigo

milho |> 
  ggplot(aes(x = index)) +
  geom_density()+
  theme_few()+
  scale_color_few()

Gráfico de columnas

Se utiliza un nuevo subconjunto de datos (insect) para crear un gráfico de columnas (geom_col()), donde inseticida está en el eje x y value en el eje y. Se convierte el formato de ancho a largo con pivot_longer().

Codigo

insect <- read_excel("dados-diversos.xlsx", "mortalidade")

insect |> 
  pivot_longer(2:3, names_to = "status", values_to = "value") |> 
  ggplot(aes(inseticida, value, fill = status)) +
  geom_col()+
  theme_few()+
  scale_fill_manual(values = c("#669933", "#FFCC66"))

Aprendizaje del día

Este script en R demuestra cómo importar datos desde Excel, realizar visualizaciones como scatterplots, histogramas, gráficos de densidad y gráficos de columnas utilizando el paquete ggplot2 y otras herramientas como patchwork y tidyverse. Cada sección utiliza diferentes funciones y estéticas para explorar y visualizar datos de manera efectiva y clara.

# Gráficos de dispersión, histogramas y densidad Este script en R se centra en la visualización y análisis de datos utilizando diversas técnicas gráficas. A continuación se explica paso a paso cada sección del script, resaltando las funciones importantes utilizadas y su propósito. ### Importación de Datos Primero, se importan los datos desde un archivo de Excel utilizando la función `read_excel()` del paquete `readxl`. Los datos se leen desde la hoja "fungicida_campo" del archivo "dados-diversos.xlsx" y se asignan al data frame `fungicida_campo`. ```{r} library(tidyverse) library(readxl) fungicida_campo <- read_excel("dados-diversos.xlsx", "fungicida_campo") ``` ### Scatterplots Los scatterplots son gráficos que muestran la relación entre dos variables numéricas. Se utilizan para identificar patrones o correlaciones entre ellas. #### Scatterplot básico con `geom_jitter()` y `stat_summary()` En este bloque de código, se crea un scatterplot que muestra la dispersión de los datos de `sev` (severidad) versus `trat` (tratamiento), con puntos distribuidos de manera jittered para evitar superposiciones y se añade la media utilizando `stat_summary()`. ```{r} fungicida_campo |> ggplot(aes(trat, sev)) + geom_jitter(width = 0.1, color = "gray60") + stat_summary(fun = mean, color = "red")+ theme_few() ``` #### Scatterplot con intervalo de confianza Este scatterplot añade un intervalo de confianza alrededor de la media utilizando `stat_summary()` con `fun.data = mean_se`. ```{r} fungicida_campo |> ggplot(aes(trat, sev)) + geom_jitter(width = 0.1, color = "gray60") + stat_summary(fun.data = mean_se, color = "red")+ theme_few() ``` #### Scatterplot cambiando variables y estética En este ejemplo, se cambia la variable `sev` al eje x y `yld` (rendimiento) al eje y, y se colorea por `trat` utilizando `scale_color_colorblind()`. Además, se ajusta la transparencia de los puntos usando `alpha`. ```{r} library(ggthemes) fungicida_campo |> ggplot(aes(sev, yld, color = trat)) + geom_point(size = 3, alpha = 0.8) + scale_color_colorblind()+ theme_few() ``` #### Scatterplot con línea de tendencia Aquí se añade una línea de tendencia lineal utilizando `geom_smooth()` con `method = "lm"` y `se = FALSE` para eliminar la visualización del intervalo de confianza. ```{r} fungicida_campo |> ggplot(aes(sev, yld)) + geom_point(size = 3, alpha = 0.8) + geom_smooth(method = "lm", se = FALSE, color = "black", linetype = "solid", size = 2) + scale_color_colorblind()+ theme_few() ``` ### Gráficos de dispersión para análisis factorial En esta sección, se cambia el subconjunto de datos a `milho` y se crea un scatterplot que muestra la variación del rendimiento (`yield`) de diferentes híbridos de maíz (`hybrid`) según el método de inoculación (`method`). Se utiliza `facet_wrap()` para separar los gráficos por `hybrid`. ```{r} milho <- read_excel("dados-diversos.xlsx", "milho") milho |> ggplot(aes(hybrid, yield, color = method)) + geom_jitter(size = 2) + facet_wrap(~hybrid)+ theme_few()+ scale_color_few() ``` ### Histogramas Los histogramas se utilizan para visualizar la distribución de una variable numérica. Se construyen con `geom_histogram()`. #### Histograma de `yield` En este ejemplo, se crea un histograma para la variable `yield` con 10 bins, y se cambia el color del borde (`color`) y el color de relleno (`fill`) de las barras. ```{r} p_yield <- milho |> ggplot(aes(x = yield)) + geom_histogram(bins = 10, color = "black", fill = "green")+ theme_few()+ scale_color_few() p_yield ``` #### Histograma de `index` Se crea un histograma similar para la variable `index`, cambiando los colores de las barras. ```{r} p_index <- milho |> ggplot(aes(x = index)) + geom_histogram(bins = 10, color = "black", fill = "blue")+ theme_few()+ scale_color_few() p_index ``` #### Combinación de histogramas con `patchwork` Se combinan los histogramas de `yield` y `index` utilizando `patchwork`, organizándolos en una única visualización. ```{r} library(patchwork) (p_yield + p_index) + plot_annotation(tag_levels = "A") ggsave("figs/histograms.png", bg = "white") ``` ### Gráfico de densidad Los gráficos de densidad muestran la distribución de probabilidad de una variable continua. Se utilizan `geom_density()`. #### Gráfico de densidad de `index` En este ejemplo, se crea un gráfico de densidad para la variable `index`. ```{r} milho |> ggplot(aes(x = index)) + geom_density()+ theme_few()+ scale_color_few() ``` ### Gráfico de columnas Se utiliza un nuevo subconjunto de datos (`insect`) para crear un gráfico de columnas (`geom_col()`), donde `inseticida` está en el eje x y `value` en el eje y. Se convierte el formato de ancho a largo con `pivot_longer()`. ```{r} insect <- read_excel("dados-diversos.xlsx", "mortalidade") insect |> pivot_longer(2:3, names_to = "status", values_to = "value") |> ggplot(aes(inseticida, value, fill = status)) + geom_col()+ theme_few()+ scale_fill_manual(values = c("#669933", "#FFCC66")) ``` ### Aprendizaje del día Este script en R demuestra cómo importar datos desde Excel, realizar visualizaciones como scatterplots, histogramas, gráficos de densidad y gráficos de columnas utilizando el paquete `ggplot2` y otras herramientas como `patchwork` y `tidyverse`. Cada sección utiliza diferentes funciones y estéticas para explorar y visualizar datos de manera efectiva y clara.

Gráficos de dispersión, histogramas y densidad

Importación de Datos

Scatterplots

Scatterplot básico con geom_jitter() y stat_summary()

Scatterplot con intervalo de confianza

Scatterplot cambiando variables y estética

Scatterplot con línea de tendencia

Gráficos de dispersión para análisis factorial

Histogramas

Histograma de yield

Histograma de index

Combinación de histogramas con patchwork

Gráfico de densidad

Gráfico de densidad de index

Gráfico de columnas

Aprendizaje del día

Scatterplot básico con `geom_jitter()` y `stat_summary()`

Histograma de `yield`

Histograma de `index`

Combinación de histogramas con `patchwork`

Gráfico de densidad de `index`