Apéndice F — Índice de datasets utilizados

Descargar todos los datasets (datasets.zip)

F.1 Análisis de producto terminado de una fabricación diaria de camembert

En formato CSV y Excel

Descargar camembert.csv

Mostrar código
library(gt)
library(dplyr)

df <- read.csv2("datos/camembert.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fecha fabricacion est mg ph cloruros coliformes
11/01/2020 1.00 46.68 24.00 4.85 1.50 80.00
12/01/2020 1.00 48.09 25.00 4.67 1.61 0.00
13/01/2020 1.00 45.97 24.00 4.71 1.48 9,200.00
14/01/2020 1.00 46.24 23.50 4.78 1.69 20.00
15/01/2020 1.00 45.81 23.00 4.77 1.56 150.00
18/01/2020 1.00 46.00 24.00 4.67 1.56 60.00

F.2 Datos de fabricación simulados de un queso de vaca

Descargar 02-fab_queso_sim.csv

En el apéndice B, los detalles de la simulación y el código Python utilizado.

Mostrar código
df <- read.csv2("datos/02-fab_queso_sim.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fecha entrada_kg entrada_litros entrada_grasa_g_l entrada_prot_g_l cuba_fab_litros cuba_fab_grasa_g_l cuba_fab_prot_g_l stock_cierre_litros queso_kg queso_est_pct queso_mg_pct
31/12/2023 4,895.00 4,752.00 45.13 36.68 NA NA NA 4,752.00 NA NA NA
01/01/2024 5,516.00 5,355.00 40.98 34.63 5,025.00 41.07 33.95 5,107.00 637.56 49.95 25.46
02/01/2024 4,938.00 4,794.00 40.88 35.16 5,029.00 39.99 33.61 4,901.00 630.34 51.68 26.12
03/01/2024 5,704.00 5,538.00 43.38 35.32 5,032.00 40.55 33.85 5,439.00 628.81 51.29 26.16
04/01/2024 5,170.00 5,019.00 41.47 35.93 5,035.00 39.90 33.78 5,458.00 656.69 49.81 25.28
05/01/2024 NA NA NA NA 5,472.00 40.42 33.92 NA 705.30 52.73 26.31

F.3 Resultados de los partidos de La Liga, temporada 24-25

Descargar laliga_resultados2425.csv

Mostrar código
df <- read.csv2("datos/laliga_resultados2425.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 0
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fecha local visitante goles_local goles_visitante resultado
15/08/2024 Ath Bilbao Getafe 1 1 D
15/08/2024 Betis Girona 1 1 D
16/08/2024 Celta Alaves 2 1 H
16/08/2024 Las Palmas Sevilla 2 2 D
17/08/2024 Osasuna Leganes 1 1 D
17/08/2024 Valencia Barcelona 1 2 A

F.4 Datos de temperaturas medias mensuales de la ciudad de Oviedo, años 2020 a 2024

Descargar oviedo_temperatura.csv

Proporcionados por AEMET (Agencia Estatal de Meteorología)

Mostrar código
df <- read.csv2("datos/oviedo_temperatura.csv", dec = ",")
df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fecha temperatura
01/01/2020 9.20
01/02/2020 9.80
01/03/2020 11.40
01/04/2020 11.60
01/05/2020 14.20
01/06/2020 17.10

F.5 Datos de los pingüinos Palmer

Este dataset vieneincluido en las distribuciones de R y en la biblioteca seaborn

Ver https://allisonhorst.github.io/palmerpenguins/

Mostrar código
library(palmerpenguins)

df <- penguins
df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
species island bill_length_mm bill_depth_mm flipper_length_mm body_mass_g sex year
Adelie Torgersen 39.10 18.70 181.00 3,750.00 male 2,007.00
Adelie Torgersen 39.50 17.40 186.00 3,800.00 female 2,007.00
Adelie Torgersen 40.30 18.00 195.00 3,250.00 female 2,007.00
Adelie Torgersen NA NA NA NA NA 2,007.00
Adelie Torgersen 36.70 19.30 193.00 3,450.00 female 2,007.00
Adelie Torgersen 39.30 20.60 190.00 3,650.00 male 2,007.00

F.6 Datos de llenado de yogures — serie completa (cap. 17)

Descargar simulacion_envasado_yogur.csv

Dataset de 9.600 envases simulados correspondientes a un turno completo de 8 horas en una línea de llenado de yogures de 150 g. Incluye cinco períodos con diferentes patrones de variabilidad. Utilizado en el capítulo de control estadístico de procesos.

Mostrar código
df <- read.csv2("datos/simulacion_envasado_yogur.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
hora_envasado.n_envase.subgrupo.pos_subgrupo.peso_g
2024-10-01 08:00:00,1,1,1,152.89
2024-10-01 08:00:03,2,1,2,150.47
2024-10-01 08:00:06,3,1,3,153.46
2024-10-01 08:00:09,4,1,4,156.79
2024-10-01 08:00:12,5,1,5,150.11
2024-10-01 08:00:15,6,2,1,150.11

F.7 Datos de llenado de yogures — muestra por subgrupos (cap. 9)

Descargar llenado_yogures_muestra.csv

Dataset de 160 subgrupos de 5 envases, obtenidos por muestreo cada 3 minutos durante el mismo turno. Utilizado en los gráficos de control X-barra y S y en el análisis de capacidad de proceso.

Mostrar código
df <- read.csv2("datos/llenado_yogures_muestra.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
timestamp n_envase subgrupo pos_subgrupo peso_g muestra
2024-06-15 08:00:00 1.00 1.00 1.00 152.25 1.00
2024-06-15 08:00:45 16.00 4.00 1.00 150.66 1.00
2024-06-15 08:01:30 31.00 7.00 1.00 150.60 1.00
2024-06-15 08:02:12 45.00 9.00 5.00 149.28 1.00
2024-06-15 08:02:57 60.00 12.00 5.00 152.96 1.00
2024-06-15 08:03:00 61.00 13.00 1.00 150.78 2.00

F.8 Experimento de cuajado — diseño factorial 2²

Descargar experimento_cuajo.csv

Dataset de 12 fabricaciones correspondientes a un diseño factorial 2² (temperatura × dosis de cuajo, 3 réplicas por combinación). La variable respuesta es el porcentaje de retención de materia prima en el extracto seco magro del queso. Utilizado en el capítulo de diseño de experimentos.

Mostrar código
df <- read.csv2("datos/experimento_cuajo.csv", dec = ",")

df |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 12, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fabricacion temperatura dosis_cuajo retencion_pct
1.00 30.00 20.00 93.80
2.00 30.00 20.00 93.61
3.00 30.00 20.00 93.84
4.00 30.00 30.00 95.31
5.00 30.00 30.00 94.78
6.00 30.00 30.00 94.78
7.00 34.00 20.00 95.62
8.00 34.00 20.00 95.38
9.00 34.00 20.00 95.01
10.00 34.00 30.00 95.51
11.00 34.00 30.00 95.21
12.00 34.00 30.00 95.21

F.9 Estudio GRR — método Gerber (puntual)

Descargar grr_gerber.csv

Dataset de un estudio de repetibilidad y reproducibilidad del método Gerber para la determinación de materia grasa, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (45 observaciones). Utilizado en el capítulo de análisis del sistema de medición.

Mostrar código
df <- read.csv2("datos/grr_gerber.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
analista muestra valor_referencia repeticion resultado
Analista_1 A_baja 3.40 1.00 3.42
Analista_1 A_baja 3.40 2.00 3.39
Analista_1 A_baja 3.40 3.00 3.43
Analista_1 B_media 3.80 1.00 3.86
Analista_1 B_media 3.80 2.00 3.79
Analista_1 B_media 3.80 3.00 3.79

F.10 Seguimiento temporal del sistema de medición — método Gerber

Descargar grr_gerber_temporal.csv

Dataset de 12 meses de control del sistema de medición, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (540 observaciones). Incluye dos intervenciones: corrección del sesgo de Analista_4 en abril y formación de Analista_5 en junio. Utilizado en el capítulo de análisis del sistema de medición.

Mostrar código
df <- read.csv2("datos/grr_gerber_temporal.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )
fecha mes analista muestra valor_referencia repeticion resultado
15/01/2024 1.00 Analista_1 A_baja 3.40 1.00 3.42
15/01/2024 1.00 Analista_1 A_baja 3.40 2.00 3.40
15/01/2024 1.00 Analista_1 A_baja 3.40 3.00 3.42
15/01/2024 1.00 Analista_1 A_media 4.20 1.00 4.25
15/01/2024 1.00 Analista_1 A_media 4.20 2.00 4.19
15/01/2024 1.00 Analista_1 A_media 4.20 3.00 4.19

F.11 Otros datasets no utilizados en este libro

La mejor manera de aprender R y Pyhton es… ¡practicar! Hacer graficos de otros datasets es una de las mejores formas; hay muchas fuentes que puedes explorar y concursos en los que puedes participar.