Apéndice F — Índice de datasets utilizados

Descargar todos los datasets (datasets.zip)

F.1 Análisis de producto terminado de una fabricación diaria de camembert

En formato CSV y Excel

Descargar camembert.csv

Mostrar código

library(gt)
library(dplyr)

df <- read.csv2("datos/camembert.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fecha	fabricacion	est	mg	ph	cloruros	coliformes
11/01/2020	1.00	46.68	24.00	4.85	1.50	80.00
12/01/2020	1.00	48.09	25.00	4.67	1.61	0.00
13/01/2020	1.00	45.97	24.00	4.71	1.48	9,200.00
14/01/2020	1.00	46.24	23.50	4.78	1.69	20.00
15/01/2020	1.00	45.81	23.00	4.77	1.56	150.00
18/01/2020	1.00	46.00	24.00	4.67	1.56	60.00

F.2 Datos de fabricación simulados de un queso de vaca

Descargar 02-fab_queso_sim.csv

En el apéndice B, los detalles de la simulación y el código Python utilizado.

Mostrar código

df <- read.csv2("datos/02-fab_queso_sim.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fecha	entrada_kg	entrada_litros	entrada_grasa_g_l	entrada_prot_g_l	cuba_fab_litros	cuba_fab_grasa_g_l	cuba_fab_prot_g_l	stock_cierre_litros	queso_kg	queso_est_pct	queso_mg_pct
31/12/2023	4,895.00	4,752.00	45.13	36.68	NA	NA	NA	4,752.00	NA	NA	NA
01/01/2024	5,516.00	5,355.00	40.98	34.63	5,025.00	41.07	33.95	5,107.00	637.56	49.95	25.46
02/01/2024	4,938.00	4,794.00	40.88	35.16	5,029.00	39.99	33.61	4,901.00	630.34	51.68	26.12
03/01/2024	5,704.00	5,538.00	43.38	35.32	5,032.00	40.55	33.85	5,439.00	628.81	51.29	26.16
04/01/2024	5,170.00	5,019.00	41.47	35.93	5,035.00	39.90	33.78	5,458.00	656.69	49.81	25.28
05/01/2024	NA	NA	NA	NA	5,472.00	40.42	33.92	NA	705.30	52.73	26.31

F.3 Resultados de los partidos de La Liga, temporada 24-25

Descargar laliga_resultados2425.csv

Mostrar código

df <- read.csv2("datos/laliga_resultados2425.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 0
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fecha	local	visitante	goles_local	goles_visitante	resultado
15/08/2024	Ath Bilbao	Getafe	1	1	D
15/08/2024	Betis	Girona	1	1	D
16/08/2024	Celta	Alaves	2	1	H
16/08/2024	Las Palmas	Sevilla	2	2	D
17/08/2024	Osasuna	Leganes	1	1	D
17/08/2024	Valencia	Barcelona	1	2	A

F.4 Datos de temperaturas medias mensuales de la ciudad de Oviedo, años 2020 a 2024

Descargar oviedo_temperatura.csv

Proporcionados por AEMET (Agencia Estatal de Meteorología)

Mostrar código

df <- read.csv2("datos/oviedo_temperatura.csv", dec = ",")
df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fecha	temperatura
01/01/2020	9.20
01/02/2020	9.80
01/03/2020	11.40
01/04/2020	11.60
01/05/2020	14.20
01/06/2020	17.10

F.5 Datos de los pingüinos Palmer

Este dataset vieneincluido en las distribuciones de R y en la biblioteca seaborn

Ver https://allisonhorst.github.io/palmerpenguins/

Mostrar código

library(palmerpenguins)

df <- penguins
df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

species	island	bill_length_mm	bill_depth_mm	flipper_length_mm	body_mass_g	sex	year
Adelie	Torgersen	39.10	18.70	181.00	3,750.00	male	2,007.00
Adelie	Torgersen	39.50	17.40	186.00	3,800.00	female	2,007.00
Adelie	Torgersen	40.30	18.00	195.00	3,250.00	female	2,007.00
Adelie	Torgersen	NA	NA	NA	NA	NA	2,007.00
Adelie	Torgersen	36.70	19.30	193.00	3,450.00	female	2,007.00
Adelie	Torgersen	39.30	20.60	190.00	3,650.00	male	2,007.00

F.6 Datos de llenado de yogures — serie completa (cap. 17)

Descargar simulacion_envasado_yogur.csv

Dataset de 9.600 envases simulados correspondientes a un turno completo de 8 horas en una línea de llenado de yogures de 150 g. Incluye cinco períodos con diferentes patrones de variabilidad. Utilizado en el capítulo de control estadístico de procesos.

Mostrar código

df <- read.csv2("datos/simulacion_envasado_yogur.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

hora_envasado.n_envase.subgrupo.pos_subgrupo.peso_g
2024-10-01 08:00:00,1,1,1,152.89
2024-10-01 08:00:03,2,1,2,150.47
2024-10-01 08:00:06,3,1,3,153.46
2024-10-01 08:00:09,4,1,4,156.79
2024-10-01 08:00:12,5,1,5,150.11
2024-10-01 08:00:15,6,2,1,150.11

F.7 Datos de llenado de yogures — muestra por subgrupos (cap. 9)

Descargar llenado_yogures_muestra.csv

Dataset de 160 subgrupos de 5 envases, obtenidos por muestreo cada 3 minutos durante el mismo turno. Utilizado en los gráficos de control X-barra y S y en el análisis de capacidad de proceso.

Mostrar código

df <- read.csv2("datos/llenado_yogures_muestra.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

timestamp	n_envase	subgrupo	pos_subgrupo	peso_g	muestra
2024-06-15 08:00:00	1.00	1.00	1.00	152.25	1.00
2024-06-15 08:00:45	16.00	4.00	1.00	150.66	1.00
2024-06-15 08:01:30	31.00	7.00	1.00	150.60	1.00
2024-06-15 08:02:12	45.00	9.00	5.00	149.28	1.00
2024-06-15 08:02:57	60.00	12.00	5.00	152.96	1.00
2024-06-15 08:03:00	61.00	13.00	1.00	150.78	2.00

F.8 Experimento de cuajado — diseño factorial 2²

Descargar experimento_cuajo.csv

Dataset de 12 fabricaciones correspondientes a un diseño factorial 2² (temperatura × dosis de cuajo, 3 réplicas por combinación). La variable respuesta es el porcentaje de retención de materia prima en el extracto seco magro del queso. Utilizado en el capítulo de diseño de experimentos.

Mostrar código

df <- read.csv2("datos/experimento_cuajo.csv", dec = ",")

df |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 12, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fabricacion	temperatura	dosis_cuajo	retencion_pct
1.00	30.00	20.00	93.80
2.00	30.00	20.00	93.61
3.00	30.00	20.00	93.84
4.00	30.00	30.00	95.31
5.00	30.00	30.00	94.78
6.00	30.00	30.00	94.78
7.00	34.00	20.00	95.62
8.00	34.00	20.00	95.38
9.00	34.00	20.00	95.01
10.00	34.00	30.00	95.51
11.00	34.00	30.00	95.21
12.00	34.00	30.00	95.21

F.9 Estudio GRR — método Gerber (puntual)

Descargar grr_gerber.csv

Dataset de un estudio de repetibilidad y reproducibilidad del método Gerber para la determinación de materia grasa, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (45 observaciones). Utilizado en el capítulo de análisis del sistema de medición.

Mostrar código

df <- read.csv2("datos/grr_gerber.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

analista	muestra	valor_referencia	repeticion	resultado
Analista_1	A_baja	3.40	1.00	3.42
Analista_1	A_baja	3.40	2.00	3.39
Analista_1	A_baja	3.40	3.00	3.43
Analista_1	B_media	3.80	1.00	3.86
Analista_1	B_media	3.80	2.00	3.79
Analista_1	B_media	3.80	3.00	3.79

F.10 Seguimiento temporal del sistema de medición — método Gerber

Descargar grr_gerber_temporal.csv

Dataset de 12 meses de control del sistema de medición, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (540 observaciones). Incluye dos intervenciones: corrección del sesgo de Analista_4 en abril y formación de Analista_5 en junio. Utilizado en el capítulo de análisis del sistema de medición.

Mostrar código

df <- read.csv2("datos/grr_gerber_temporal.csv", dec = ",")

df |> 
  slice_head(n = 6) |> 
  gt() |>
  fmt_number(
    columns = where(is.numeric),
    decimals = 2
  ) |>
  tab_style(
    style = cell_fill(color = "#f7f7f7"),
    locations = cells_body(rows = seq(1, 6, 2))
  ) |>
  tab_options(
    table.font.size = px(14),
    data_row.padding = px(6)
  )

fecha	mes	analista	muestra	valor_referencia	repeticion	resultado
15/01/2024	1.00	Analista_1	A_baja	3.40	1.00	3.42
15/01/2024	1.00	Analista_1	A_baja	3.40	2.00	3.40
15/01/2024	1.00	Analista_1	A_baja	3.40	3.00	3.42
15/01/2024	1.00	Analista_1	A_media	4.20	1.00	4.25
15/01/2024	1.00	Analista_1	A_media	4.20	2.00	4.19
15/01/2024	1.00	Analista_1	A_media	4.20	3.00	4.19

F.11 Otros datasets no utilizados en este libro

La mejor manera de aprender R y Pyhton es… ¡practicar! Hacer graficos de otros datasets es una de las mejores formas; hay muchas fuentes que puedes explorar y concursos en los que puedes participar.