Descargar todos los datasets (datasets.zip)
Análisis de producto terminado de una fabricación diaria de camembert
En formato CSV y Excel
Descargar camembert.csv
Mostrar código
library (gt)
library (dplyr)
df <- read.csv2 ("datos/camembert.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
11/01/2020
1.00
46.68
24.00
4.85
1.50
80.00
12/01/2020
1.00
48.09
25.00
4.67
1.61
0.00
13/01/2020
1.00
45.97
24.00
4.71
1.48
9,200.00
14/01/2020
1.00
46.24
23.50
4.78
1.69
20.00
15/01/2020
1.00
45.81
23.00
4.77
1.56
150.00
18/01/2020
1.00
46.00
24.00
4.67
1.56
60.00
Datos de fabricación simulados de un queso de vaca
Descargar 02-fab_queso_sim.csv
En el apéndice B, los detalles de la simulación y el código Python utilizado.
Mostrar código
df <- read.csv2 ("datos/02-fab_queso_sim.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
31/12/2023
4,895.00
4,752.00
45.13
36.68
NA
NA
NA
4,752.00
NA
NA
NA
01/01/2024
5,516.00
5,355.00
40.98
34.63
5,025.00
41.07
33.95
5,107.00
637.56
49.95
25.46
02/01/2024
4,938.00
4,794.00
40.88
35.16
5,029.00
39.99
33.61
4,901.00
630.34
51.68
26.12
03/01/2024
5,704.00
5,538.00
43.38
35.32
5,032.00
40.55
33.85
5,439.00
628.81
51.29
26.16
04/01/2024
5,170.00
5,019.00
41.47
35.93
5,035.00
39.90
33.78
5,458.00
656.69
49.81
25.28
05/01/2024
NA
NA
NA
NA
5,472.00
40.42
33.92
NA
705.30
52.73
26.31
Resultados de los partidos de La Liga, temporada 24-25
Descargar laliga_resultados2425.csv
Mostrar código
df <- read.csv2 ("datos/laliga_resultados2425.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 0
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
15/08/2024
Ath Bilbao
Getafe
1
1
D
15/08/2024
Betis
Girona
1
1
D
16/08/2024
Celta
Alaves
2
1
H
16/08/2024
Las Palmas
Sevilla
2
2
D
17/08/2024
Osasuna
Leganes
1
1
D
17/08/2024
Valencia
Barcelona
1
2
A
Datos de los pingüinos Palmer
Este dataset vieneincluido en las distribuciones de R y en la biblioteca seaborn
Ver https://allisonhorst.github.io/palmerpenguins/
Mostrar código
library (palmerpenguins)
df <- penguins
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
Adelie
Torgersen
39.10
18.70
181.00
3,750.00
male
2,007.00
Adelie
Torgersen
39.50
17.40
186.00
3,800.00
female
2,007.00
Adelie
Torgersen
40.30
18.00
195.00
3,250.00
female
2,007.00
Adelie
Torgersen
NA
NA
NA
NA
NA
2,007.00
Adelie
Torgersen
36.70
19.30
193.00
3,450.00
female
2,007.00
Adelie
Torgersen
39.30
20.60
190.00
3,650.00
male
2,007.00
Datos de llenado de yogures — serie completa (cap. 17)
Descargar simulacion_envasado_yogur.csv
Dataset de 9.600 envases simulados correspondientes a un turno completo de 8 horas en una línea de llenado de yogures de 150 g. Incluye cinco períodos con diferentes patrones de variabilidad. Utilizado en el capítulo de control estadístico de procesos.
Mostrar código
df <- read.csv2 ("datos/simulacion_envasado_yogur.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
2024-10-01 08:00:00,1,1,1,152.89
2024-10-01 08:00:03,2,1,2,150.47
2024-10-01 08:00:06,3,1,3,153.46
2024-10-01 08:00:09,4,1,4,156.79
2024-10-01 08:00:12,5,1,5,150.11
2024-10-01 08:00:15,6,2,1,150.11
Datos de llenado de yogures — muestra por subgrupos (cap. 9)
Descargar llenado_yogures_muestra.csv
Dataset de 160 subgrupos de 5 envases, obtenidos por muestreo cada 3 minutos durante el mismo turno. Utilizado en los gráficos de control X-barra y S y en el análisis de capacidad de proceso.
Mostrar código
df <- read.csv2 ("datos/llenado_yogures_muestra.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
2024-06-15 08:00:00
1.00
1.00
1.00
152.25
1.00
2024-06-15 08:00:45
16.00
4.00
1.00
150.66
1.00
2024-06-15 08:01:30
31.00
7.00
1.00
150.60
1.00
2024-06-15 08:02:12
45.00
9.00
5.00
149.28
1.00
2024-06-15 08:02:57
60.00
12.00
5.00
152.96
1.00
2024-06-15 08:03:00
61.00
13.00
1.00
150.78
2.00
Experimento de cuajado — diseño factorial 2²
Descargar experimento_cuajo.csv
Dataset de 12 fabricaciones correspondientes a un diseño factorial 2² (temperatura × dosis de cuajo, 3 réplicas por combinación). La variable respuesta es el porcentaje de retención de materia prima en el extracto seco magro del queso. Utilizado en el capítulo de diseño de experimentos.
Mostrar código
df <- read.csv2 ("datos/experimento_cuajo.csv" , dec = "," )
df |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 12 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
1.00
30.00
20.00
93.80
2.00
30.00
20.00
93.61
3.00
30.00
20.00
93.84
4.00
30.00
30.00
95.31
5.00
30.00
30.00
94.78
6.00
30.00
30.00
94.78
7.00
34.00
20.00
95.62
8.00
34.00
20.00
95.38
9.00
34.00
20.00
95.01
10.00
34.00
30.00
95.51
11.00
34.00
30.00
95.21
12.00
34.00
30.00
95.21
Estudio GRR — método Gerber (puntual)
Descargar grr_gerber.csv
Dataset de un estudio de repetibilidad y reproducibilidad del método Gerber para la determinación de materia grasa, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (45 observaciones). Utilizado en el capítulo de análisis del sistema de medición.
Mostrar código
df <- read.csv2 ("datos/grr_gerber.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
Analista_1
A_baja
3.40
1.00
3.42
Analista_1
A_baja
3.40
2.00
3.39
Analista_1
A_baja
3.40
3.00
3.43
Analista_1
B_media
3.80
1.00
3.86
Analista_1
B_media
3.80
2.00
3.79
Analista_1
B_media
3.80
3.00
3.79
Seguimiento temporal del sistema de medición — método Gerber
Descargar grr_gerber_temporal.csv
Dataset de 12 meses de control del sistema de medición, con 5 analistas, 3 muestras de referencia y 3 repeticiones por combinación (540 observaciones). Incluye dos intervenciones: corrección del sesgo de Analista_4 en abril y formación de Analista_5 en junio. Utilizado en el capítulo de análisis del sistema de medición.
Mostrar código
df <- read.csv2 ("datos/grr_gerber_temporal.csv" , dec = "," )
df |>
slice_head (n = 6 ) |>
gt () |>
fmt_number (
columns = where (is.numeric),
decimals = 2
) |>
tab_style (
style = cell_fill (color = "#f7f7f7" ),
locations = cells_body (rows = seq (1 , 6 , 2 ))
) |>
tab_options (
table.font.size = px (14 ),
data_row.padding = px (6 )
)
15/01/2024
1.00
Analista_1
A_baja
3.40
1.00
3.42
15/01/2024
1.00
Analista_1
A_baja
3.40
2.00
3.40
15/01/2024
1.00
Analista_1
A_baja
3.40
3.00
3.42
15/01/2024
1.00
Analista_1
A_media
4.20
1.00
4.25
15/01/2024
1.00
Analista_1
A_media
4.20
2.00
4.19
15/01/2024
1.00
Analista_1
A_media
4.20
3.00
4.19
Otros datasets no utilizados en este libro
La mejor manera de aprender R y Pyhton es… ¡practicar! Hacer graficos de otros datasets es una de las mejores formas; hay muchas fuentes que puedes explorar y concursos en los que puedes participar.