-
Notifications
You must be signed in to change notification settings - Fork 1
/
solucion-02.R
113 lines (87 loc) · 2.83 KB
/
solucion-02.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
#' zona de notas
#'
library(tidyverse)
library(haven)
library(skimr)
library(compareGroups)
library(corrr)
library(Hmisc)
# practica 02 -------------------------------------------------------------
#importar base en formato DTA
espir <- read_dta("data-raw/espirometria.dta") %>% as_factor()
#generar resumen descriptivo
espir %>% skim_to_wide() %>% writexl::write_xlsx(path = "table/skimtable.xlsx")
# variables categóricas ---------------------------------------------------
espir %>%
tabyl(sexo) %>% #<<
adorn_totals("row") %>%
adorn_pct_formatting()
espir %>%
tabyl(sexo,fumar) %>% #<<
adorn_totals(c("col")) %>%
adorn_percentages() %>%
adorn_pct_formatting() %>%
adorn_ns(position = "front") %>%
adorn_title()
# comparación de proporciones ---------------------------------------------
espir %>%
tabyl(sexo,fumar) %>%
chisq.test() %>% #<<
tidy()
# variables numericas -----------------------------------------------------
#grafica distribución
espir %>%
ggplot(aes(x = edad)) +
geom_histogram()
espir %>%
ggplot(aes(x=talla,y=vef)) + #<<
geom_point() +
geom_smooth(method = "lm")
# correlaciones -----------------------------------------------------------
espir %>%
select(edad,vef,talla) %>%
correlate() %>%
stretch() %>%
arrange(desc(r))
espir %>%
select(edad,vef,talla) %>%
as.matrix() %>%
Hmisc::rcorr() %>%
broom::tidy()
# variables numericas y categóricas --------------------------------------
espir %>%
ggplot(aes(x=fumar,y=vef)) +
geom_point(
aes(color=fumar), #<<
position = "jitter") + #<<
geom_boxplot(alpha=0) #<<
espir %>%
ggplot(aes(x=fumar,y=vef)) +
geom_violin(aes(color=fumar)) #<<
espir %>%
select(fumar,vef) %>%
group_by(fumar) %>% #<<
skim()
# comparar medias entre dos grupos ----------------------------------------
t.test(vef ~ fumar, data = espir, var.equal=FALSE) %>%
tidy()
# tabla resumen -----------------------------------------------------------
#realizar pruebas de hipótesis
#experimenta y describe qué cambios genera cada uno de los argumentos?
compareGroups(formula = fumar ~ edad + vef + sexo,
data = espir,
byrow=T,method=c(vef=2)
) %>%
createTable(show.all = F) %>%
export2xls("table/tab1.xls")
# modelos lineales --------------------------------------------------------
# relación entre modelos lineales y pruebas de hipotesis
#regresar luego de finalizado el capítulo de regresiones
# Lindeløv J. (2019)
# Common statistical tests are linear models (or: how to teach stats)
# [Github personal webpage](https://lindeloev.github.io/tests-as-linear/)
#regresar luego de finalizado el capítulo de regresiones
t.test(vef ~ fumar, data = espir,var.equal=TRUE) %>%
tidy()
lm(vef ~ 1+ fumar, data = espir) %>% tidy()
lm(vef ~ 1+ fumar, data = espir) %>% confint_tidy()