-
Notifications
You must be signed in to change notification settings - Fork 0
/
ejercicio_practico_CAK.R
138 lines (108 loc) · 4.2 KB
/
ejercicio_practico_CAK.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
#################################################
## Ejercicio practico del curso de R AEET 2022 ##
#################################################
library(here)
library(remotes)
library(ggplot2)
## cargamos el dataset
# remotes::install_github("lter/lterdatasampler") #Solo necesario para la descarga de internet
# ourdata <- lterdatasampler::and_vertebrates ## Esto se hace solo una vez, descarga de internet
# write.csv(ourdata, file = here("data/ourdata.csv"))
###########################################3
CRISTINA
#install.packages(c("here","tidyverse","patchwork","tidyverse","RColorBrewer","readxl","tidylog","summarytools","knitr"))
library(here) #refiere la ruta a la carpeta del proyecto
library(tidyverse) #incluye la librería ggplot2
library(ggplot2) #VISUALIZACIÓN DE DATOS
library(RColorBrewer) #paletas de color
library(plotly) #hacer los gráficos interactivos
library(patchwork) #combinar gráficos de ggplot
library(tidyverse)
library(readr) #leer archivos
library(readxl) #leer archivos excel
library(dplyr) #manipular datos
library(tidyr) #ordenar y trasformar datasets
library(stringr) #manipular caracteres
library(forcats) #manipular factores
library(lubridate) #manipular fechas
library("easystats")
library("effects")
library("equatiomatic")
library("parameters")
library("report")
library("visreg")
library("performance")
library("DHARMa")
library("modelbased")
library(readr)
ourdata <- read_csv("data/ourdata.csv")
View(ourdata)
ourdata$species <- as.factor(ourdata$species)
ggplot(ourdata, aes(x = length_1_mm,
y = weight_g,
color = species)) +
geom_point()
data_species2 <- ourdata %>%
subset(species != "Cascade torrent salamander")
data_species2$species <- as.factor(data_species2$species)
ggplot(data_species2, aes(x = length_1_mm,
y = weight_g,
color = species)) +
geom_point()
lm_lter1 <- glm(weight_g ~ length_1_mm + species, data=data_species2)
summary(lm_lter1)
check_model(lm_ter1)
lm_lter2 <- lm(weight_g ~ length_1_mm * species, data=data_species2)
summary(lm_lter2)
check_model(lm_lter2)
# Las asumpciones de los lm no se cumplen, vamos a trasformar los datos
# alternativas: la funcion es exponencial, podriamos transformar solo la variable predictora =length
# alternativa 2 hacer un log log (predictor y respuesta) este puede ser la mejor alternativa ya que
# hay muchos datos de biomasa cercanos a cero, asi aumentas la escala
# sugiero hacer log(y o x+1), para que no salgan valores negativos
data_species2$log2_length <- log2(data_species2$length_1_mm)
data_species2$log10_weight <- log10(data_species2$weight_g)
ourdata$species <- as.factor(ourdata$species)
ggplot(ourdata, aes(x = length_1_mm,
y = weight_g,
color = species)) +
geom_point()
######################################
## CARLOS
ourdata <- read.csv(here("data/ourdata.csv"))
# Variable especies como factor
ourdata$species <- as.factor(ourdata$species)
ggplot(ourdata, aes(x = length_1_mm,
y = weight_g,
color = species)) +
geom_point()
data_species2 <- ourdata %>%
subset(species != "Cascade torrent salamander")
data_species2$species <- as.factor(data_species2$species)
ggplot(data_species2, aes(x = length_1_mm,
y = weight_g,
color = species)) +
geom_point()
## transformo en logaritmo para linealizar la grafica
data_species_log <- data_species2
data_species_log$log_length1 <- log10(data_species_log$length_1_mm)
data_species_log$log_weight <- log10(data_species_log$weight_g)
ggplot(data_species_log, aes(x = log_length1,
y = log_weight,
color = species)) +
geom_point()
lm_log <- lm(log_weight ~ log_length1, data=data_species_log)
plot(lm_log)
lm_log_species <- lm(log_weight ~ log_length1 + species, data=data_species_log)
plot(lm_log_species)
lm_log_species_i <- lm(log_weight ~ log_length1 * species, data=data_species_log)
plot(lm_log_species_i)
<<<<<<< HEAD
ad
summary(lm_log_species_i)
=======
summary(lm_log_species_i )
>>>>>>> a0c3bc441edf146f334e32ed27aa109780d17d29
check_model(lm_log_species_i)
hist(ourdata$length_1_mm)
hist(ourdata$weight_g,1000)