Intro

In questo file, trovate i codici per svolgere le analisi (regressione lineare e un grafico) su ognuno dei dataset. Per fare in modo che tutti voi lavoriate con le stesse variabili, la variabile dipedente verrà chiamata y e quella independente x. Inoltre, tutti i dataset verranno ribattezzati data. Questo per fare sì che durante le lezioni si possa usare tutti lo stesso codice. Per la mini presentazione di fine corso, fate riferimento ai nomi “originali” delle variabili.

Per avere maggiori info sul dataset e sulle variabili che contiene, digitare nella console ?nome.dataset (e.g., ?mtcars)


ChickWeight

Effetto della dieta sulla crescita dei polli:

La variabile dipedente è weight, il predittore è la variabile Diet

# assegnare il dataset all'oggetto data
data = ChickWeight
# rinominare la variabaile dipendente in y
data$y = ChickWeight$weight
# rinominare la variabile indipedente in x
data$x = ChickWeight$Diet
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

InsectSprays

Effetto degli insetticidi sugli insetti.

La variabile dipedente è count, il predittore è la variabile spray

# assegnare il dataset all'oggetto data
data = InsectSprays
# rinominare la variabaile dipendente in y
data$y = InsectSprays$count
# rinominare la variabile indipedente in x
data$x = InsectSprays$spray
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

iris

Misure di petali di diversi tipi di fiori

La variabile dipedente è Sepal.Length, il predittore è la variabile Species

# assegnare il dataset all'oggetto data
data = iris
# rinominare la variabaile dipendente in y
data$y = iris$Sepal.Length
# rinominare la variabile indipedente in x
data$x = iris$Species
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

ToothGrowth

Crescita dei denti nelle cavie in base a diversi livelli di vitamina C

La variabile dipedente è len, il predittore è la variabile dose

# assegnare il dataset all'oggetto data
data = ToothGrowth
# rinominare la variabaile dipendente in y
data$y = ToothGrowth$len
# rinominare la variabile indipedente in x
data$x = ToothGrowth$supp
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

PlantGrowth

Crescita delle piante in base a tre condizioni sperimentali (una di controllo, due sperimentali)

La variabile dipedente è weight, il predittore è la variabile group

# assegnare il dataset all'oggetto data
data = PlantGrowth
# rinominare la variabaile dipendente in y
data$y = PlantGrowth$weight
# rinominare la variabile indipedente in x
data$x = PlantGrowth$group
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

mtcars

Consumo di carbuarnte di diverse automobili

La variabile dipedente è mpg, il predittore è la variabile cyl

# assegnare il dataset all'oggetto data
data = mtcars
# rinominare la variabaile dipendente in y
data$y = mtcars$mpg
# rinominare la variabile indipedente in x
data$x = mtcars$cyl
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

Orange

Crescita degli alberi di arance

La variabile dipedente è circumference, il predittore è la variabile Tree

# assegnare il dataset all'oggetto data
data = Orange
# rinominare la variabaile dipendente in y
data$y = Orange$circumference
# rinominare la variabile indipedente in x
data$x = Orange$Tree
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

OrchardSprays

Efficacia di un insetticida per repellere gli insetti

La variabile dipedente è decrease, il predittore è la variabile treatment

# assegnare il dataset all'oggetto data
data = OrchardSprays
# rinominare la variabaile dipendente in y
data$y = OrchardSprays$decrease
# rinominare la variabile indipedente in x
data$x = OrchardSprays$treatment
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

airquality

Qualità dell’aria a New York nel 1973

La variabile dipedente è Ozone, il predittore è la variabile Month

# assegnare il dataset all'oggetto data
data = airquality
# rinominare la variabaile dipendente in y
data$y = airquality$Wind
# rinominare la variabile indipedente in x
data$x = as.factor(airquality$Month)
# maggiori dettagli sulla x
table(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

pressure

Relazione tra temperatura e pressione del mercurio.

⚠️ La variabile x è numerica (ma niente panico)

La variabile dipedente è temperature, il predittore è la variabile pressure

# assegnare il dataset all'oggetto data
data = pressure
# rinominare la variabaile dipendente in y
data$y = pressure$temperature
# rinominare la variabile indipedente in x
data$x = pressure$pressure
# maggiori dettagli sulla x
summary(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

quakes

Terremoti vicino alle isole Fijii

⚠️ La variabile x è numerica (ma niente panico)

La variabile dipedente è mag, il predittore è la variabile depth

# assegnare il dataset all'oggetto data
data = quakes
# rinominare la variabaile dipendente in y
data$y = quakes$mag
# rinominare la variabile indipedente in x
data$x = quakes$depth
# maggiori dettagli sulla x
summary(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)

rock

Misure di diverse rocce

⚠️ La variabile x è numerica (ma niente panico)

La variabile dipedente è stations, il predittore è la variabile lat

# assegnare il dataset all'oggetto data
data = rock
# rinominare la variabaile dipendente in y
data$y = rock$perm
# rinominare la variabile indipedente in x
data$x = rock$area
# maggiori dettagli sulla x
summary(data$x)

# grafico 
plot(data$y ~ data$x)

# regressione
m = lm(y ~ x, data = data)
# summary del modello
summary(m)