Modulo 7a: Confirmatory Factor Analysis - CFA
1 La soluzione migliore trovata con EFA:
con \(n = 498\)
2 CFA
Permette di testare delle ipotesi specificando a priori un modello dove vengono esplicitate:
- Le relazioni indicatore – fattore latente
- I rapporti tra i fattori latenti
Ogni indicatore è la realizzazione di un singolo e specifico fattore latente
Ogni indicatore satura su una specifica dimensione latente definita a priori sulla base di un modello teorico
\[\mathbf{Y}_p = \mathbf{\mu} + \mathbf{\Lambda} \mathbf{\theta}_p + \varepsilon_p\] con
\(\mathbf{Y}_p \in \mathbb{R}^{I \times 1}\): Vettore delle risposte a tutti gli \(I\) indicatori della persona \(p\)
\(\boldsymbol{\mu} \in \mathbb{R}^{I \times 1}\): Vettore dei valori medi attesi di tutti gli \(I\) indicatori
\(\mathbf{\Lambda} \in \mathbb{R}^{I \times F}\): Matrice \(I \times F\) delle saturazioni degli \(I\) item sulle \(F\) dimensioni latenti
\(\boldsymbol{\theta}_p \in \mathbb{R}^{F \times 1}\): Vettore dei factors scores – ovvero dei livelli latenti attesi – sulle \(F\) dimensioni latenti per la persona \(p\)
\(\boldsymbol{\varepsilon}_p \in \mathbb{R}^{I \times 1}\): vettore degli errori/residui associati agli indicatori della persona p
3 Analisi delle strutture di covarianza Joreskog (1969)
Matrice di covarianza osservata
\[S\]
Matrice di covarianza attesa sulla base del modello teorico
\[\Sigma(\zeta)\]
con \(\zeta\) che contiene tutti i parametri del modello (saturazioni, varianze, covarianze, errori specifici)
Stimare i parametri a partire dalla matrice di covarianza osservata in modo che:
\[S \approx \Sigma(\zeta)\]
4 Statistiche di fit per modelli CFA
4.1 \(\chi^2\)
\(H_0\): \(S = \Sigma(\zeta)\)
\(df = \dfrac{I(I+1)}{2} - t\), dove \(I\) è il numero di indicatori e \(t\) il numero di parameteri liberi che si va a stimare nel modello contenuti in \(\zeta\)
Se \(I = 4\), la matrice di covariana è:
\[ S = \begin{pmatrix} \mathbf{s_{11}} & \color{pink}{s_{12}} & \color{pink}{s_{13}} & \color{pink}{s_{14}} \\ \color{blue}{s_{21}} & \mathbf{s_{22}} & \color{pink}{s_{23}} & \color{pink}{s_{24}} \\ \color{blue}{s_{31}} & \color{blue}{s_{32}} & \mathbf{s_{33}} & \color{pink}{s_{34}} \\ \color{blue}{s_{41}} & \color{blue}{s_{42}} & \color{blue}{s_{43}} & \mathbf{s_{44}} \end{pmatrix} \]
Ci sono \(\dfrac{I(I+1)}{2} = \dfrac{4(4+1)}{2} = 10\) elementi unici:
- 4 varianze nella diagonale principale (in grassetto)
- 6 covarianze o nel triangolo inferiore (in blu) O nel triangolo superiore (in rosa)
Dati questi dati, posso stimare AL MASSIMO 9 parametri
4.1.1 La logica dei \(df\)
Il modello è testabile perché c’è più informazione nei dati di quanto richiesto dal modello
La matrice di covarianza \(S\) non può essere riprodotta perfettamente da \(\Sigma(\zeta)\): Il modello è falsificabile
Situazione al limite dove il numero di parametri è uguale ai dati empirici.
La matrice di covarianza \(S\) può perfettamente essere riprotta da \(\Sigma(\zeta)\)
Il modello non è falsificabile
Ci sono più parametri che informazione disponibile
Diversi set di parametri possono essere usati per \(\Sigma(\zeta)\) (sistema indeterminato, non esiste una soluzione unica)
4.2 Root mean square error of approximation (RMSEA)
Indice di fit assoluto basato sul \(\chi^2\):
\(RMSEA = \dfrac{\chi^2 -df}{df(n-1)}\)
\(E(\chi^2) = df\) \(\rightarrow\) più è piccolo il valore di RMSEA, minore è l’errore, migliore è il modello
\(RMSEA < .10\) fit accettabile
\(RMSEA < .05\) fit ottima
4.3 Comparative Fit Index (CFI)
Confronta la performance del modello target (\(T\)) e di un modello baseline (\(B\)) in cui tutte le covarianze sono fissate a 0 (non c’è correlazione tra le variabili manifeste) e le varianze sono stimate liberamente a partire dai dati:
\[CFI = \dfrac{(\chi_B^2 - df_B) - (\chi_T^2 - df_T)}{(\chi_B^2 - df_B)}\]
Se il modello \(T\) è correttamente specificato: \((\chi_T^2 - df_T) \approx 0 \rightarrow CFI \approx 1\)
\(CFI \geq .90\) Valori accettabili
\(CFI \geq .95\) Valori ottimali
4.4 Tucker-Lewis Index
Stesso identico principio del CFI ma basato su \(\chi_{N}^2 = \chi^2/df\) (\(\chi_{N}^2 \to 1\) quando \(\chi^2 = df\)):
\[TLI = \dfrac{(\chi_B^2/df_B) - (\chi_T^2/df_T)}{\chi_B^2/df_B -1}\]
\(CFI \geq .90\) Valori accettabili
\(CFI \geq .95\) Valori ottimali
5 Scalare e contare i parametri
5.1 Contare i parametri
Parametri stimati:
\[\mathbf{\Phi} = \operatorname{Var}(\boldsymbol{\theta}_p) \in \mathbb{R}^{F \times F}\]
Matrice delle varianze e covarianze delle \(F\) variabili latenti
Se il modello prevede \(F\) fattori ortogonali, allora
\[\phi_{ij} = 0 \qquad \forall i \neq j\]
e quindi \(\mathbf{\Phi}\) è una matrice diagonale.
\[\mathbf{\Lambda} \in \mathbb{R}^{I \times F}\] e
\[\boldsymbol{\varepsilon}_p = \begin{pmatrix} \varepsilon_{1p} \\ \varepsilon_{2p} \\ \vdots \\ \varepsilon_{Ip} \end{pmatrix}\]
Quella che poi viene stimata è la varianza \(Var(\varepsilon_i)\)
5.2 Scalare i parametri
Rimane il problema di fissare la scala per l’interpretazione delle saturazioni sulla variabile latente:
- Metodo Indicatore-Variabile Latente
- Metodo della standardizzazione della variabile latente
Sono matematicamente equivalenti e si può passare da una all’altra senza problemi!
Non cambia la fit del modello, non cambia il numero di parametri stimati in \(\zeta\) (ma cambiano i parametri che vengono stimati), cambia la scala e l’interpretazione delle saturazioni (e delle covarianze)
\[\zeta = \{\Lambda, \boldsymbol{Var(\varepsilon_i)}, \Phi\}\]
5.2.1 Metodo Indicatore-Variabile Latente
Per stimare la varianza della variabile latente e le saturazioni degli item per quella variabile latente, si fissa una saturazione (solitamente quella del primo item):
\[\lambda_{1} = 1\]
La variabile latente \(\theta\) assume la scala del primo item
La varianza \(Var(\theta)\) viene stimata liberamente (e influenza l’interpretazione delle saturazioni)
\[\zeta = \{\Lambda, \boldsymbol{Var(\varepsilon_i)}, \Phi\}\]
- Saturazioni: \(I - F\)
- Varianze residue per ogni indicatore: \(I\)
- Per le variabili latenti: \(\dfrac{F (F+1)}{2}\) (una varianza per ogni \(\theta\) e le covarianze)
\[|\zeta| = I + (I-F) + \dfrac{F (F+1)}{2}\]
5.2.2 Metodo della standardizzazione della variabile latente
Per stimare le saturazioni degli indicatori su una variabile latente, viene fissata la varianza della variabile latente:
\[Var(\theta) = 1\] Vengono stimati tutti i \(\lambda_i\) relativi a quella variabile latente
I \(\lambda_i\) si possono interpretare come venivano interpretati in EFA (ovvero come correlazioni variabile latente-indicatore)
Al posto delle covarianze tra fattori: correlazioni
\[\zeta = \{\Lambda, \boldsymbol{Var(\varepsilon_i)}, \Phi\}\]
- Saturazioni: \(I\)
- Varianze residue per ogni indicatore: \(I\)
- Per le variabili latenti: \(\dfrac{F (F-1)}{2}\) (covarianze tra i \(\theta\))
\[|\zeta| = 2I + \dfrac{F (F-1)}{2}\]
6 Big Five
Sto usando solo gli item di due scale per rendere l’esposizione più chiara
6.1 Indicatore-LV
6.1.1 Stima e conteggio dei parametri
id lhs op rhs user block group free ustart exo label plabel start est
1 1 N =~ N1 1 1 1 0 1 0 .p1. 1.000 1.000
2 2 N =~ N2 1 1 1 1 NA 0 .p2. 0.575 0.643
3 3 N =~ N3 1 1 1 2 NA 0 .p3. 0.710 0.749
4 4 N =~ N4 1 1 1 3 NA 0 .p4. 0.403 0.436
5 5 N =~ N5 1 1 1 4 NA 0 .p5. 0.645 0.751
6 6 N =~ N6 1 1 1 5 NA 0 .p6. 0.880 1.061
7 7 N =~ N7 1 1 1 6 NA 0 .p7. 0.803 1.085
8 8 N =~ N8 1 1 1 7 NA 0 .p8. 0.860 1.167
9 9 N =~ N9 1 1 1 8 NA 0 .p9. 0.770 0.900
10 10 N =~ N10 1 1 1 9 NA 0 .p10. 0.775 0.979
11 11 C =~ C1 1 1 1 0 1 0 .p11. 1.000 1.000
12 12 C =~ C2 1 1 1 10 NA 0 .p12. 1.156 1.434
13 13 C =~ C3 1 1 1 11 NA 0 .p13. 0.707 0.673
14 14 C =~ C4 1 1 1 12 NA 0 .p14. 1.143 1.396
15 15 C =~ C5 1 1 1 13 NA 0 .p15. 1.143 1.322
16 16 C =~ C6 1 1 1 14 NA 0 .p16. 1.346 1.621
17 17 C =~ C7 1 1 1 15 NA 0 .p17. 0.995 1.013
18 18 C =~ C8 1 1 1 16 NA 0 .p18. 0.895 0.948
19 19 C =~ C9 1 1 1 17 NA 0 .p19. 1.164 1.251
20 20 C =~ C10 1 1 1 18 NA 0 .p20. 0.818 0.748
21 21 N1 ~~ N1 0 1 1 19 NA 0 .p21. 0.882 0.917
22 22 N2 ~~ N2 0 1 1 20 NA 0 .p22. 0.685 1.020
23 23 N3 ~~ N3 0 1 1 21 NA 0 .p23. 0.685 0.896
24 24 N4 ~~ N4 0 1 1 22 NA 0 .p24. 0.738 1.314
25 25 N5 ~~ N5 0 1 1 23 NA 0 .p25. 0.859 1.241
26 26 N6 ~~ N6 0 1 1 24 NA 0 .p26. 0.866 0.778
27 27 N7 ~~ N7 0 1 1 25 NA 0 .p27. 0.895 0.794
28 28 N8 ~~ N8 0 1 1 26 NA 0 .p28. 0.919 0.685
29 29 N9 ~~ N9 0 1 1 27 NA 0 .p29. 0.801 0.916
30 30 N10 ~~ N10 0 1 1 28 NA 0 .p30. 0.903 0.995
31 31 C1 ~~ C1 0 1 1 29 NA 0 .p31. 0.574 0.815
32 32 C2 ~~ C2 0 1 1 30 NA 0 .p32. 0.970 1.253
33 33 C3 ~~ C3 0 1 1 31 NA 0 .p33. 0.469 0.787
34 34 C4 ~~ C4 0 1 1 32 NA 0 .p34. 0.788 0.925
35 35 C5 ~~ C5 0 1 1 33 NA 0 .p35. 0.796 1.010
36 36 C6 ~~ C6 0 1 1 34 NA 0 .p36. 0.975 1.075
37 37 C7 ~~ C7 0 1 1 35 NA 0 .p37. 0.610 0.877
38 38 C8 ~~ C8 0 1 1 36 NA 0 .p38. 0.629 0.958
39 39 C9 ~~ C9 0 1 1 37 NA 0 .p39. 0.765 1.008
40 40 C10 ~~ C10 0 1 1 38 NA 0 .p40. 0.526 0.865
41 41 N ~~ N 0 1 1 39 NA 0 .p41. 0.050 0.846
42 42 C ~~ C 0 1 1 40 NA 0 .p42. 0.050 0.334
43 43 N ~~ C 0 1 1 41 NA 0 .p43. 0.000 -0.189
se
1 0.000
2 0.062
3 0.062
4 0.063
5 0.069
6 0.071
7 0.072
8 0.073
9 0.067
10 0.072
11 0.000
12 0.149
13 0.093
14 0.138
15 0.136
16 0.157
17 0.113
18 0.112
19 0.131
20 0.099
21 0.066
22 0.068
23 0.061
24 0.085
25 0.083
26 0.058
27 0.060
28 0.055
29 0.064
30 0.070
31 0.056
32 0.090
33 0.052
34 0.069
35 0.073
36 0.082
37 0.061
38 0.065
39 0.072
40 0.057
41 0.100
42 0.056
43 0.034
| Simbolo | Significato |
|---|---|
=~ |
Factor loading (saturazione \(\lambda_i\)) |
~~ |
Varianza/covarianza |
user = 1 |
Parametro stimato stabilito dall’utente |
user = 0 |
Parametro stimato NON stabilito dall’utente |
ustart = 1 |
Constraint sulla stima dei parametri - Non vengono stimati, vengono stabiliti a priori per settare la metrica |
free = 0 |
Parametri che non vengono stimati |
free != 0 |
Parametri che vengono stimati |
start |
Valore iniziale del parametro usato come punto di partenza della stima |
est |
Stima ottenuta attraverso gli algoritmi di ottimizzazione |
Andando sull’ultima riga, in corrispondenza della colonna free si vede che vengono stimati 41 parametri liberi (|\(\zeta\)|):
- \(I = 20\), quindi \(\Lambda = I - F = 18\)
- \(I = 20\), quindi \(Var(\varepsilon_i) = 20\)
- \(\theta = 2\), quindi \(\dfrac{F (F+1)}{2} = \dfrac{2(2+1)}{2} = 3\) (le due varianze e la covarianza)
\[|\zeta| = 18 + 20 + 3 = 41\]
6.1.2 Fit del modello
lavaan 0.6-19 ended normally after 35 iterations
Estimator ML
Optimization method NLMINB
Number of model parameters 41
Number of observations 498
Model Test User Model:
Test statistic 807.330
Degrees of freedom 169
P-value (Chi-square) 0.000
Model Test Baseline Model:
Test statistic 3537.787
Degrees of freedom 190
P-value 0.000
User Model versus Baseline Model:
Comparative Fit Index (CFI) 0.809
Tucker-Lewis Index (TLI) 0.786
Loglikelihood and Information Criteria:
Loglikelihood user model (H0) -14799.096
Loglikelihood unrestricted model (H1) -14395.431
Akaike (AIC) 29680.192
Bayesian (BIC) 29852.827
Sample-size adjusted Bayesian (SABIC) 29722.691
Root Mean Square Error of Approximation:
RMSEA 0.087
90 Percent confidence interval - lower 0.081
90 Percent confidence interval - upper 0.093
P-value H_0: RMSEA <= 0.050 0.000
P-value H_0: RMSEA >= 0.080 0.974
Standardized Root Mean Square Residual:
SRMR 0.075
Parameter Estimates:
Standard errors Standard
Information Expected
Information saturated (h1) model Structured
Latent Variables:
Estimate Std.Err z-value P(>|z|)
N =~
N1 1.000
N2 0.643 0.062 10.452 0.000
N3 0.749 0.062 12.082 0.000
N4 0.436 0.063 6.901 0.000
N5 0.751 0.069 10.882 0.000
N6 1.061 0.071 14.993 0.000
N7 1.085 0.072 15.067 0.000
N8 1.167 0.073 15.886 0.000
N9 0.900 0.067 13.353 0.000
N10 0.979 0.072 13.656 0.000
C =~
C1 1.000
C2 1.434 0.149 9.627 0.000
C3 0.673 0.093 7.266 0.000
C4 1.396 0.138 10.088 0.000
C5 1.322 0.136 9.732 0.000
C6 1.621 0.157 10.333 0.000
C7 1.013 0.113 8.925 0.000
C8 0.948 0.112 8.425 0.000
C9 1.251 0.131 9.519 0.000
C10 0.748 0.099 7.544 0.000
Covariances:
Estimate Std.Err z-value P(>|z|)
N ~~
C -0.189 0.034 -5.634 0.000
Variances:
Estimate Std.Err z-value P(>|z|)
.N1 0.917 0.066 13.974 0.000
.N2 1.020 0.068 15.112 0.000
.N3 0.896 0.061 14.749 0.000
.N4 1.314 0.085 15.542 0.000
.N5 1.241 0.083 15.031 0.000
.N6 0.778 0.058 13.379 0.000
.N7 0.794 0.060 13.319 0.000
.N8 0.685 0.055 12.477 0.000
.N9 0.916 0.064 14.319 0.000
.N10 0.995 0.070 14.187 0.000
.C1 0.815 0.056 14.428 0.000
.C2 1.253 0.090 13.971 0.000
.C3 0.787 0.052 15.147 0.000
.C4 0.925 0.069 13.452 0.000
.C5 1.010 0.073 13.868 0.000
.C6 1.075 0.082 13.077 0.000
.C7 0.877 0.061 14.492 0.000
.C8 0.958 0.065 14.749 0.000
.C9 1.008 0.072 14.067 0.000
.C10 0.865 0.057 15.070 0.000
N 0.846 0.100 8.447 0.000
C 0.334 0.056 5.942 0.000
6.2 Standardizzazione-LV
6.2.1 Stima e conteggio dei parametri
id lhs op rhs user block group free ustart exo label plabel start est
1 1 N =~ N1 1 1 1 1 NA 0 .p1. 1.092 0.920
2 2 N =~ N2 1 1 1 2 NA 0 .p2. 0.628 0.592
3 3 N =~ N3 1 1 1 3 NA 0 .p3. 0.775 0.689
4 4 N =~ N4 1 1 1 4 NA 0 .p4. 0.440 0.401
5 5 N =~ N5 1 1 1 5 NA 0 .p5. 0.704 0.691
6 6 N =~ N6 1 1 1 6 NA 0 .p6. 0.961 0.976
7 7 N =~ N7 1 1 1 7 NA 0 .p7. 0.876 0.998
8 8 N =~ N8 1 1 1 8 NA 0 .p8. 0.939 1.073
9 9 N =~ N9 1 1 1 9 NA 0 .p9. 0.841 0.828
10 10 N =~ N10 1 1 1 10 NA 0 .p10. 0.846 0.901
11 11 C =~ C1 1 1 1 11 NA 0 .p11. 0.642 0.578
12 12 C =~ C2 1 1 1 12 NA 0 .p12. 0.743 0.828
13 13 C =~ C3 1 1 1 13 NA 0 .p13. 0.454 0.389
14 14 C =~ C4 1 1 1 14 NA 0 .p14. 0.734 0.807
15 15 C =~ C5 1 1 1 15 NA 0 .p15. 0.734 0.764
16 16 C =~ C6 1 1 1 16 NA 0 .p16. 0.865 0.936
17 17 C =~ C7 1 1 1 17 NA 0 .p17. 0.639 0.585
18 18 C =~ C8 1 1 1 18 NA 0 .p18. 0.575 0.547
19 19 C =~ C9 1 1 1 19 NA 0 .p19. 0.748 0.723
20 20 C =~ C10 1 1 1 20 NA 0 .p20. 0.525 0.432
21 21 N1 ~~ N1 0 1 1 21 NA 0 .p21. 0.882 0.917
22 22 N2 ~~ N2 0 1 1 22 NA 0 .p22. 0.685 1.020
23 23 N3 ~~ N3 0 1 1 23 NA 0 .p23. 0.685 0.896
24 24 N4 ~~ N4 0 1 1 24 NA 0 .p24. 0.738 1.314
25 25 N5 ~~ N5 0 1 1 25 NA 0 .p25. 0.859 1.241
26 26 N6 ~~ N6 0 1 1 26 NA 0 .p26. 0.866 0.778
27 27 N7 ~~ N7 0 1 1 27 NA 0 .p27. 0.895 0.794
28 28 N8 ~~ N8 0 1 1 28 NA 0 .p28. 0.919 0.685
29 29 N9 ~~ N9 0 1 1 29 NA 0 .p29. 0.801 0.916
30 30 N10 ~~ N10 0 1 1 30 NA 0 .p30. 0.903 0.995
31 31 C1 ~~ C1 0 1 1 31 NA 0 .p31. 0.574 0.815
32 32 C2 ~~ C2 0 1 1 32 NA 0 .p32. 0.970 1.253
33 33 C3 ~~ C3 0 1 1 33 NA 0 .p33. 0.469 0.787
34 34 C4 ~~ C4 0 1 1 34 NA 0 .p34. 0.788 0.925
35 35 C5 ~~ C5 0 1 1 35 NA 0 .p35. 0.796 1.010
36 36 C6 ~~ C6 0 1 1 36 NA 0 .p36. 0.975 1.075
37 37 C7 ~~ C7 0 1 1 37 NA 0 .p37. 0.610 0.877
38 38 C8 ~~ C8 0 1 1 38 NA 0 .p38. 0.629 0.958
39 39 C9 ~~ C9 0 1 1 39 NA 0 .p39. 0.765 1.008
40 40 C10 ~~ C10 0 1 1 40 NA 0 .p40. 0.526 0.865
41 41 N ~~ N 0 1 1 0 1 0 .p41. 1.000 1.000
42 42 C ~~ C 0 1 1 0 1 0 .p42. 1.000 1.000
43 43 N ~~ C 0 1 1 41 NA 0 .p43. 0.000 -0.356
se
1 0.054
2 0.052
3 0.050
4 0.056
5 0.057
6 0.053
7 0.053
8 0.053
9 0.053
10 0.056
11 0.049
12 0.062
13 0.046
14 0.055
15 0.056
16 0.060
17 0.050
18 0.052
19 0.055
20 0.048
21 0.066
22 0.068
23 0.061
24 0.085
25 0.083
26 0.058
27 0.060
28 0.055
29 0.064
30 0.070
31 0.056
32 0.090
33 0.052
34 0.069
35 0.073
36 0.082
37 0.061
38 0.065
39 0.072
40 0.057
41 0.000
42 0.000
43 0.047
Anche in questo caso, in corrispondenza della colonna free nell’ultima riga si vede che vengono stimati 41 parametri liberi (|\(\zeta\)|):
- \(I = 20\), quindi \(\Lambda = 20\)
- \(I = 20\), quindi \(\varepsilon_p = 20\)
- \(F = 2\), quindi \(\dfrac{F (F-1)}{2} = \dfrac{2 (2-1)}{2} = 1\) (solo la covarianza tra N e C)
\[|\zeta| = 20 + 20 + 1 = 41\]
6.2.2 Fit del modello
lavaan 0.6-19 ended normally after 16 iterations
Estimator ML
Optimization method NLMINB
Number of model parameters 41
Number of observations 498
Model Test User Model:
Test statistic 807.330
Degrees of freedom 169
P-value (Chi-square) 0.000
Model Test Baseline Model:
Test statistic 3537.787
Degrees of freedom 190
P-value 0.000
User Model versus Baseline Model:
Comparative Fit Index (CFI) 0.809
Tucker-Lewis Index (TLI) 0.786
Loglikelihood and Information Criteria:
Loglikelihood user model (H0) -14799.096
Loglikelihood unrestricted model (H1) -14395.431
Akaike (AIC) 29680.192
Bayesian (BIC) 29852.827
Sample-size adjusted Bayesian (SABIC) 29722.691
Root Mean Square Error of Approximation:
RMSEA 0.087
90 Percent confidence interval - lower 0.081
90 Percent confidence interval - upper 0.093
P-value H_0: RMSEA <= 0.050 0.000
P-value H_0: RMSEA >= 0.080 0.974
Standardized Root Mean Square Residual:
SRMR 0.075
Parameter Estimates:
Standard errors Standard
Information Expected
Information saturated (h1) model Structured
Latent Variables:
Estimate Std.Err z-value P(>|z|)
N =~
N1 0.920 0.054 16.895 0.000
N2 0.592 0.052 11.454 0.000
N3 0.689 0.050 13.714 0.000
N4 0.401 0.056 7.167 0.000
N5 0.691 0.057 12.027 0.000
N6 0.976 0.053 18.549 0.000
N7 0.998 0.053 18.692 0.000
N8 1.073 0.053 20.367 0.000
N9 0.828 0.053 15.669 0.000
N10 0.901 0.056 16.168 0.000
C =~
C1 0.578 0.049 11.884 0.000
C2 0.828 0.062 13.364 0.000
C3 0.389 0.046 8.522 0.000
C4 0.807 0.055 14.704 0.000
C5 0.764 0.056 13.653 0.000
C6 0.936 0.060 15.514 0.000
C7 0.585 0.050 11.646 0.000
C8 0.547 0.052 10.593 0.000
C9 0.723 0.055 13.079 0.000
C10 0.432 0.048 8.980 0.000
Covariances:
Estimate Std.Err z-value P(>|z|)
N ~~
C -0.356 0.047 -7.606 0.000
Variances:
Estimate Std.Err z-value P(>|z|)
.N1 0.917 0.066 13.974 0.000
.N2 1.020 0.068 15.112 0.000
.N3 0.896 0.061 14.749 0.000
.N4 1.314 0.085 15.542 0.000
.N5 1.241 0.083 15.031 0.000
.N6 0.778 0.058 13.379 0.000
.N7 0.794 0.060 13.319 0.000
.N8 0.685 0.055 12.477 0.000
.N9 0.916 0.064 14.319 0.000
.N10 0.995 0.070 14.187 0.000
.C1 0.815 0.056 14.428 0.000
.C2 1.253 0.090 13.971 0.000
.C3 0.787 0.052 15.147 0.000
.C4 0.925 0.069 13.452 0.000
.C5 1.010 0.073 13.868 0.000
.C6 1.075 0.082 13.077 0.000
.C7 0.877 0.061 14.492 0.000
.C8 0.958 0.065 14.749 0.000
.C9 1.008 0.072 14.067 0.000
.C10 0.865 0.057 15.070 0.000
N 1.000
C 1.000
6.3 Confronto
7 Violazione normalità/linearità
Quando non si hanno a disposizone degli item che permettano di sostenere la linearità e normalità dei punteggi:
- Matrice di correlazione policorica (se \(k \geq 3\))
- Matrice di correlazione tetracorica (se \(k = 2\))
dove \(k\) indica il numero di categorie di risposta
7.1 Correlazione tetracorica e le soglie
Le risposte agli item \(Y_i\) sono la realizzazione di una variabile latente \(Y_i^*\)
\(Y_i^*\) è continua e distribuita normalmente.. \(Y_i\) no!
\[Y_i = \begin{cases} 1 & \text{se } Y_i^* \geq \tau_i \\ 0 & \text{se } Y_i^* < \tau_i \end{cases} \]
dove \(\tau_i\) è una soglia fissa (incognita) da cui dipende la risposta positiva
\[r_{\text{tet}_{Y_i Y_j}} = r_{Y_i^* Y_j^*}\]
Call: tetrachoric(x = table(LSAT[, 1], LSAT[, 2]))
tetrachoric correlation
[1] 0.17
with tau of
0 0
-1.43 -0.55
In questo caso, vanno considerati come parametri del modello anche le soglie stimate per ogni item
Ma le soglie fanno parte anche dell’informazione iniziale a disposizione per stimare i parametri!
7.2 Conteggio dell’informazione
Avendo \(I = 4\) con \(k=5\), la matrice di covarianza è:
\[ S = \begin{pmatrix} s_{11} & s_{12} & s_{13} & s_{14} \\ s_{21} & s_{22} & s_{23} & s_{24} \\ s_{31} & s_{32} & s_{33} & s_{34} \\ s_{41} & s_{42} & s_{43} & s_{44} \end{pmatrix} \] Ma considerando il caso di variabili categoriali e quindi la correlazione policorica:
\[ S = \begin{pmatrix} 1 & s_{12} & s_{13} & s_{14} \\ s_{21} & 1 & s_{23} & s_{24} \\ s_{31} & s_{32} & 1 & s_{34} \\ s_{41} & s_{42} & s_{43} & 1 \end{pmatrix} \]
Perché le variabili osservate sono prese come realizzazione di variabili latenti standardizzate. Di conseguenza, \(S\) diventa una matrice di correlazione.
Il numero di parametri unici in \(S\) è
\[\dfrac{I(I-1)}{2}\] In questo caso, sono i 6 elementi nel triangolo inferiore (o nel triangolo superiore)
Nella quantità di informazione, vanno contate anche le soglie per ogni item
\[\sum_{i = 1}^{I} (k_i -1)\]
L’informazione totale in caso di item considerati a livello ordinale è quindi
\[\dfrac{I(I-1)}{2} + \sum_{i = 1}^{I} (k_i -1)\]
Nell’esempio di prima, con \(I = 4\) e \(k = 5\):
\[\dfrac{4(4-1)}{2} + \sum_{i = 1}^{4} (5 -1) = 6 + 4 \times 4 = 22\]
Il discorso del calcolo dei gradi di libertà e della loro logica è come quello in Sezione 4.1.1
Per la matrice tetracorica vale lo stesso identico discorso, dove però \(k = 2\)
7.3 Conteggio dei parametri
Si applica la stessa metodologia per scalare e interpretare i parametri di quella presentata in Sezione 5.2, ovvero
- Metodo indicatore-LV: La saturazione del primo item di ogni dimensione viene usato per scalare sia la variabile latente sia le saturazioni di tutti gli altri item
- Metodo della standardizzazione della LV: Vengono standardizzate le variabili latenti, creando una scala comune per l’interpretazione delle saturazioni
Il tipo di scalatura non influisce sul numero totale di parametri stimati (ma su quali parametri vengono stimati).
Nel caso della correlazioni basate sulle soglie (policoriche o tetracoriche), il conteggio dei parametri deve includere anche il conteggio delle soglie
\[\zeta = \{\Lambda, \boldsymbol{Var(\varepsilon_i)}, \Phi, \tau\}\]
dove \(\tau\) è la matrice item per soglia
7.3.1 Matrice policorica
Call: polychoric(x = d[, colnames(d) %in% c(labels$C[1:5], labels$N[1:5])])
Polychoric correlations
N1 N2 N3 N4 N5 C1 C2 C3 C4 C5
N1 1.00
N2 0.56 1.00
N3 0.68 0.44 1.00
N4 0.27 0.30 0.29 1.00
N5 0.44 0.25 0.38 0.16 1.00
C1 -0.12 -0.16 -0.03 -0.07 -0.12 1.00
C2 -0.08 -0.06 -0.12 -0.11 -0.01 0.30 1.00
C3 -0.05 -0.12 0.19 0.04 -0.11 0.39 0.18 1.00
C4 -0.32 -0.18 -0.27 -0.17 -0.26 0.39 0.53 0.27 1.00
C5 -0.14 -0.13 -0.15 -0.07 -0.15 0.32 0.41 0.26 0.41 1.00
with tau of
1 2 3 4
N1 -1.18 -0.48 0.111 0.73
N2 -0.94 -0.10 0.628 1.47
N3 -1.68 -1.00 -0.515 0.31
N4 -1.43 -0.65 0.040 0.80
N5 -0.95 -0.33 0.249 1.06
C1 -1.54 -0.70 0.223 1.17
C2 -0.88 -0.18 0.301 0.89
C3 -2.20 -1.42 -0.736 0.23
C4 -1.23 -0.59 0.081 0.87
C5 -0.67 0.01 0.665 1.38
\[I = 10 \qquad k = 5\] \[\dfrac{I(I-1)}{2} + \sum_{i = 1}^I (k_i -1) = \dfrac{10(10-1)}{2} + \sum_{i = 1}^{10} (5 -1) = 85\]
7.4 Parametri stimati
IL numero totale di parametri stimati rimane uguale ma va teneuto conto del metodo di scala delle variabili latenti usato.
Il conteggio generale dei parametri è uguale a quello presentato in Sezione 5.2.
In entrambi i casi, vanno aggiunti i parametri relativi alle soglie
Siccome il modello è ordinale (ovvero i dati osservati sono la realizzazione di variabili latenti con varianza nota) non vengono stimate le varianze d’errore degli item
\[\tau = I\times(k-1)\]
Nell’esempio con \(I = 20\) item con \(k = 5\) dove vengono specificato \(F = 2\) fattori latenti (di seguito viene riportato il caso in cui viene scalato con metodo indicatore-variabile latente):
\[(20-2) + \dfrac{2(2+1)}{2} + 20(5-1) = 101\]
id lhs op rhs user block group free ustart exo label plabel start est
1 1 N =~ N1 1 1 1 0 1 0 .p1. 1.000 1.000
2 2 N =~ N2 1 1 1 1 NA 0 .p2. 0.658 0.726
3 3 N =~ N3 1 1 1 2 NA 0 .p3. 0.849 0.895
4 4 N =~ N4 1 1 1 3 NA 0 .p4. 0.450 0.503
5 5 N =~ N5 1 1 1 4 NA 0 .p5. 0.629 0.729
6 6 N =~ N6 1 1 1 5 NA 0 .p6. 0.870 1.032
7 7 N =~ N7 1 1 1 6 NA 0 .p7. 0.773 1.107
8 8 N =~ N8 1 1 1 7 NA 0 .p8. 0.805 1.173
9 9 N =~ N9 1 1 1 8 NA 0 .p9. 0.795 0.915
10 10 N =~ N10 1 1 1 9 NA 0 .p10. 0.752 0.953
11 11 C =~ C1 1 1 1 0 1 0 .p11. 1.000 1.000
12 12 C =~ C2 1 1 1 10 NA 0 .p12. 0.865 1.059
13 13 C =~ C3 1 1 1 11 NA 0 .p13. 0.840 0.743
14 14 C =~ C4 1 1 1 12 NA 0 .p14. 0.976 1.370
15 15 C =~ C5 1 1 1 13 NA 0 .p15. 0.945 1.070
16 16 C =~ C6 1 1 1 14 NA 0 .p16. 1.017 1.246
17 17 C =~ C7 1 1 1 15 NA 0 .p17. 0.979 0.911
18 18 C =~ C8 1 1 1 16 NA 0 .p18. 0.861 0.972
19 19 C =~ C9 1 1 1 17 NA 0 .p19. 0.994 1.002
20 20 C =~ C10 1 1 1 18 NA 0 .p20. 0.877 0.777
21 21 N1 | t1 0 1 1 19 NA 0 .p21. -1.183 -1.183
22 22 N1 | t2 0 1 1 20 NA 0 .p22. -0.475 -0.475
23 23 N1 | t3 0 1 1 21 NA 0 .p23. 0.111 0.111
24 24 N1 | t4 0 1 1 22 NA 0 .p24. 0.729 0.729
25 25 N2 | t1 0 1 1 23 NA 0 .p25. -0.936 -0.936
26 26 N2 | t2 0 1 1 24 NA 0 .p26. -0.101 -0.101
27 27 N2 | t3 0 1 1 25 NA 0 .p27. 0.628 0.628
28 28 N2 | t4 0 1 1 26 NA 0 .p28. 1.474 1.474
29 29 N3 | t1 0 1 1 27 NA 0 .p29. -1.683 -1.683
30 30 N3 | t2 0 1 1 28 NA 0 .p30. -1.000 -1.000
31 31 N3 | t3 0 1 1 29 NA 0 .p31. -0.515 -0.515
32 32 N3 | t4 0 1 1 30 NA 0 .p32. 0.312 0.312
33 33 N4 | t1 0 1 1 31 NA 0 .p33. -1.430 -1.430
34 34 N4 | t2 0 1 1 32 NA 0 .p34. -0.646 -0.646
35 35 N4 | t3 0 1 1 33 NA 0 .p35. 0.040 0.040
36 36 N4 | t4 0 1 1 34 NA 0 .p36. 0.803 0.803
37 37 N5 | t1 0 1 1 35 NA 0 .p37. -0.951 -0.951
38 38 N5 | t2 0 1 1 36 NA 0 .p38. -0.328 -0.328
39 39 N5 | t3 0 1 1 37 NA 0 .p39. 0.249 0.249
40 40 N5 | t4 0 1 1 38 NA 0 .p40. 1.060 1.060
41 41 N6 | t1 0 1 1 39 NA 0 .p41. -0.951 -0.951
42 42 N6 | t2 0 1 1 40 NA 0 .p42. -0.228 -0.228
43 43 N6 | t3 0 1 1 41 NA 0 .p43. 0.382 0.382
44 44 N6 | t4 0 1 1 42 NA 0 .p44. 1.017 1.017
45 45 N7 | t1 0 1 1 43 NA 0 .p45. -1.124 -1.124
46 46 N7 | t2 0 1 1 44 NA 0 .p46. -0.296 -0.296
47 47 N7 | t3 0 1 1 45 NA 0 .p47. 0.208 0.208
48 48 N7 | t4 0 1 1 46 NA 0 .p48. 0.832 0.832
49 49 N8 | t1 0 1 1 47 NA 0 .p49. -0.736 -0.736
50 50 N8 | t2 0 1 1 48 NA 0 .p50. 0.010 0.010
51 51 N8 | t3 0 1 1 49 NA 0 .p51. 0.475 0.475
52 52 N8 | t4 0 1 1 50 NA 0 .p52. 1.105 1.105
53 53 N9 | t1 0 1 1 51 NA 0 .p53. -1.235 -1.235
54 54 N9 | t2 0 1 1 52 NA 0 .p54. -0.459 -0.459
55 55 N9 | t3 0 1 1 53 NA 0 .p55. 0.167 0.167
56 56 N9 | t4 0 1 1 54 NA 0 .p56. 0.897 0.897
57 57 N10 | t1 0 1 1 55 NA 0 .p57. -0.875 -0.875
58 58 N10 | t2 0 1 1 56 NA 0 .p58. -0.060 -0.060
59 59 N10 | t3 0 1 1 57 NA 0 .p59. 0.431 0.431
60 60 N10 | t4 0 1 1 58 NA 0 .p60. 1.025 1.025
61 61 C1 | t1 0 1 1 59 NA 0 .p61. -1.536 -1.536
62 62 C1 | t2 0 1 1 60 NA 0 .p62. -0.703 -0.703
63 63 C1 | t3 0 1 1 61 NA 0 .p63. 0.223 0.223
64 64 C1 | t4 0 1 1 62 NA 0 .p64. 1.173 1.173
65 65 C2 | t1 0 1 1 63 NA 0 .p65. -0.875 -0.875
66 66 C2 | t2 0 1 1 64 NA 0 .p66. -0.182 -0.182
67 67 C2 | t3 0 1 1 65 NA 0 .p67. 0.301 0.301
68 68 C2 | t4 0 1 1 66 NA 0 .p68. 0.890 0.890
69 69 C3 | t1 0 1 1 67 NA 0 .p69. -2.196 -2.196
70 70 C3 | t2 0 1 1 68 NA 0 .p70. -1.417 -1.417
71 71 C3 | t3 0 1 1 69 NA 0 .p71. -0.736 -0.736
72 72 C3 | t4 0 1 1 70 NA 0 .p72. 0.228 0.228
73 73 C4 | t1 0 1 1 71 NA 0 .p73. -1.235 -1.235
74 74 C4 | t2 0 1 1 72 NA 0 .p74. -0.585 -0.585
75 75 C4 | t3 0 1 1 73 NA 0 .p75. 0.081 0.081
76 76 C4 | t4 0 1 1 74 NA 0 .p76. 0.868 0.868
77 77 C5 | t1 0 1 1 75 NA 0 .p77. -0.665 -0.665
78 78 C5 | t2 0 1 1 76 NA 0 .p78. 0.010 0.010
79 79 C5 | t3 0 1 1 77 NA 0 .p79. 0.665 0.665
80 80 C5 | t4 0 1 1 78 NA 0 .p80. 1.376 1.376
81 81 C6 | t1 0 1 1 79 NA 0 .p81. -0.868 -0.868
82 82 C6 | t2 0 1 1 80 NA 0 .p82. -0.203 -0.203
83 83 C6 | t3 0 1 1 81 NA 0 .p83. 0.270 0.270
84 84 C6 | t4 0 1 1 82 NA 0 .p84. 0.890 0.890
85 85 C7 | t1 0 1 1 83 NA 0 .p85. -1.749 -1.749
86 86 C7 | t2 0 1 1 84 NA 0 .p86. -1.115 -1.115
87 87 C7 | t3 0 1 1 85 NA 0 .p87. -0.254 -0.254
88 88 C7 | t4 0 1 1 86 NA 0 .p88. 0.533 0.533
89 89 C8 | t1 0 1 1 87 NA 0 .p89. -1.643 -1.643
90 90 C8 | t2 0 1 1 88 NA 0 .p90. -0.944 -0.944
91 91 C8 | t3 0 1 1 89 NA 0 .p91. 0.040 0.040
92 92 C8 | t4 0 1 1 90 NA 0 .p92. 0.736 0.736
93 93 C9 | t1 0 1 1 91 NA 0 .p93. -1.302 -1.302
94 94 C9 | t2 0 1 1 92 NA 0 .p94. -0.562 -0.562
95 95 C9 | t3 0 1 1 93 NA 0 .p95. 0.187 0.187
96 96 C9 | t4 0 1 1 94 NA 0 .p96. 0.860 0.860
97 97 C10 | t1 0 1 1 95 NA 0 .p97. -2.012 -2.012
98 98 C10 | t2 0 1 1 96 NA 0 .p98. -1.115 -1.115
99 99 C10 | t3 0 1 1 97 NA 0 .p99. -0.136 -0.136
100 100 C10 | t4 0 1 1 98 NA 0 .p100. 0.729 0.729
101 101 N1 ~~ N1 0 1 1 0 1 0 .p101. 1.000 0.435
102 102 N2 ~~ N2 0 1 1 0 1 0 .p102. 1.000 0.702
103 103 N3 ~~ N3 0 1 1 0 1 0 .p103. 1.000 0.547
104 104 N4 ~~ N4 0 1 1 0 1 0 .p104. 1.000 0.857
105 105 N5 ~~ N5 0 1 1 0 1 0 .p105. 1.000 0.700
106 106 N6 ~~ N6 0 1 1 0 1 0 .p106. 1.000 0.399
107 107 N7 ~~ N7 0 1 1 0 1 0 .p107. 1.000 0.308
108 108 N8 ~~ N8 0 1 1 0 1 0 .p108. 1.000 0.223
109 109 N9 ~~ N9 0 1 1 0 1 0 .p109. 1.000 0.527
110 110 N10 ~~ N10 0 1 1 0 1 0 .p110. 1.000 0.487
111 111 C1 ~~ C1 0 1 1 0 1 0 .p111. 1.000 0.664
112 112 C2 ~~ C2 0 1 1 0 1 0 .p112. 1.000 0.623
113 113 C3 ~~ C3 0 1 1 0 1 0 .p113. 1.000 0.814
114 114 C4 ~~ C4 0 1 1 0 1 0 .p114. 1.000 0.370
115 115 C5 ~~ C5 0 1 1 0 1 0 .p115. 1.000 0.615
116 116 C6 ~~ C6 0 1 1 0 1 0 .p116. 1.000 0.478
117 117 C7 ~~ C7 0 1 1 0 1 0 .p117. 1.000 0.721
118 118 C8 ~~ C8 0 1 1 0 1 0 .p118. 1.000 0.683
119 119 C9 ~~ C9 0 1 1 0 1 0 .p119. 1.000 0.663
120 120 C10 ~~ C10 0 1 1 0 1 0 .p120. 1.000 0.797
121 121 N ~~ N 0 1 1 99 NA 0 .p121. 0.050 0.565
122 122 C ~~ C 0 1 1 100 NA 0 .p122. 0.050 0.336
123 123 N ~~ C 0 1 1 101 NA 0 .p123. 0.000 -0.159
124 124 N1 ~*~ N1 0 1 1 0 1 0 .p124. 1.000 1.000
125 125 N2 ~*~ N2 0 1 1 0 1 0 .p125. 1.000 1.000
126 126 N3 ~*~ N3 0 1 1 0 1 0 .p126. 1.000 1.000
127 127 N4 ~*~ N4 0 1 1 0 1 0 .p127. 1.000 1.000
128 128 N5 ~*~ N5 0 1 1 0 1 0 .p128. 1.000 1.000
129 129 N6 ~*~ N6 0 1 1 0 1 0 .p129. 1.000 1.000
130 130 N7 ~*~ N7 0 1 1 0 1 0 .p130. 1.000 1.000
131 131 N8 ~*~ N8 0 1 1 0 1 0 .p131. 1.000 1.000
132 132 N9 ~*~ N9 0 1 1 0 1 0 .p132. 1.000 1.000
133 133 N10 ~*~ N10 0 1 1 0 1 0 .p133. 1.000 1.000
134 134 C1 ~*~ C1 0 1 1 0 1 0 .p134. 1.000 1.000
135 135 C2 ~*~ C2 0 1 1 0 1 0 .p135. 1.000 1.000
136 136 C3 ~*~ C3 0 1 1 0 1 0 .p136. 1.000 1.000
137 137 C4 ~*~ C4 0 1 1 0 1 0 .p137. 1.000 1.000
138 138 C5 ~*~ C5 0 1 1 0 1 0 .p138. 1.000 1.000
139 139 C6 ~*~ C6 0 1 1 0 1 0 .p139. 1.000 1.000
140 140 C7 ~*~ C7 0 1 1 0 1 0 .p140. 1.000 1.000
141 141 C8 ~*~ C8 0 1 1 0 1 0 .p141. 1.000 1.000
142 142 C9 ~*~ C9 0 1 1 0 1 0 .p142. 1.000 1.000
143 143 C10 ~*~ C10 0 1 1 0 1 0 .p143. 1.000 1.000
144 144 N1 ~1 0 1 1 0 0 0 .p144. 0.000 0.000
145 145 N2 ~1 0 1 1 0 0 0 .p145. 0.000 0.000
146 146 N3 ~1 0 1 1 0 0 0 .p146. 0.000 0.000
147 147 N4 ~1 0 1 1 0 0 0 .p147. 0.000 0.000
148 148 N5 ~1 0 1 1 0 0 0 .p148. 0.000 0.000
149 149 N6 ~1 0 1 1 0 0 0 .p149. 0.000 0.000
150 150 N7 ~1 0 1 1 0 0 0 .p150. 0.000 0.000
151 151 N8 ~1 0 1 1 0 0 0 .p151. 0.000 0.000
152 152 N9 ~1 0 1 1 0 0 0 .p152. 0.000 0.000
153 153 N10 ~1 0 1 1 0 0 0 .p153. 0.000 0.000
154 154 C1 ~1 0 1 1 0 0 0 .p154. 0.000 0.000
155 155 C2 ~1 0 1 1 0 0 0 .p155. 0.000 0.000
156 156 C3 ~1 0 1 1 0 0 0 .p156. 0.000 0.000
157 157 C4 ~1 0 1 1 0 0 0 .p157. 0.000 0.000
158 158 C5 ~1 0 1 1 0 0 0 .p158. 0.000 0.000
159 159 C6 ~1 0 1 1 0 0 0 .p159. 0.000 0.000
160 160 C7 ~1 0 1 1 0 0 0 .p160. 0.000 0.000
161 161 C8 ~1 0 1 1 0 0 0 .p161. 0.000 0.000
162 162 C9 ~1 0 1 1 0 0 0 .p162. 0.000 0.000
163 163 C10 ~1 0 1 1 0 0 0 .p163. 0.000 0.000
164 164 N ~1 0 1 1 0 0 0 .p164. 0.000 0.000
165 165 C ~1 0 1 1 0 0 0 .p165. 0.000 0.000
se
1 0.000
2 0.042
3 0.036
4 0.057
5 0.044
6 0.035
7 0.036
8 0.037
9 0.038
10 0.041
11 0.000
12 0.085
13 0.078
14 0.094
15 0.083
16 0.090
17 0.081
18 0.086
19 0.079
20 0.086
21 0.073
22 0.059
23 0.056
24 0.062
25 0.066
26 0.056
27 0.060
28 0.085
29 0.097
30 0.068
31 0.059
32 0.057
33 0.083
34 0.061
35 0.056
36 0.063
37 0.067
38 0.057
39 0.057
40 0.069
41 0.067
42 0.057
43 0.058
44 0.068
45 0.071
46 0.057
47 0.057
48 0.064
49 0.062
50 0.056
51 0.059
52 0.071
53 0.075
54 0.058
55 0.057
56 0.065
57 0.065
58 0.056
59 0.058
60 0.068
61 0.088
62 0.062
63 0.057
64 0.073
65 0.065
66 0.057
67 0.057
68 0.065
69 0.147
70 0.082
71 0.062
72 0.057
73 0.075
74 0.060
75 0.056
76 0.065
77 0.061
78 0.056
79 0.061
80 0.081
81 0.065
82 0.057
83 0.057
84 0.065
85 0.102
86 0.071
87 0.057
88 0.059
89 0.095
90 0.066
91 0.056
92 0.062
93 0.077
94 0.060
95 0.057
96 0.064
97 0.125
98 0.071
99 0.056
100 0.062
101 0.000
102 0.000
103 0.000
104 0.000
105 0.000
106 0.000
107 0.000
108 0.000
109 0.000
110 0.000
111 0.000
112 0.000
113 0.000
114 0.000
115 0.000
116 0.000
117 0.000
118 0.000
119 0.000
120 0.000
121 0.033
122 0.042
123 0.021
124 0.000
125 0.000
126 0.000
127 0.000
128 0.000
129 0.000
130 0.000
131 0.000
132 0.000
133 0.000
134 0.000
135 0.000
136 0.000
137 0.000
138 0.000
139 0.000
140 0.000
141 0.000
142 0.000
143 0.000
144 0.000
145 0.000
146 0.000
147 0.000
148 0.000
149 0.000
150 0.000
151 0.000
152 0.000
153 0.000
154 0.000
155 0.000
156 0.000
157 0.000
158 0.000
159 0.000
160 0.000
161 0.000
162 0.000
163 0.000
164 0.000
165 0.000
7.5 Fit del modello
lavaan 0.6-19 ended normally after 30 iterations
Estimator DWLS
Optimization method NLMINB
Number of model parameters 101
Number of observations 498
Model Test User Model:
Standard Scaled
Test Statistic 1007.367 994.065
Degrees of freedom 169 169
P-value (Chi-square) 0.000 0.000
Scaling correction factor 1.087
Shift parameter 67.554
simple second-order correction
Model Test Baseline Model:
Test statistic 17488.238 7449.890
Degrees of freedom 190 190
P-value 0.000 0.000
Scaling correction factor 2.383
User Model versus Baseline Model:
Comparative Fit Index (CFI) 0.952 0.886
Tucker-Lewis Index (TLI) 0.946 0.872
Robust Comparative Fit Index (CFI) 0.761
Robust Tucker-Lewis Index (TLI) 0.731
Root Mean Square Error of Approximation:
RMSEA 0.100 0.099
90 Percent confidence interval - lower 0.094 0.093
90 Percent confidence interval - upper 0.106 0.105
P-value H_0: RMSEA <= 0.050 0.000 0.000
P-value H_0: RMSEA >= 0.080 1.000 1.000
Robust RMSEA 0.112
90 Percent confidence interval - lower 0.105
90 Percent confidence interval - upper 0.119
P-value H_0: Robust RMSEA <= 0.050 0.000
P-value H_0: Robust RMSEA >= 0.080 1.000
Standardized Root Mean Square Residual:
SRMR 0.085 0.085
Parameter Estimates:
Parameterization Delta
Standard errors Robust.sem
Information Expected
Information saturated (h1) model Unstructured
Latent Variables:
Estimate Std.Err z-value P(>|z|)
N =~
N1 1.000
N2 0.726 0.042 17.176 0.000
N3 0.895 0.036 24.775 0.000
N4 0.503 0.057 8.898 0.000
N5 0.729 0.044 16.701 0.000
N6 1.032 0.035 29.367 0.000
N7 1.107 0.036 30.713 0.000
N8 1.173 0.037 32.006 0.000
N9 0.915 0.038 24.204 0.000
N10 0.953 0.041 23.310 0.000
C =~
C1 1.000
C2 1.059 0.085 12.429 0.000
C3 0.743 0.078 9.470 0.000
C4 1.370 0.094 14.592 0.000
C5 1.070 0.083 12.837 0.000
C6 1.246 0.090 13.811 0.000
C7 0.911 0.081 11.264 0.000
C8 0.972 0.086 11.309 0.000
C9 1.002 0.079 12.658 0.000
C10 0.777 0.086 9.037 0.000
Covariances:
Estimate Std.Err z-value P(>|z|)
N ~~
C -0.159 0.021 -7.529 0.000
Thresholds:
Estimate Std.Err z-value P(>|z|)
N1|t1 -1.183 0.073 -16.173 0.000
N1|t2 -0.475 0.059 -8.113 0.000
N1|t3 0.111 0.056 1.969 0.049
N1|t4 0.729 0.062 11.761 0.000
N2|t1 -0.936 0.066 -14.147 0.000
N2|t2 -0.101 0.056 -1.790 0.073
N2|t3 0.628 0.060 10.388 0.000
N2|t4 1.474 0.085 17.310 0.000
N3|t1 -1.683 0.097 -17.303 0.000
N3|t2 -1.000 0.068 -14.766 0.000
N3|t3 -0.515 0.059 -8.730 0.000
N3|t4 0.312 0.057 5.453 0.000
N4|t1 -1.430 0.083 -17.227 0.000
N4|t2 -0.646 0.061 -10.648 0.000
N4|t3 0.040 0.056 0.716 0.474
N4|t4 0.803 0.063 12.686 0.000
N5|t1 -0.951 0.067 -14.304 0.000
N5|t2 -0.328 0.057 -5.720 0.000
N5|t3 0.249 0.057 4.383 0.000
N5|t4 1.060 0.069 15.285 0.000
N6|t1 -0.951 0.067 -14.304 0.000
N6|t2 -0.228 0.057 -4.026 0.000
N6|t3 0.382 0.058 6.609 0.000
N6|t4 1.017 0.068 14.916 0.000
N7|t1 -1.124 0.071 -15.778 0.000
N7|t2 -0.296 0.057 -5.185 0.000
N7|t3 0.208 0.057 3.668 0.000
N7|t4 0.832 0.064 13.017 0.000
N8|t1 -0.736 0.062 -11.846 0.000
N8|t2 0.010 0.056 0.179 0.858
N8|t3 0.475 0.059 8.113 0.000
N8|t4 1.105 0.071 15.640 0.000
N9|t1 -1.235 0.075 -16.478 0.000
N9|t2 -0.459 0.058 -7.849 0.000
N9|t3 0.167 0.057 2.953 0.003
N9|t4 0.897 0.065 13.749 0.000
N10|t1 -0.875 0.065 -13.507 0.000
N10|t2 -0.060 0.056 -1.074 0.283
N10|t3 0.431 0.058 7.406 0.000
N10|t4 1.025 0.068 14.991 0.000
C1|t1 -1.536 0.088 -17.378 0.000
C1|t2 -0.703 0.062 -11.420 0.000
C1|t3 0.223 0.057 3.936 0.000
C1|t4 1.173 0.073 16.109 0.000
C2|t1 -0.875 0.065 -13.507 0.000
C2|t2 -0.182 0.057 -3.221 0.001
C2|t3 0.301 0.057 5.274 0.000
C2|t4 0.890 0.065 13.669 0.000
C3|t1 -2.196 0.147 -14.890 0.000
C3|t2 -1.417 0.082 -17.195 0.000
C3|t3 -0.736 0.062 -11.846 0.000
C3|t4 0.228 0.057 4.026 0.000
C4|t1 -1.235 0.075 -16.478 0.000
C4|t2 -0.585 0.060 -9.780 0.000
C4|t3 0.081 0.056 1.432 0.152
C4|t4 0.868 0.065 13.426 0.000
C5|t1 -0.665 0.061 -10.906 0.000
C5|t2 0.010 0.056 0.179 0.858
C5|t3 0.665 0.061 10.906 0.000
C5|t4 1.376 0.081 17.083 0.000
C6|t1 -0.868 0.065 -13.426 0.000
C6|t2 -0.203 0.057 -3.579 0.000
C6|t3 0.270 0.057 4.740 0.000
C6|t4 0.890 0.065 13.669 0.000
C7|t1 -1.749 0.102 -17.168 0.000
C7|t2 -1.115 0.071 -15.709 0.000
C7|t3 -0.254 0.057 -4.472 0.000
C7|t4 0.533 0.059 8.993 0.000
C8|t1 -1.643 0.095 -17.355 0.000
C8|t2 -0.944 0.066 -14.225 0.000
C8|t3 0.040 0.056 0.716 0.474
C8|t4 0.736 0.062 11.846 0.000
C9|t1 -1.302 0.077 -16.807 0.000
C9|t2 -0.562 0.060 -9.431 0.000
C9|t3 0.187 0.057 3.311 0.001
C9|t4 0.860 0.064 13.345 0.000
C10|t1 -2.012 0.125 -16.076 0.000
C10|t2 -1.115 0.071 -15.709 0.000
C10|t3 -0.136 0.056 -2.417 0.016
C10|t4 0.729 0.062 11.761 0.000
Variances:
Estimate Std.Err z-value P(>|z|)
.N1 0.435
.N2 0.702
.N3 0.547
.N4 0.857
.N5 0.700
.N6 0.399
.N7 0.308
.N8 0.223
.N9 0.527
.N10 0.487
.C1 0.664
.C2 0.623
.C3 0.814
.C4 0.370
.C5 0.615
.C6 0.478
.C7 0.721
.C8 0.683
.C9 0.663
.C10 0.797
N 0.565 0.033 17.260 0.000
C 0.336 0.042 8.024 0.000
8 Attendbilità
Tutto il discorso che segue sull’attendbilità e sulla sua valutazione riguarda la Classical Test Theory
Grado in cui una procedura di misurazione produce lo stesso risultato in prove ripetute
\[ X = V + E \]
\(X\): misura rilevata\ \(V\): parte vera\ \(E\): errore: fluttuazioni casuali oppure costante e sistematico
L’attendibilità di una misura è la proporzione di \(X\) che non riflette l’errore di misurazione:
\[ \rho = \dfrac{V}{V + E} \tag{1}\]
Problema: Non è possibile conoscere \(V\) (non lo osserviamo mai) \(\rightarrow\) Non è effettivmente possibile stimare l’attendibilità di una misura a partire dalla definizione in Equazione 1
Vengono utilizzate delle metodologie che perettono di approssimare il calcolo di \(V\):
Viene somministrato lo stesso test allo stesso gruppo di soggetti in due momenti distinti (solitamente vengono fatti passare almeno 3 mesi)
Si calcola il coefficiente di correlazione tra i punteggi ottenuti nelle due somministrazioni
coefficiente di stabilità
Vengono somministrate due versioni dello stesso test che possono essere considerate equivalenti allo stesso gruppo di persone
Il contenuto, la formulazione degli item e degli eventuali distrattori devono essere pressapoco identici
Si calcola la correlazione tra i punteggi ottenuti ai due test
coefficiente di equivalenza
Si basa sulla somministrazione di una singola misura che viene suddivisa in due metà equivalenti (in termini di copertura del dominio di contenuto)
Viene calcolata la correlazione tra i punteggi che si ottengono dalle due metà \(\rightarrow\) attendibilità che si osserverebbe su una misura lunga la metà dell’originale!
Viene impiegato il coefficiente di Spearman-Brown per calcolare l’attendbilità complessiva dell’intera misura
coefficiente di coerenza interna
8.1 \(\alpha\) di Cronbach
è la misura di attendibilità sicuramente più conosciuta e usata
Interamente basata sulla correlazione tra gli item
\[\alpha = \dfrac{I}{I-1} \left( 1- \dfrac{\sum_{i = 1}^I \sigma_{X_i}^2}{\sigma_X^2}\right)\]
dove
\(X = \sum_{i = 1}^I X_i\): punteggio totale al test
\(\sigma_X^2\): varianza del punteggio totale
\(\sigma_{X_i}^2\): varianze degli item
8.1.1 Cut off
| \(\alpha\) | Interpretazione |
|---|---|
| \(<.70\) | inaccettabile |
| \(.70−.79\) | accettabile |
| \(.80−.89\) | buona |
| \(\geq 90\) | eccellente |
Una considerazione interessante su \(\alpha\): paper
Il valore di \(\alpha\) aumenta all’aumentare del numero di item, indipendentemente dal fatto che siano utili o meno
Non si accorge della multidimensionalità: Può essere alto anche se la scala misura più costrutti diversi
8.2 Big Five
Some items ( C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 ) were negatively correlated with the first principal component and
probably should be reversed.
To do this, run the function again with the 'check.keys=TRUE' option
raw_alpha std.alpha G6(smc) average_r S/N ase mean sd
0.705802 0.7049413 0.8016712 0.1067104 2.389156 0.01959568 3.205723 0.4828887
median_r
0.02863595
Sbagliato!!
In maniera corretta:
raw_alpha std.alpha G6(smc) average_r S/N ase mean sd
0.8676442 0.8659247 0.876357 0.392411 6.458495 0.008709927 3.094177 0.8677234
median_r
0.3870844
raw_alpha std.alpha G6(smc) average_r S/N ase mean sd
0.8142006 0.8127849 0.8118898 0.3027204 4.341448 0.01218387 3.317269 0.7298349
median_r
0.3030961
8.2.1 \(\alpha\) se l’item è eliminato
Misura del contributo di ogni singolo item alla coerenza interna (non è un giudizio assoluto sulla bontà dell’item o su quanto contribuisce alla misurazione del contrutto)
\[\Delta_\alpha = \alpha_{(-i)} - \alpha\]
Se:
\(\Delta \alpha \geq .05\): L’item probabilmente non contribuisce alla coerenza interna
\(0 < \Delta_\alpha .02\): Va bene così
\(\Delta_\alpha < 0\): Togliere l’item peggiora la coerenza interna della scala
Sapendo che
raw_alpha std.alpha G6(smc) average_r S/N ase mean sd
0.8142006 0.8127849 0.8118898 0.3027204 4.341448 0.01218387 3.317269 0.7298349
median_r
0.3030961
le statistiche relativamente ad \(\alpha_{(-1)}\) sono:
raw_alpha std.alpha alpha se
C1 0.80 0.79 0.01
C2 0.80 0.80 0.01
C3 0.81 0.81 0.01
C4 0.79 0.79 0.01
C5 0.79 0.79 0.01
C6 0.79 0.79 0.01
C7 0.80 0.80 0.01
C8 0.80 0.80 0.01
C9 0.79 0.79 0.01
C10 0.81 0.80 0.01