Analisi dei valori mancanti¶
show_missing¶
Produce nel log un report dei valori mancanti su tutto il data frame o sulle variabili indicate. I valori validi sono indicati con 1 e i valori mancanti con 0. Le righe rappresentano le diverse combinazioni di valori mancanti, il numero di variabili con valori mancanti e il numero di osservazioni. L’ultima riga conteggia il numero di valori mancanti per variabile.
1 | show_missing :area, :sesso, :etacon, :titolo, :d1, :d5
|
Output:
"Missing values:"
area sesso titolo etacon d1 d5
231 1 1 1 1 1 1 0
13 1 1 1 0 1 1 1
26 1 1 1 1 0 1 1
28 1 1 1 1 1 0 1
1 1 1 1 0 1 0 2
1 1 1 1 1 0 0 2
0 0 0 14 27 30 71
Se viene specificato il parametro :out con il nome di un file, produce in aggiunta una serie di grafici. Il formato di file predefinito é png. E’ possibile salvare i file in formato pdf o wmf inserendo, oltre al nome, l’estensione. Indicando invece :screen, i grafici vengono mostrati a video. E’ possibile indicare le variabili che devono essere evidenziate con il parametro :highlight o :hl.
- Numero di missing per variabile e numero di missing per ogni combinazione di variabili.
- Matrice di grafici scatterplot di tutte le coppie di variabili con a margine i valori mancanti. Prodotto solo se le variabili sono al massimo 10.
- Parallel coordinate plot con evidenziati i valori mancanti delle variabili indicate. [1]
- Matrice dei dati con i valori validi rappresentati in toni di grigio (dal valore più piccolo al più grande) e i valori mancanti in rosso. I dati sono ordinati sui valori della prima variabile indicata. Prodotto solo se le variabili sono al massimo 50. [1]
- Matrice di grafici scatterplot di tutte le coppie di variabili con evidenziati i valori mancanti delle variabili indicate. Prodotto solo se le variabili sono al massimo 10. [1]
1 2 3 4 5 6 7 | show_missing var_list, :file => "filename"
show_missing
show_missing :out => "report_na"
show_missing :highlight => [:d1, :d5], :out => "report_na.pdf"
show_missing :d23_1, :d24_1, s(:d10_,1..5)
show_missing :d23_1, :d24_1, s(:d10_,1..5), :hl => :d23_1, :out => :screen
|
Suggerimento
Utilizzando il parametro :out => :screen i grafici sono visualizzati in modalità interattiva. In questa modalità è possibile cambiare l’evidenziazione delle variabili o l’ordinamento dei dati.
Note
[1] | (1, 2, 3) Grafico interattivo. |