Analisi dei valori mancanti

show_missing

Produce nel log un report dei valori mancanti su tutto il data frame o sulle variabili indicate. I valori validi sono indicati con 1 e i valori mancanti con 0. Le righe rappresentano le diverse combinazioni di valori mancanti, il numero di variabili con valori mancanti e il numero di osservazioni. L’ultima riga conteggia il numero di valori mancanti per variabile.

1
 show_missing :area, :sesso, :etacon, :titolo, :d1, :d5

Output:

"Missing values:"
    area sesso titolo etacon d1 d5
231    1     1      1      1  1  1  0
 13    1     1      1      0  1  1  1
 26    1     1      1      1  0  1  1
 28    1     1      1      1  1  0  1
  1    1     1      1      0  1  0  2
  1    1     1      1      1  0  0  2
       0     0      0     14 27 30 71

Se viene specificato il parametro :out con il nome di un file, produce in aggiunta una serie di grafici. Il formato di file predefinito é png. E’ possibile salvare i file in formato pdf o wmf inserendo, oltre al nome, l’estensione. Indicando invece :screen, i grafici vengono mostrati a video. E’ possibile indicare le variabili che devono essere evidenziate con il parametro :highlight o :hl.

  • Numero di missing per variabile e numero di missing per ogni combinazione di variabili.
  • Matrice di grafici scatterplot di tutte le coppie di variabili con a margine i valori mancanti. Prodotto solo se le variabili sono al massimo 10.
  • Parallel coordinate plot con evidenziati i valori mancanti delle variabili indicate. [1]
  • Matrice dei dati con i valori validi rappresentati in toni di grigio (dal valore più piccolo al più grande) e i valori mancanti in rosso. I dati sono ordinati sui valori della prima variabile indicata. Prodotto solo se le variabili sono al massimo 50. [1]
  • Matrice di grafici scatterplot di tutte le coppie di variabili con evidenziati i valori mancanti delle variabili indicate. Prodotto solo se le variabili sono al massimo 10. [1]
1
2
3
4
5
6
7
 show_missing var_list, :file => "filename"

 show_missing
 show_missing :out => "report_na"
 show_missing :highlight => [:d1, :d5], :out => "report_na.pdf"
 show_missing :d23_1, :d24_1, s(:d10_,1..5)
 show_missing :d23_1, :d24_1, s(:d10_,1..5), :hl => :d23_1, :out => :screen

Suggerimento

Utilizzando il parametro :out => :screen i grafici sono visualizzati in modalità interattiva. In questa modalità è possibile cambiare l’evidenziazione delle variabili o l’ordinamento dei dati.

_images/report_na001.png

Note

[1](1, 2, 3) Grafico interattivo.