Aggiornamento pacchetto R Earth (gennaio 2021)

Questo è un aggiornamento del post precedente sul pacchetto "terra" R-Language di Stephen Milborrow che è stato aggiornato a settembre del 2020, insieme a diversi pacchetti associati. Sono cambiate alcune cose e ora è abbastanza facile ottenere tutti i grafici per tutte le funzioni di base.

Usa i dati del post precedente, che puoi scaricare da GitHub (non è cambiato):

https://github.com/wcraytor/MLS_DATA

Leggi il post precedente per maggiori informazioni sul set di dati. Installa e avvia R (non utilizzare R-Studio). Assicurati che i seguenti pacchetti siano installati:

          • Formula
          • trama
          • InsegnareDemo
          • gam
          • mgcv
          • mda
          • MASSA
          • terra

Quindi supponendo che tu abbia scaricato i dati nella tua cartella "c:\data\", esegui:

      1.   biblioteca (terra)
      2.   biblioteca (plotmo)
      3.   MyData = read.csv(“c:\data\MyData.csv”,header=TRUE)
      4.   MyData$”Filteredaddress” <- NULL # Importante!! Ciò garantisce che l'indirizzo venga rimosso dall'input. Scrivi esattamente lo stesso, con lo stesso caso
      5.   x=data.frame(MyData[,1:(ncol(MyData)-1)])
      6.   y=MieiDati[,ncol(MieiDati)]
      7.   b=terra(x,y,nprune=25) # max 25 funzioni base
      8.   sommario(b,cifre=2,stile=”pmax”)
      9.   plotmo(b) # questo crea la trama

Dovresti ricevere:

y = # o il prezzo di vendita
    6.1e+05 #$ 610,000 valore di base
+ 234 * pmax(0, 1887 – SaleAge) 
  – 455 * pmax(0, SaleEtà – 1887) 

  + 591 * pmax(0, SaleEtà – 2164)
  – 435 * pmax(0, SaleEtà – 4498) 
  + 239 * pmax(0, SaleEtà – 5439)
  + 49318 * pmax(0, AreaID – 652) 
  + 14475 * pmax(0, 654 – AreaID) 
  – 66058 * pmax(0, AreaID – 654) 
  – 120 * pmax(0, 1450 – LivingSqFt) # o -120/sf dalla base per GLA inferiore a 1450 sf
  + 148 * pmax(0, LivingSqFt – 1450) # o $148 alla base per GLA > 1450 sf
  – 6.9 * pmax(0, 15041 – LotSize) # o -$6.90/sf dalla base per dimensioni del lotto inferiori a 15,041sf 
  + 6.2 * pmax(0, LotSize – 15041) # o $6.20/sf alla base per > 15,041sf
  – 22086 * pmax(0, 2 – Garage) # $22,086/auto dalla base per meno di 2 box auto
  + 85767 * pmax(0, Garage – 2) # $85,767 alla base per oltre 2 box auto

Selezionati 15 dei 16 termini e 5 dei 9 predittori (nprune=25)
Condizione di rescissione: Raggiunto nk 21
Importanza: SaleAge, LivingSqFt, LotSize, AreaID, Garage, Age-unused, …
Numero di termini per ogni grado di interazione: 1 14 (modello additivo)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

Nota 1: Il grande contributo di valore di $ 85,767/auto per 3+ box auto probabilmente è allineato con la qualità della costruzione poiché 3+ box auto sono associati a case di qualità superiore. Quindi dovresti provare a tenere separati 2 e 3 garage per auto nelle gare o trovare un modo per affrontare le regolazioni delle condizioni. Questo può essere o meno un problema, a seconda dei punteggi residui e della loro relazione con la qualità effettiva (qualcosa che devi ispezionare visivamente e decidere).

Nota 2: le variabili come AreaID dovrebbero probabilmente essere trattate come variabili categoriali. E questo può essere fatto con la Terra.  

TerraPlot-1