Az R earth csomag frissítése (2021. január)

Ez a frissítés az előző bejegyzéshez Stephen Milborrow R-Language „earth” csomagjáról, amelyet 2020 szeptemberében frissítettek, és számos kapcsolódó csomagot. Néhány dolog megváltozott, és most már meglehetősen könnyű lekérni az összes függvényt az összes alapfunkcióhoz.

Használja az előző bejegyzés adatait, amelyeket letölthet a GitHub -ból (nem változott):

https://github.com/wcraytor/MLS_DATA

Olvassa el az előző bejegyzést, ha további információra van szüksége az adathalmazról. Telepítse és hozza be az R-t (ne használja az R-Studio-t). Győződjön meg arról, hogy a következő csomagok telepítve vannak:

          • Képlet
          • plotmo
          • Démonok tanítása
          • gam
          • mgcv
          • MDA
          • MASS
          • föld

Feltételezve, hogy letöltötte az adatokat a „c: \ data \” mappába, hajtsa végre:

      1.   könyvtár (föld)
      2.   könyvtár (plotmo)
      3.   Saját adatok = read.csv ("c: \ data \ MyData.csv", fejléc = IGAZ)
      4.   MyData $ ”Filteredaddress” <- NULL # Fontos !! Ez biztosítja, hogy a cím eltávolításra kerüljön a bemenetről. Pontosan ugyanaz a betű, ugyanazzal a házzal
      5.   x = data.frame (Saját adatok [, 1: (ncol (Saját adatok) -1)])
      6.   y = Saját adatok [, ncol (Saját adatok)]
      7.   b = föld (x, y, nprune = 25) # max 25 bázisfüggvény
      8.   összefoglaló (b, számjegy = 2, stílus = ”pmax”)
      9.   plotmo (b) # ez létrehozza a cselekményt

Meg kell szereznie:

y = # vagy az eladási ár
    6.1e+05 #610,000 XNUMX dollár alapérték
+ 234 * pmax (0, 1887 - Akciós kor) 
  - 455 * pmax (0, értékesítési kor - 1887) 

  + 591 * pmax (0, értékesítési kor - 2164)
  - 435 * pmax (0, értékesítési kor - 4498) 
  + 239 * pmax (0, értékesítési kor - 5439)
  + 49318 * pmax (0, AreaID - 652) 
  + 14475 * pmax (0, 654 - AreaID) 
  - 66058 * pmax (0, AreaID - 654) 
  -120 * pmax (0, 1450 -LivingSqFt) # vagy -120/sf az alapból GLA esetén 1450 sf alatt
  + 148 * pmax (0, LivingSqFt - 1450) # vagy 148 USD a GLA> 1450 sf alapjához
  -6.9 * pmax (0, 15041 -LotSize) # vagy -6.90 USD/sf az alapból, 15,041 XNUMX sf alatti tételméret esetén 
  + 6.2 * pmax (0, LotSize - 15041) # vagy 6.20 USD/sf a> 15,041sf alaphoz
  - 22086 * pmax (0, 2 - garázs) # 22,086 2 USD/autó bázisról XNUMX autó alatti garázs számára
  + 85767 * pmax (0, garázs - 2)

A 15 kifejezés közül 16 kiválasztott, és a 5 -ből 9 előrejelző (nprune = 25)
Megszűnési feltétel: elérte a 21
Fontosság: SaleAge, LivingSqFt, LotSize, AreaID, Garázs, nem használt kor,…
A kifejezések száma az interakció minden fokán: 1 14 (additív modell)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

1. megjegyzés: A 85,767+ 3 USD/autó nagy értékű hozzájárulás 3+ autó garázsához valószínűleg ütköző az építési minőséggel, mivel a 2+ autó garázsok jobb minőségű lakásokhoz kapcsolódnak. Tehát meg kell próbálnia elkülöníteni a 3 és XNUMX autó garázst a kompokban, vagy kitalálni a módját, hogyan kezelje az állapotváltozásokat. Ez lehet vagy nem jelent problémát, a fennmaradó pontszámoktól és a tényleges minőséghez való viszonyuktól függően (ezt szemrevételezéssel kell megvizsgálni és dönteni).

2. megjegyzés: Az olyan változókat, mint a AreaID, valószínűleg kategorikus változóként kell kezelni. És ezt meg lehet tenni a Földdel.  

EarthPlot-1