„R earth“ paketo atnaujinimas (2021 m. Sausio mėn.)

Tai yra ankstesnio įrašo apie Stepheno Milborrowo „R-Language“ „žemės“ paketą, kuris buvo atnaujintas 2020 m. Rugsėjo mėn., Atnaujinimas kartu su keliais susijusiais paketais. Keletas dalykų pasikeitė ir dabar yra gana paprasta gauti visus planus visoms pagrindinėms funkcijoms.

Naudokite ankstesnio įrašo duomenis, kuriuos galite atsisiųsti iš „GitHub“ (jis nepasikeitė):

https://github.com/wcraytor/MLS_DATA

Norėdami gauti daugiau informacijos apie duomenų rinkinį, perskaitykite ankstesnį įrašą. Įdiekite ir iškelkite R (nenaudokite „R-Studio“). Įsitikinkite, kad įdiegti šie paketai:

          • Formulė
          • plotmo
          • MokymasDemos
          • GAM
          • mgcv
          • mda
          • MASĖ
          • žemė

Tada, darant prielaidą, kad atsisiuntėte duomenis į savo aplanką „c: \ data“, vykdykite:

      1.   biblioteka (žemė)
      2.   biblioteka (plotmo)
      3.   MyData = read.csv („c: \ data \ MyData.csv“, antraštė = TRUE)
      4.   MyData $ “Filtruotas adresas“ <- NULL # Svarbu !! Tai užtikrina, kad adresas bus pašalintas iš įvesties. Rašymas visiškai tas pats, su tuo pačiu atveju
      5.   x = data.frame (MyData [, 1: (ncol (MyData) -1)])
      6.   y = MyData [, ncol (MyData)]
      7.   b = žemė (x, y, nprune = 25) # max 25 bazinės funkcijos
      8.   santrauka (b, skaitmenys = 2, stilius = ”pmax”)
      9.   plotmo (b) # tai sukuria siužetą

Turėtumėte gauti:

y = # arba pardavimo kaina
    6.1e+05 #610,000 XNUMX USD bazinė vertė
+ 234 * pmax (0, 1887 - išpardavimas 
  - 455 * pmax (0, išpardavimas - 1887 m.) 

  + 591 * pmax (0, išpardavimo amžius - 2164)
  - 435 * pmax (0, išpardavimas - 4498 m.) 
  + 239 * pmax (0, išpardavimo amžius - 5439)
  + 49318 * pmax (0, srities ID - 652) 
  + 14475 * pmax (0, 654 - ploto ID) 
  - 66058 * pmax (0, srities ID - 654) 
  -120 * pmax (0, 1450 -LivingSqFt) # arba -120/sf nuo pagrindo, jei GLA yra mažesnis nei 1450 sf
  + 148 * pmax (0, LivingSqFt - 1450) # arba 148 USD, jei norite gauti GLA> 1450 sf
  -6.9 * pmax (0, 15041 -LotSize) # arba -6.90 USD/sf nuo bazės, jei partijos dydis mažesnis nei 15,041 XNUMX sf 
  + 6.2 * pmax (0, LotSize - 15041) # arba 6.20 USD/sf, jei norite daugiau nei 15,041 sf
  - 22086 * pmax (0, 2 - garažas)
  + 85767 * pmax (0, garažas - 2) # 85,767 2 USD iki bazės daugiau nei XNUMX automobilių garažui

Pasirinkta 15 iš 16 terminų ir 5 iš 9 numatytojų (nprune = 25)
Nutraukimo sąlyga: pasiekta 21
Svarba: „SaleAge“, „LivingSqFt“, „LotSize“, „AreaID“, „Garage“, nenaudojamas amžius,…
Terminų skaičius kiekvienu sąveikos laipsniu: 1 14 (priedinis modelis)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

1 pastaba. Didelis 85,767 3 USD/automobilio indėlis už 3+ automobilių garažus tikriausiai yra lygiagrečiai su statybos kokybe, nes 2+ automobilių garažai yra susiję su aukštesnės kokybės namais. Taigi turėtumėte pasistengti, kad 3 ir XNUMX automobilių garažai būtų atskiri, arba išsiaiškinti būdą, kaip sureguliuoti būklę. Tai gali būti problema arba ne, atsižvelgiant į likusius balus ir jų santykį su tikra kokybe (tai, ką turite vizualiai apžiūrėti ir nuspręsti).

2 pastaba. Tokie kintamieji kaip „AreaID“ tikriausiai turėtų būti laikomi kategoriniais kintamaisiais. Ir tai galima padaryti su žeme.  

„EarthPlot-1“