R earth Paket Güncellemesi (Ocak 2021)

Bu, Stephen Milborrow'un Eylül 2020'de güncellenen R-Language “dünya” paketindeki önceki gönderiye ve birkaç ilişkili pakete yapılan bir güncellemedir. Birkaç şey değişti ve artık tüm temel fonksiyonlar için tüm grafikleri almak oldukça kolay.

GitHub'dan indirebileceğiniz önceki gönderideki verileri kullanın (değişmedi):

https://github.com/wcraytor/MLS_DATA

Veri seti hakkında daha fazla bilgi için önceki gönderiyi okuyun. R'yi kurun ve açın (R-Studio'yu kullanmayın). Aşağıdaki paketlerin kurulu olduğundan emin olun:

          • formül
          • arsa
          • ÖğretimDemolar
          • gam
          • mgcv
          • mda
          • MASS
          • toprak

Ardından, verileri “c:\data\” klasörünüze indirdiğinizi varsayarak, yürütün:

      1.   kitaplık(toprak)
      2.   kitaplık
      3.   MyData = read.csv(“c:\data\MyData.csv”,başlık=DOĞRU)
      4.   MyData$”Filtrelenmişadres” <- NULL # Önemli!! Bu, adresin girişten kaldırılmasını sağlar. Aynı durumla tamamen aynı şekilde heceleyin
      5.   x=data.frame(MyData[,1:(ncol(MyData)-1)])
      6.   y=Verilerim[,ncol(Verilerim)]
      7.   b=toprak(x,y,nprune=25) # max 25 temel fonksiyon
      8.   özet(b,rakam=2,stil=”pmax”)
      9.   plotmo(b) # bu arsa yaratır

Almalısın:

y = # veya Satış Fiyatı
    6.1e+05 #610,000 $ temel değer
+ 234 * pmax(0, 1887 – SaleAge) 
  – 455 * pmax(0, SaleAge – 1887) 

  + 591 * pmax(0, SaleAge – 2164)
  – 435 * pmax(0, SaleAge – 4498) 
  + 239 * pmax(0, SaleAge – 5439)
  + 49318 * pmax(0, AreaID – 652) 
  + 14475 * pmax(0, 654 – Alan Kimliği) 
  – 66058 * pmax(0, AreaID – 654) 
  – 120 * pmax(0, 1450 – LivingSqFt) # veya 120 sf altındaki GLA için tabandan -1450/sf
  + 148 * pmax(0, LivingSqFt – 1450) # veya GLA > 148 sf için tabana 1450 $
  – 6.9 * pmax(0, 15041 – LotSize) # veya 6.90sf altındaki lot büyüklüğü için tabandan -$15,041/sf 
  + 6.2 * pmax(0, LotSize – 15041) # veya > 6.20sf için tabana 15,041$/sf
  – 22086 * pmax(0, 2 – Garaj) # 22,086 $/araba alttan 2 araçlık garaj için
  + 85767 * pmax(0, Garaj – 2) # 85,767'den fazla araba garajı için tabana 2 $

15 terimden 16'i ve 5 tahmin ediciden 9'i seçildi (nprune=25)
Sonlandırma koşulu: nk 21'e ulaşıldı
Önem: SaleAge, LivingSqFt, LotSize, AreaID, Garage, Age-kullanılmayan, …
Her etkileşim derecesindeki terim sayısı: 1 14 (toplamsal model)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

Not 1: 85,767+ araba garajı için araba başına 3$'lık büyük değer katkısı, 3+ araba garajı daha kaliteli evlerle ilişkilendirildiği için muhtemelen inşaat kalitesi ile paraleldir. Bu nedenle, kompozisyonlarda 2 ve 3 araba garajını ayrı tutmaya çalışmalı veya durum ayarlamalarıyla başa çıkmanın bir yolunu bulmalısınız. Kalan puanlara ve bunların gerçek kaliteyle (görsel olarak incelemeniz ve karar vermeniz gereken bir şey) ilişkisine bağlı olarak bu bir sorun olabilir veya olmayabilir.

Not 2: AreaID gibi değişkenler muhtemelen kategorik değişkenler olarak ele alınmalıdır. Ve bu Dünya ile yapılabilir.  

EarthPlot-1