อัพเดทแพ็คเกจ R Earth (มกราคม 2021)

นี่คือการอัปเดตของโพสต์ก่อนหน้าในแพ็คเกจ R-Language “earth” ของ Stephen Milborrow ซึ่งได้รับการอัปเดตในเดือนกันยายนปี 2020 พร้อมด้วยแพ็คเกจที่เกี่ยวข้องหลายรายการ มีการเปลี่ยนแปลงบางอย่าง และตอนนี้มันค่อนข้างง่ายที่จะได้แปลงทั้งหมดสำหรับฟังก์ชันพื้นฐานทั้งหมด

ใช้ข้อมูลจากโพสต์ก่อนหน้าซึ่งคุณสามารถดาวน์โหลดได้จาก GitHub (ไม่มีการเปลี่ยนแปลง):

https://github.com/wcraytor/MLS_DATA

อ่านโพสต์ก่อนหน้าสำหรับข้อมูลเพิ่มเติมเกี่ยวกับชุดข้อมูล ติดตั้งและเรียกใช้ R (อย่าใช้ R-Studio) ตรวจสอบให้แน่ใจว่าได้ติดตั้งแพ็คเกจต่อไปนี้:

     • สูตร
     • พล็อตโม
     • สาธิตการสอน
     • เกม
     • mgcv
     • mda
     • MASS
     • โลก

จากนั้น สมมติว่าคุณดาวน์โหลดข้อมูลไปยังโฟลเดอร์ “c:\data\” แล้ว ให้ดำเนินการ:

   1.   ห้องสมุด(โลก)
   2.   ห้องสมุด (พล็อตโม)
   3.   MyData = read.csv(“c:\data\MyData.csv”,header=TRUE)
   4.   MyData$”ที่อยู่ตัวกรอง” <- NULL # สำคัญ!! เพื่อให้แน่ใจว่าที่อยู่ถูกลบออกจากอินพุต สะกดเหมือนกันทุกประการกับกรณีเดียวกัน
   5.   x=data.frame(MyData[,1:(ncol(MyData)-1)])
   6.   y=MyData[,ncol(MyData)]
   7.   b=earth(x,y,nprune=25) # สูงสุด 25 ฟังก์ชันพื้นฐาน
   8.   สรุป(b,digits=2,style=”pmax”)
   9.   plotmo(b) # สิ่งนี้สร้างพล็อต

คุณควรได้รับ:

y = # หรือราคาขาย
    6.1e+05 #มูลค่าฐาน $610,000
+ 234 * pmax(0, 1887 – SaleAge) 
  – 455 * pmax(0, SaleAge – 1887) 

  + 591 * pmax(0, SaleAge – 2164)
  – 435 * pmax(0, SaleAge – 4498) 
  + 239 * pmax(0, SaleAge – 5439)
  + 49318 * pmax(0, AreaID – 652) 
  + 14475 * pmax(0, 654 – AreaID) 
  – 66058 * pmax(0, AreaID – 654) 
  – 120 * pmax(0, 1450 – LivingSqFt) # หรือ -120/sf จากฐานสำหรับ GLA ต่ำกว่า 1450 sf
  + 148 * pmax(0, LivingSqFt – 1450) # หรือ $148 เป็นฐานสำหรับ GLA > 1450 sf
  – 6.9 * pmax(0, 15041 – LotSize) # หรือ -$6.90/sf จากฐานสำหรับขนาดล็อตต่ำกว่า 15,041sf 
  + 6.2 * pmax(0, LotSize – 15041) # หรือ $6.20/sf เป็นฐานสำหรับ > 15,041sf
  – 22086 * pmax(0, 2 – Garage) # $22,086/รถจากฐานสำหรับโรงรถไม่เกิน 2 คัน
  + 85767 * pmax(0, Garage – 2) # $85,767 เป็นฐานสำหรับโรงรถมากกว่า 2 คัน

เลือก 15 จาก 16 คำและ 5 จาก 9 คำทำนาย (nprune=25)
เงื่อนไขการยกเลิก: ถึง nk 21
ความสำคัญ: SaleAge, LivingSqFt, LotSize, AreaID, Garage, Age-unused, ...
จำนวนเทอมในแต่ละระดับของการโต้ตอบ: 1 14 (โมเดลเพิ่มเติม)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

หมายเหตุ 1: การบริจาคมูลค่ามหาศาลที่ 85,767 เหรียญสหรัฐฯ ต่อคันสำหรับอู่ซ่อมรถ 3 แห่งขึ้นไปน่าจะใกล้เคียงกับคุณภาพของการก่อสร้าง เนื่องจากอู่ซ่อมรถ 3 แห่งขึ้นไปมีความเกี่ยวข้องกับบ้านที่มีคุณภาพสูงกว่า ดังนั้นคุณควรพยายามแยกโรงจอดรถ 2 และ 3 แห่งไว้ในคอมพ์หรือหาวิธีจัดการกับการปรับสภาพ นี่อาจเป็นปัญหาหรือไม่ก็ได้ ขึ้นอยู่กับคะแนนที่เหลือและความสัมพันธ์กับคุณภาพที่แท้จริง (สิ่งที่คุณต้องตรวจสอบและตัดสินใจด้วยสายตา)

หมายเหตุ 2: ตัวแปรเช่น AreaID น่าจะถือเป็นตัวแปรหมวดหมู่ และสิ่งนี้สามารถทำได้ด้วย Earth  

EarthPlot-1