Cập nhật gói R earth (tháng 2021 năm XNUMX)

Đây là bản cập nhật cho bài đăng trước về gói “trái đất” Ngôn ngữ R của Stephen Milborrow, được cập nhật vào tháng 2020 năm XNUMX, cùng với một số gói liên quan. Một vài thứ đã thay đổi và bây giờ khá dễ dàng để có được tất cả các lô cho tất cả các chức năng cơ bản.

Sử dụng dữ liệu từ bài đăng trước mà bạn có thể tải xuống từ GitHub (nó không thay đổi):

https://github.com/wcraytor/MLS_DATA

Đọc bài trước để biết thêm thông tin về tập dữ liệu. Cài đặt và mở R (không sử dụng R-Studio). Đảm bảo các gói sau được cài đặt:

          • Công thức
          • âm mưu
          • TeachingDemos
          • trò chơi
          • mgcv
          • mda
          • MASS
          • trái đất

Sau đó, giả sử bạn đã tải dữ liệu xuống thư mục “c: \ data \”, hãy thực thi:

      1.   thư viện (trái đất)
      2.   thư viện (plotmo)
      3.   MyData = read.csv (“c: \ data \ MyData.csv”, header = TRUE)
      4.   MyData $ ”Filteredaddress” <- NULL # Quan trọng!! Điều này đảm bảo địa chỉ được xóa khỏi đầu vào. Đánh vần hoàn toàn giống nhau, với cùng một trường hợp
      5.   x = data.frame (MyData [, 1: (ncol (MyData) -1)])
      6.   y = MyData [, ncol (MyData)]
      7.   b = earth (x, y, nprune = 25) # hàm cơ bản tối đa 25
      8.   tóm tắt (b, chữ số = 2, style = ”pmax”)
      9.   plotmo (b) # điều này tạo ra cốt truyện

Bạn sẽ nhận được:

y = # hoặc Giá bán
    6.1e + 05 #Giá trị cơ bản $ 610,000
+ 234 * pmax (0, 1887 - SaleAge) 
  - 455 * pmax (0, SaleAge - 1887) 

  + 591 * pmax (0, SaleAge - 2164)
  - 435 * pmax (0, SaleAge - 4498) 
  + 239 * pmax (0, SaleAge - 5439)
  + 49318 * pmax (0, AreaID - 652) 
  + 14475 * pmax (0, 654 - AreaID) 
  - 66058 * pmax (0, AreaID - 654) 
  - 120 * pmax (0, 1450 - LivingSqFt) # hoặc -120 / sf từ cơ sở cho GLA dưới 1450 sf
  + 148 * pmax (0, LivingSqFt - 1450) # hoặc $ 148 để làm cơ sở cho GLA> 1450 sf
  - 6.9 * pmax (0, 15041 - LotSize) # hoặc - $ 6.90 / sf từ cơ sở cho kích thước lô dưới 15,041sf 
  + 6.2 * pmax (0, LotSize - 15041) # hoặc $ 6.20 / sf để cơ sở cho> 15,041sf
  - 22086 * pmax (0, 2 - Nhà để xe) # $ 22,086 / ô tô từ cơ sở cho nhà để xe dưới 2 ô tô
  + 85767 * pmax (0, Nhà để xe - 2) # 85,767 đô la để làm cơ sở cho hơn 2 nhà để xe ô tô

Đã chọn 15 trong số 16 thuật ngữ và 5 trong số 9 yếu tố dự đoán (nprune = 25)
Điều kiện kết thúc: Đã đạt nk 21
Tầm quan trọng: SaleAge, LivingSqFt, LotSize, AreaID, Garage, Age-chưa sử dụng,…
Số thuật ngữ ở mỗi mức độ tương tác: 1 14 (mô hình phụ gia)

GCV 6.1e + 09 RSS 9.4e + 12    GRSq 0.82 RSq 0.83

Lưu ý 1: Khoản đóng góp giá trị lớn $ 85,767 / xe hơi cho 3+ gara ô tô có lẽ phù hợp với chất lượng xây dựng vì 3+ gara ô tô được liên kết với những ngôi nhà chất lượng cao hơn. Vì vậy, bạn nên cố gắng tách biệt 2 và 3 ga ra ô tô trong khu vực hoặc tìm cách giải quyết khi điều chỉnh tình trạng. Điều này có thể là một vấn đề hoặc có thể không, tùy thuộc vào điểm số còn lại và mối quan hệ của chúng với chất lượng thực tế (điều gì đó bạn phải kiểm tra trực quan và quyết định).

Lưu ý 2: Các biến như AreaID có thể nên được coi là một biến phân loại. Và điều này có thể được thực hiện với Earth.  

EarthPlot-1