Ενημέρωση πακέτου R earth (Ιανουάριος 2021)

Αυτή είναι μια ενημέρωση στην προηγούμενη ανάρτηση για το πακέτο Stephen Milborrow R-Language “earth” που ενημερώθηκε τον Σεπτέμβριο του 2020, μαζί με πολλά σχετικά πακέτα. Μερικά πράγματα έχουν αλλάξει και είναι πλέον αρκετά εύκολο να αποκτήσετε όλα τα γραφήματα για όλες τις βασικές λειτουργίες.

Χρησιμοποιήστε τα δεδομένα από την προηγούμενη ανάρτηση, τα οποία μπορείτε να κατεβάσετε από το GitHub (δεν έχει αλλάξει):

https://github.com/wcraytor/MLS_DATA

Διαβάστε την προηγούμενη ανάρτηση για περισσότερες πληροφορίες σχετικά με το σύνολο δεδομένων. Εγκαταστήστε και εμφανίστε το R (μην χρησιμοποιείτε το R-Studio). Βεβαιωθείτε ότι έχουν εγκατασταθεί τα ακόλουθα πακέτα:

          • Τύπος
          • plotmo
          • ΔιδασκαλίαDemos
          • gam
          • mgcv
          • MDA
          • MASS
          • γη

Στη συνέχεια, υποθέτοντας ότι έχετε κατεβάσει τα δεδομένα στο φάκελό σας "c: \ data \", εκτελέστε:

      1.   βιβλιοθήκη (γη)
      2.   βιβλιοθήκη (plotmo)
      3.   MyData = read.csv ("c: \ data \ MyData.csv", header = TRUE)
      4.   MyData $ ”Filteredaddress” <- NULL # Σπουδαίος!! Αυτό διασφαλίζει ότι η διεύθυνση έχει αφαιρεθεί από την είσοδο. Συλλαβίζει ακριβώς το ίδιο, με την ίδια θήκη
      5.   x = data.frame (MyData [, 1: (ncol (MyData) -1)]])
      6.   y = MyData [, ncol (MyData)]
      7.   b = γη (x, y, nprune = 25) # max 25 συναρτήσεις βάσης
      8.   περίληψη (b, ψηφία = 2, style = ”pmax”)
      9.   plotmo (b) # αυτό δημιουργεί την πλοκή

Θα πρέπει να λάβετε:

y = # ή η τιμή πώλησης
    6.1e+05 #610,000 $ βασική αξία
+ 234 * pmax (0, 1887 - SaleAge) 
  - 455 * pmax (0, SaleAge - 1887) 

  + 591 * pmax (0, SaleAge - 2164)
  - 435 * pmax (0, SaleAge - 4498) 
  + 239 * pmax (0, SaleAge - 5439)
  + 49318 * pmax (0, AreaID - 652) 
  + 14475 * pmax (0, 654 - AreaID) 
  - 66058 * pmax (0, AreaID - 654) 
  -120 * pmax (0, 1450 -LivingSqFt) # ή -120/sf από τη βάση για GLA κάτω από 1450 sf
  + 148 * pmax (0, LivingSqFt - 1450) # ή $ 148 για βάση για GLA> 1450 sf
  -6.9 * pmax (0, 15041 -LotSize) # ή -6.90 $/sf από τη βάση για κάτω από 15,041sf μέγεθος παρτίδας 
  + 6.2 * pmax (0, LotSize - 15041) # ή $ 6.20/sf στη βάση για> 15,041sf
  - 22086 * pmax (0, 2 - Garage) # 22,086 $/αυτοκίνητο από τη βάση για γκαράζ κάτω από 2 αυτοκίνητα
  + 85767 * pmax (0, Γκαράζ - 2) # 85,767 $ στη βάση για πάνω από 2 γκαράζ αυτοκινήτων

Επιλέχθηκαν 15 από 16 όρους και 5 από 9 προγνωστικά (nprune = 25)
Συνθήκη τερματισμού: Έφτασε nk 21
Σημασία: SaleAge, LivingSqFt, LotSize, AreaID, Garage, Age-unused,…
Αριθμός όρων σε κάθε βαθμό αλληλεπίδρασης: 1 14 (πρόσθετο μοντέλο)

GCV 6.1e+09 RSS 9.4e+12    GRSq 0.82 RSq 0.83

Σημείωση 1: Η μεγάλη συμβολή αξίας 85,767 $/αυτοκίνητο για 3+ γκαράζ αυτοκινήτων πιθανότατα είναι γραμμική με την ποιότητα κατασκευής καθώς 3+ γκαράζ αυτοκινήτων σχετίζονται με σπίτια υψηλότερης ποιότητας. Επομένως, θα πρέπει να προσπαθήσετε να διατηρήσετε 2 και 3 γκαράζ αυτοκινήτων χωριστά στις συσκευές ή να βρείτε έναν τρόπο αντιμετώπισης των προσαρμογών της κατάστασης. Αυτό μπορεί να είναι ή να μην είναι πρόβλημα, ανάλογα με τις υπολειπόμενες βαθμολογίες και τη σχέση τους με την πραγματική ποιότητα (κάτι που πρέπει να ελέγξετε οπτικά και να αποφασίσετε).

Σημείωση 2: Μεταβλητές όπως το AreaID θα πρέπει πιθανώς να αντιμετωπίζονται ως κατηγορικές μεταβλητές. Και αυτό μπορεί να γίνει με τη Γη.  

EarthPlot-1