Die R-taal “aarde” -pakket

Verlede jaar het Minitab Salford Systems gekoop en die prys van al hul pakkette verhoog. In die besonder kos dit nou ongeveer $ 15,000 om hul MARS -pakket aan te koop, wat dit buite die bereik van die meeste waardeerders waardeer.

Die naaste plaasvervanger vir Salford Systems MARS -pakket is die R -taalpakket "aarde". Toe ek dit ongeveer 12 jaar gelede laas gebruik het, het dit egter nie bevredigende modelle gelewer nie. Dit is egter verskeie kere opgegradeer deur Stephen Milborrow.

Alhoewel ek 'n groot voordeel het vir die jaarlikse opgraderings van Salford Sytems MARS teen die ou lae fooi, sou ek graag na MARS -tegnieke in waardasies, artikels en miskien kursusse vir ander waardeerders kon verwys. Dit is dus nodig om te weet of daar 'n alternatiewe MARS -toepassing vir ander waardeerders, beoordelaars en kliënte beskikbaar is. Daarom het ek hierdie naweek tyd geneem om na die nuutste weergawe van R/earth te kyk.

Die goeie nuus is dat die nuutste weergawe van R/earth nou modelle bied wat redelik vergelykbaar lyk met dié van Salford Sytems MARS. Dit is ook baie vinnig. Ek moet waarsku dat ek die produk van Salford Systems sedert 2003 gebruik het, en ek is redelik goed in die aanpassing van die talle parameters. Aan die ander kant is ek nie naastenby so ervare met die aardpakket nie. Ek is dus seker dat ek met meer ervaring waarskynlik meer aanpassings van die R/earth -parameters en ondersteunende pakkette sou kon doen om beter resultate en meer uitset te behaal. Alhoewel ek geneig is om te glo dat die Salford Systems -pakket makliker is om te gebruik en meer robuust is, kan ek nie met sekerheid sê sonder meer uitgebreide ervaring met R en aarde nie.

Tog kom ek tot die gevolgtrekking dat die nuutste aardpakket baie goed is en 'n baie nuttige en produktiewe hulpmiddel vir gevorderde waardeerders moet wees.

Ek het 'n datastel opgelaai met 'n deelversameling van die velde vir verkoopstransaksies vir verskeie MLS -gebiede in Pacifica, vanaf 30 Januarie 2001 tot 30 Januarie 2018. U kan dit vind op:

https://github.com/wcraytor/MLS_DATA

Hierdie openbare GitHub-gids bevat die data as MyData.csv, 'n sigblad-aan-sy-vergelyking van die uitset van die aarde en Mars, 'n lys van die R/earth-opdragte wat gebruik is en 'n verslag van die Salford Systems MARS-weergawe met grafieke. Die grafieke vir die R/aarde -uitset moet soortgelyk lyk, hoewel dit nie soveel basiese funksies genereer nie.

Hoe om die aarde te gebruik:

Plaas u data in 'n CSV. Ek beveel aan dat al die kolomme data bevat vir voorspelling in die kolomme links, en die teiken veranderlike, die veranderlike wat u wil voorspel, in die kolom regs. Vermy die plasing van ander data in die sigblad. Gebruik slegs een vel om dinge eenvoudig te hou.
As u die vorige stap volg en aanvaar dat u data in 'n sigblad gestoor is as C: \ Data \ MyData.csv, gebruik die volgende R -opdragte

MyData = read.csv (“d: \ data \ MyData.csv”, header = TRUE)

x = data.frame (MyData [, 1: (ncol (MyData) -1)])
y = MyData [, ncol (MyData)]
b = aarde (x, y, nprune = 12)
opsomming (b, syfers = 2, styl = ”pmax”)
Bogenoemde produseer vinnig die volgende model:

y =  610,000 +

+ 234 * pmax (0, 1887 - SaleAge) // “SaleAge” is dae COE voor 1/30/2018
- 455 * pmax (0, SaleAge - 1887)
+ 591 * pmax (0, SaleAge - 2164)
- 435 * pmax (0, SaleAge - 4498)
+ 239 * pmax (0, SaleAge - 5439)

+ 49318 * pmax (0, AreaID - 652)
+ 14475 * pmax (0, 654 - AreaID)
- 66058 * pmax (0, AreaID - 654)

- 120 * pmax (0, 1450 - LivingSqFt)
+ 148 * pmax (0, LivingSqFt - 1450)

- 6.9 * pmax (0, 15041 - LotSize)
+ 6.2 * pmax (0, LotSize - 15041)

- 22086 * pmax (0, 2 - Garage)
+ 85767 * pmax (0, motorhuis - 2)

  • Hierdie modelle het 'n gerapporteerde R2 of ongeveer 0.82. Die Salford Systems -model het 'n hoër R2 van meer as 0.84 en bied 'n ietwat beter model - waarskynlik as gevolg van my meer uitgebreide ervaring daarmee.

    GEVOLGTREKKING: Waardeerders vind die R/earth -pakket redelik voldoende vir beoordelingswerk met behulp van Multivariate Adaptive Regaression Splines (MARS).

Voetnoot: Aarde word 'aarde' genoem omdat Salford Systems 'n handelsmerk op hul MARS -sagtewarepakket geplaas het en niemand anders as 'n etiket vir 'n sagtewaretoepassing kon toelaat nie. Daarom, "aarde".

http://www.milbo.org/doc/earth-notes.pdf

Lewer Kommentaar

Vertaal »