Ankstesnių užduočių metu savo lentelę („lentele2“) papildėme logaritmuotomis visų mūsų analizuojamų kintamųjų reikšmėmis, todėl dabar galime pereiti prie logaritminės regresijos kūrimo. Logaritmuotų reikšmių pasitelkimas paprastai padidina modelio (o kartu ir prognozavimo) tikslumą.
Kaip prisimename iš ankstesnės temos, mūsų lentelė yra įrašyta faile „pavyzdys.RData“. Atsidarykime šį failą. Komanda „show(lentele2)“ R lange pateiks mūsų lentelę, kuri bus naudojama kuriant modelį:
Sukurkime logaritminį modelį įvesdami toliau nurodytą komandą:
mod3 <- lm(logCO2 ~ logcc + logsvoris + logmetai, data=lentele2)
kur:
mod3 yra modeliui suteiktas pavadinimas (šiuo pavadinimu mes kreipsimės į mūsų modelį);
lm reiškia, kad modelis bus tiesinis, tačiau, kaip matome, modelyje bus naudojamos logaritmuotos reikšmės (logCO2, logcc, logsvoris ir logmetai); modelį galima apibūdinti taip: logCO2 = a + b1 * logcc + b2 * logsvoris + b3 * logmetai + paklaida.
Norėdami pamatyti sukurto modelio parametrus įveskime komandą:
summary(mod3)
ir spauskime „Enter“. Modelio parametrai atsiras R paketo
lange (žr. žemiau).
Kaip matome, modelis yra toks: logCO2 = 110.43980 + 0.36388 * logcc + 0.50730 * logsvoris - 33.62460 * logmetai
Visi aiškinantieji kintamieji sudarytame
modelyje yra naudingi, kadangi Pr(>|t|) reikšmė visų kintamųjų atveju yra
praktiškai nulinė. Determinacijos koeficientas („R-squared“) yra iš esmės toks pats kaip modelio „mod2“ (kuriame mes naudojome faktines, o ne logaritmuotas reikšmes) atveju. Tačiau dėl logaritmuotų reikšmių naudojimo modelio „mod3“ tikslumas nuspėjant CO2 reikšmę greičiausiai bus didesnis.
O dabar atskleisiu, kad norint sukurti logaritminį modelį visai nebuvo būtina mūsų lentelėje („lentele2“) kurti naujų stulpelių su logaritmuotomis kintamųjų CO2, cc, svoris ir metai reikšmėmis. Pabandykite šią komandą:
mod4 <- lm(log10(CO2) ~ log10(cc) + log10(svoris) + log10(metai), data= lentele2)
Ši komanda pati konvertuoja pradines faktines mūsų kintamųjų reikšmes į logaritmuotas reikšmes ir sukuria mūsų logaritminį modelį jau naudojant konvertuotas (logaritmuotas) reikšmes.
Žvilgtelėkime į ką tik sukurto modelio „mod4“ parametrus:
summary(mod4)
Kaip matote, mod4 yra toks pats kaip mod3:
Dabar belieka išsaugoti savo projektą, kad galėtume bet kada prie jo sugrįžti. Spaudžiame „File“, tada „Save workspace...“, ir išsaugojame .RData formatu, tuo pačiu pavadinimu „pavyzdys.RData“. Vėliau šią išsaugotą bylą galėsime bet kada atsidaryti, pavyzdžiui, per meniu punktą „Load Workspace“ (arba paprasčiausiai spustelėdami ant mūsų aplanke esančio failo „pavyzdys.RData“), ir tęsti duomenų analizę.
No comments:
Post a Comment