Ši tema apie tai, kaip R programoje esančią lentelę papildyti nauju stulpeliu; kaip naujame sukurtame stulpelyje pateikti logaritmuotas ar vidutines pradinių lentelės duomenų reikšmes.
Ankstesnių užduočių metu dirbome su lentele, perkelta iš MS Excel failo. R pakete esančias lenteles galima keisti, pavyzdžiui, papildyti naujais stulpeliais. Ši tema būtent tam ir skirta. Pademonstruosiu, kaip R paketo lentelę papildyti nauju stulpeliu.
Ankstesnių užduočių metu dirbome su lentele, perkelta iš MS Excel failo. R pakete esančias lenteles galima keisti, pavyzdžiui, papildyti naujais stulpeliais. Ši tema būtent tam ir skirta. Pademonstruosiu, kaip R paketo lentelę papildyti nauju stulpeliu.
Prisiminkime ankstesnių užduočių metu sudarytą modelį
(daugialypę tiesinę regresiją), kuris mums leidžia apskaičiuoti (prognozuoti),
koks bus lengvojo automobilio išmetamas anglies dvideginio (CO2) kiekis (g /
km), turint tam tikrą automobilio variklio tūrį (kubiniais cm, kitaip, cc),
svorį (kg) ir pagaminimo metus (pvz., 2000).
Tarkime, galvojame sudaryti logaritminę regresiją, t. y.
tame pačiame modelyje vietoje tikrų CO2, cc, svorio ir pagaminimo metų reikšmių
naudoti logaritmuotas reikšmes. Logaritmuotų reikšmių naudojimas paprastai
padidina modelio (bei prognozavimo) tikslumą.
Bandysime sudaryti tokį logaritminį modelį:
mod3 <- lm(logCO2 ~ logcc + logsvoris + logmetai,
data=lentele2)
kur logCO2, logcc, logsvoris ir logmetai bus logaritmuotos
reikšmės.
Papildykime savo turimą lentelę („lentele2“) logaritmuotais
duomenimis. Kaip prisimename iš ankstesnės temos, mūsų lentelė yra įrašyta
faile „pavyzdys.RData“. Atsidarykime šį failą.
Papildykime mūsų lentelę logaritmuota CO2 reikšme, įvesdami:
lentele2$logCO2 <- log10(lentele2$CO2)
ir spausdami „Enter“.
Tai reiškia, kad lentelėje („lentele2“) sukursime naują
stulpelį „logCO2“, kurį užpildysime logaritmuotomis CO2 reikšmėmis (CO2
logaritmavimui imant iš „lentele2“).
Norėdami patikrinti, ar lentelė pasipildė logaritmuotomis
CO2 reikšmėmis, įveskime:
show(lentele2)
ir spauskime „Enter“.
Matome, kad lentelė pasipildė nauju stulpeliu:
Tą patį pakartokime ir su kitais kintamaisiais, pavyzdžiui:
lentele2$logcc <- log10(lentele2$cc)
Papildę lentelę logaritmuotomis reikšmėmis vėliau galėsime
sudaryti logaritminį modelį. Toliau pateikiu dar keletą naujų stulpelių
įterpimo pavyzdžių:
lentele2$meanCO2 <- mean(lentele2$CO2); bus sukurtas
stulpelis, kuriame bus pateiktas CO2 reikšmių vidurkis (visuose stulpelio
langeliuose bus ta pati reikšmė);
lentele2$difCO2 <- lentele2$CO2 - lentele2$meanCO2; bus
sukurtas stulpelis, kuriame bus pateiktas kiekvieno automobilio CO2 nuokrypis
nuo CO2 vidurkio (kurį atspindi anksčiau apskaičiuotas meanCO2);
lentele2$difCO2 <- lentele2$CO2 - mean(lentele2$CO2); tai
kitas būdas sukurti stulpelį, kuriame bus pateiktas kiekvieno automobilio CO2
nuokrypis nuo CO2 vidurkio (nereikia tarpinio žingsnio kuriant stulpelį su
meanCO2).
Ar stulpeliai sukurti, galite patikrinti įvesdami:
show(lentele2)
Dabar belieka išsaugoti savo projektą, kad galėtume bet kada
prie jo sugrįžti. Spaudžiame „File“, tada „Save workspace...“, ir išsaugojame
.RData formatu, tuo pačiu pavadinimu „pavyzdys.RData“. Vėliau šią išsaugotą
bylą galėsime bet kada atsidaryti, pavyzdžiui, per meniu punktą „Load
Workspace“, ir tęsti duomenų analizę.
No comments:
Post a Comment