MENIU

PRADŽIA | APIE PUSLAPĮ | KONTAKTAI | AUTORINĖS TEISĖS

Similar page in ENGLISH is available HERE.

Search This Blog

Saturday, May 28, 2016

03 tema. Turimą lentelę papildome naujais duomenimis


Ši tema apie tai, kaip R programoje esančią lentelę papildyti nauju stulpeliu; kaip naujame sukurtame stulpelyje pateikti logaritmuotas ar vidutines pradinių lentelės duomenų reikšmes.

Ankstesnių užduočių metu dirbome su lentele, perkelta iš MS Excel failo. R pakete esančias lenteles galima keisti, pavyzdžiui, papildyti naujais stulpeliais. Ši tema būtent tam ir skirta. Pademonstruosiu, kaip R paketo lentelę papildyti nauju stulpeliu.

Prisiminkime ankstesnių užduočių metu sudarytą modelį (daugialypę tiesinę regresiją), kuris mums leidžia apskaičiuoti (prognozuoti), koks bus lengvojo automobilio išmetamas anglies dvideginio (CO2) kiekis (g / km), turint tam tikrą automobilio variklio tūrį (kubiniais cm, kitaip, cc), svorį (kg) ir pagaminimo metus (pvz., 2000).

Tarkime, galvojame sudaryti logaritminę regresiją, t. y. tame pačiame modelyje vietoje tikrų CO2, cc, svorio ir pagaminimo metų reikšmių naudoti logaritmuotas reikšmes. Logaritmuotų reikšmių naudojimas paprastai padidina modelio (bei prognozavimo) tikslumą.

Bandysime sudaryti tokį logaritminį modelį:

mod3 <- lm(logCO2 ~ logcc + logsvoris + logmetai, data=lentele2)

kur logCO2, logcc, logsvoris ir logmetai bus logaritmuotos reikšmės.

Papildykime savo turimą lentelę („lentele2“) logaritmuotais duomenimis. Kaip prisimename iš ankstesnės temos, mūsų lentelė yra įrašyta faile „pavyzdys.RData“. Atsidarykime šį failą.

Papildykime mūsų lentelę logaritmuota CO2 reikšme, įvesdami:

lentele2$logCO2 <- log10(lentele2$CO2)

ir spausdami „Enter“.

Tai reiškia, kad lentelėje („lentele2“) sukursime naują stulpelį „logCO2“, kurį užpildysime logaritmuotomis CO2 reikšmėmis (CO2 logaritmavimui imant iš „lentele2“).

Norėdami patikrinti, ar lentelė pasipildė logaritmuotomis CO2 reikšmėmis, įveskime:

show(lentele2)

ir spauskime „Enter“.

Matome, kad lentelė pasipildė nauju stulpeliu:


Tą patį pakartokime ir su kitais kintamaisiais, pavyzdžiui:

lentele2$logcc <- log10(lentele2$cc)

Papildę lentelę logaritmuotomis reikšmėmis vėliau galėsime sudaryti logaritminį modelį. Toliau pateikiu dar keletą naujų stulpelių įterpimo pavyzdžių:

lentele2$meanCO2 <- mean(lentele2$CO2); bus sukurtas stulpelis, kuriame bus pateiktas CO2 reikšmių vidurkis (visuose stulpelio langeliuose bus ta pati reikšmė);

lentele2$difCO2 <- lentele2$CO2 - lentele2$meanCO2; bus sukurtas stulpelis, kuriame bus pateiktas kiekvieno automobilio CO2 nuokrypis nuo CO2 vidurkio (kurį atspindi anksčiau apskaičiuotas meanCO2);

lentele2$difCO2 <- lentele2$CO2 - mean(lentele2$CO2); tai kitas būdas sukurti stulpelį, kuriame bus pateiktas kiekvieno automobilio CO2 nuokrypis nuo CO2 vidurkio (nereikia tarpinio žingsnio kuriant stulpelį su meanCO2).

Ar stulpeliai sukurti, galite patikrinti įvesdami:

show(lentele2)

Dabar belieka išsaugoti savo projektą, kad galėtume bet kada prie jo sugrįžti. Spaudžiame „File“, tada „Save workspace...“, ir išsaugojame .RData formatu, tuo pačiu pavadinimu „pavyzdys.RData“. Vėliau šią išsaugotą bylą galėsime bet kada atsidaryti, pavyzdžiui, per meniu punktą „Load Workspace“, ir tęsti duomenų analizę.

No comments:

Post a Comment