MENIU

PRADŽIA | APIE PUSLAPĮ | KONTAKTAI | AUTORINĖS TEISĖS

Similar page in ENGLISH is available HERE.

Search This Blog

Monday, June 27, 2016

08 tema. Dar kartą "Subset"

Ši tema apie tai, kaip R statistinėje programoje sukurti naują lentelę turimos lentelės pagrindu; kaip į kuriamą naują lentelę perkelti tik tam tikrus kriterijus atitinkančius įrašus; kaip išrinkti tik tam tikrus įrašus iš turimos lentelės; kaip naudoti subset() funkciją.

Ankstesnių užduočių metu, norėdami iš mūsų lentelės pašalinti nereikalingus stulpelius, panaudojome komandą „subset“. Pavyzdžiui:

lentele2 <- subset(lentele2, select = -c(logCO2, logcc, logsvoris, logmetai))

Šia komanda paprašėme iš lentelės „lentele2“ ištrinti iš karto 4 stulpelius (logCO2, logcc, logsvoris, logmetai).

Funkciją „subset“ galima panaudoti ir kitais tikslais.

Atsidarykime failą „pavyzdys.RData“, kurį naudojome ankstesnių užduočių metu. Faile turime lentelę „lentele2“, kurią galime pamatyti panaudodami komandą „show(lentele2)“:


Naudodami „subset“, iš mūsų lentelės („lentele2“) galime išrinkti mus dominančius įrašus. Pavyzdžiui, išrinkime automobilius, kurių išmetamas CO2 kiekis yra mažesnis nei 110 g / km. Tam panaudojame komandą:

lentele3 <- subset(lentele2, CO2 < 110, select=c(CO2, cc, svoris, metai))

Ši komanda sukurs naują lentelę („lentele3“), į kurią iš lentelės „lentele2“ bus perkelti tik tie automobiliai, kurie tenkins sąlygą „CO2 < 110“, o perkelta informacija apims šiuos stulpelius („select=c“): CO2, cc, svoris, metai.

Komanda „show(lentele3)“ leis peržiūrėti sukurtą naują lentelę („lentele3“):


Matome, kad tik du automobiliai iš mūsų analizuojamų 212 benzininių automobilių išmeta mažiau nei 110 g / km CO2. Pažiūrėkime, kiek mūsų duomenų bazėje bus automobilių, kurių išmetamas CO2 kiekis sudaro nuo 110 (imtinai) iki 120 g / km. Panaudokime komandą:

lentele3 <- subset(lentele2, CO2 >= 110 & CO2 < 120, select= c(CO2, cc, svoris, metai))

Kaip matote, panaudojome dvi paieškos sąlygas. Norime, kad kiekvienas automobilis atitiktų jas abi (atvejis „IR“), tad sąlygas sujungiame „&“ ženklu. Komanda „show(lentele3)“ leis peržiūrėti atnaujintą lentelę („lentele3“) (atnaujinant senoji lentelė „lentele3“ buvo ištrinta ir pakeista nauja lentele „lentele3“):


Matome, kad keturi automobiliai atitiko mūsų paieškos kriterijus. Tarkime, norime pasižiūrėti, kiek yra automobilių, atspindinčių kraštutinius atvejus, t. y. labai mažai ir labai daug teršiančių automobilių. Toliau pateikta komanda atrinks automobilius, kurie išmeta arba ne mažiau nei 290 g / km CO2, arba mažiau nei 130 g / km CO2:

lentele3 <- subset(lentele2, CO2 >= 290 | CO2 < 130, select= c(CO2, cc, svoris, metai))

Vėl panaudojome dvi paieškos sąlygas. Tačiau šiuo atveju prašome ieškoti „ARBA, ARBA“ (o ne „IR“), todėl sąlygas sujungiame „|“ ženklu. Komanda „show(lentele3)“ leis peržiūrėti atnaujintą lentelę:


Dabar belieka išsaugoti savo projektą, kad galėtume bet kada prie jo sugrįžti. Spaudžiame „File“, tada „Save workspace...“, ir išsaugojame .RData formatu, tuo pačiu pavadinimu „pavyzdys.RData“. Vėliau šią išsaugotą bylą galėsime bet kada atsidaryti, pavyzdžiui, per meniu punktą „Load Workspace“ (arba paprasčiausiai spustelėdami ant mūsų aplanke esančio failo „pavyzdys.RData“), ir tęsti duomenų analizę.

No comments:

Post a Comment