Slušaj robot čitača
Pandas
Pandas je python-ov modul za analiziranje podataka. Vrlo je popularan i dobro povezan sa drugim modulima tako da je rad s njim vrlo lak.
Tipovi podataka u Pandas
Pandas nam daje dva tipa podataka, series, i dataframe. Series je prost, jednodimenzionalan tip podataka koji kreiramo od python listi
series shit+enter
1 maline
2 banane
dtype: object
Dataframe je dvodimenzionalni tip podataka, i mnogo se češće koristi. Za razliku od series, dataframe prima dictionary umesto liste:
df = pd.DataFrame({'Voće': series, 'Boje': boje}) enter
df shit+enter
0 jabuke zelena
1 maline crvena
2 banane žuta
Naravno, kada radimo sa velikim brojem podataka, poslednje što nam pada na pamet jeste da unosimo sve podatke kao serije, nego ćemo umesto toga koristiti podatke u pogodnoj formi, npr u csv fajlu (izaberite Unicode (UTF-8) enkoding prilikom otvaranja). Sada takav fajl možemo importovati u naš notebook pomoću:
voće
0 Jabuke Zelena 0
1 Maline Crvena 0
2 Banane Žuta 1
3 Kivi Zelena 1
4 Pomorandža Narandžasta 1
5 Lubenica Crvena 1
6 Šljiva Ljubičasta 0
7 Kajsija Narandžasta 0
8 Borovnica Plava 1
Importovanje podataka pomoću url-a
importovanje preko urlaEksportovanje DataFrame-a
voće.to_csv
prva komanda će kreirati fajl exportovano voće.csv i sačuvati ga među našim fajlovima. Druga naredba će samo prikazati sadržaj fajla.
Ako sada importujemo ovaj eksportovani fajl:
exvoće Shift+Enter
0 0 Jabuke Zelena 0
1 1 Maline Crvena 0
2 2 Banane Žuta 1
3 3 Kivi Zelena 1
4 4 Pomorandža Narandžasta 1
5 5 Lubenica Crvena 1
6 6 Šljiva Ljubičasta 0
7 7 Kajsija Narandžasta 0
8 8 Borovnica Plava 1
Videćemo da se kreirala nova kolona nazvana "Unnamed" u kojoj se nalaze redni brojevi naših redova.
Da bismo izbegli ovo dupliranje indexa, exportovanje bismo vršili na sledeći način:
Članak prvi put objavljen: 27.4.2021.
Poslednje izmene: 31.1.2022.
Autor: k.
