python tips en voorbeelden

Hier bewaar ik mijn tips, voorbeelden en aantekeningen over data analyse met Python. 

wrangling

CSV bestanden importeren

CSV is een veel voorkomend formaat voor het uitwisselen van datasets. Met Pandas kan je deze bestanden eenvoudig importeren.

Datum formaat en kenmerken

Bij het inlezen van CSV bestanden worden datums standaard als datatype object ingelezen. Na converteren van het datatype kan je eenvoudig de kalenderkenmerken van een datum afleiden.

Pandas category datatype

Datatype ‘category’ komt overeen met de statistische meetniveaus nominaal en ordinaal. Denk aan genre en review rating.

analyse en statistiek

kruistabel maken

Kruistabellen, ook wel draaitabellen genoemd, gebruik je voor het zoeken naar verbanden tussen variabelen en het weergeven van het verloop van numerieke waarden binnen een bepaalde periode.

Dataframe filteren met loc

Rijen selecteren uit een dataframe met .loc. Kies of je alle kolommen of een specifieke lijst als resultaat wilt zien.

Visualisatie