python voorbeeld

Controleren op ontbrekende waarden

Ontbrekende gegevens kunnen een enorme impact hebben op de uitkomsten van jouw data analyse. Gebruik onderstaande code om het aantal ontbrekende waarden per kolom te tellen.

# Heeft een dataframe ontbrekende waarden?
df.isnull().values.any()
# Totaal aantal ontbrekende waarden.
df.isnull().sum().sum()
# Ontbrekende waarden per kolom.
df.isnull().sum()
# Welke kolommen hebben ontbrekende waarden?
df.isnull().any()
# Toon 3 willekeurige rijen met ontbrekende waarden.
df[df.isnull().any(axis=1)].sample(3)
# Toon eerste 5 rijen met ontbrekende waarden in een specifieke kolom.
df[df['Age'].isnull()].sample(3)
data als grondstof

Data gedreven

Verkennende onderzoeken, segmenteren, samenhang, verklarende analyses en/of toepassen van algoritmes
Lees verder