Statistische analyse van een dataset
Voor onze eindopdracht van het vak “data lab” moesten we onze eigen data verzamelen voor bijna een maand. Deze moesten we dan analyseren en verschillende elementen uit halen.
Ik had gekozen om de prijzen van zowel benzine (95) en diesel bij te houden. Dit omdat ik nog maar vrij recent mijn rijbewijs heb gehaald en dit voor een nieuwe uitgave was waar ik rekening moest mee beginnen houden. Wanneer ik bij mijn vader ben, rij ik met een benzine wagen. Wanneer ik bij mijn moeder ben, rij ik met een diesel wagen. Vandaar de keuze om beide brandstof prijzen te onderzoeken. Ook vond ik het ook interessant om deze met elkaar te vergelijken.
Doordat ik dus 2 verschillende datasets bijhield konden Mattia en ik veel verschillende grafieken gebruiken om deze met elkaar te vergelijken. Ook konden we deze ook apart bekijken en de evolutie waarnemen per brandstof. Dit deden we natuurlijk allemaal via de tool Knime. Deze hebben we recent leren gebruiken in de lessen van data lab.
Persoonlijk vind ik de tool heel handig, omdat je op een heel vlotte manier je data kan analyseren via de verschillende nodes. Deze nodes gaven dan de opties om bijvoorbeeld te kijken naar welke brandstof zijn prijs het meest is gestegen of gedaald, of welke prijs het vaakst terug kwam. Ik wist nooit hoe je dit makkelijk kon berekenen. Dankzij Knime kon dit nu met een paar knoppen.
Op de afbeelding kunt u zien hoe Knime er uitziet en hoe de verschillende nodes vasthangen aan mijn data op excel.
Klik op het logo van Knime voor meer info over deze tool!