Johdanto datatieteeseen
Teknologiademo 1
Ennen ensimmäistä teknologiademoa opiskelijalta odotetaan:
- Python-osaamista ja kehitysympäristö omalla koneella
- Ymmärrystä paketinhallintajärjestelmistä
Asennettuna tulisi olla:
- Python (mieluiten v3.6.x)
- Anaconda (v5.1)
- Anaconda ei ole pakollinen, mikäli esimerkiksi kovalevytilaa ei ole tarpeeksi, mutta erittäin hyödyllinen. Pycharm ajaa myös asiansa.
sekä seuraavat kirjastot:
Huom! Mikäli käytät Anacondaa, käytä myös Anacondan paketinhallintajärjestelmää eli conda:a esim. conda install numpy.
Lopuksi liittykää opintojakson Slack-kanavalle täältä.
Ensimmäinen esimerkki
Tehdään ohjelma, joka siivoaa likaista dataa käyttäen pandas-kirjastoa. Tutustutaan pandasin DataFrameihin ja siihen, miten niitä voidaan käsitellä. Jos aikaa riittää, tutustutaan myös matplotlib-kirjastoon ja kuvioiden piirtämiseen DataFrameista.
Ensimmäisen demon lähdekoodi löytyy tästä.
Written on March 2, 2018
