Johdanto datatieteeseen

Teknologiademo 1

Ennen ensimmäistä teknologiademoa opiskelijalta odotetaan:

  • Python-osaamista ja kehitysympäristö omalla koneella
  • Ymmärrystä paketinhallintajärjestelmistä

Asennettuna tulisi olla:

  • Python (mieluiten v3.6.x)
  • Anaconda (v5.1)
    • Anaconda ei ole pakollinen, mikäli esimerkiksi kovalevytilaa ei ole tarpeeksi, mutta erittäin hyödyllinen. Pycharm ajaa myös asiansa.

sekä seuraavat kirjastot:

Huom! Mikäli käytät Anacondaa, käytä myös Anacondan paketinhallintajärjestelmää eli conda:a esim. conda install numpy.

Lopuksi liittykää opintojakson Slack-kanavalle täältä.

Ensimmäinen esimerkki

Tehdään ohjelma, joka siivoaa likaista dataa käyttäen pandas-kirjastoa. Tutustutaan pandasin DataFrameihin ja siihen, miten niitä voidaan käsitellä. Jos aikaa riittää, tutustutaan myös matplotlib-kirjastoon ja kuvioiden piirtämiseen DataFrameista.

Ensimmäisen demon lähdekoodi löytyy tästä.

Written on March 2, 2018