Kurssilla opitaan:
Ymmärtämään ja tuntemaan:
- Rakenteellisen, osittain rakenteellisen ja rakenteettoman datan erot, ja miten se vaikuttaa datan käsittelyyn.
- Ymmärtämään mitä ovat datasetit ja miten niitä käytetään ja muokataan eri käyttötarpeisiin kuten data-analyysiä varten.
- Mitä on dimensiopohjainen datan mallinnus sekä sen perusteita
Tuntemaan, tietämään ja tunnistamaan:
- Joitakin dataformaatti-standardeja ja niiden käyttökohteita,
- tunnistamaan datan eri muodot (masterdata, transaktiodata, reference data, temporary data, meta data).
Tekemään:
- Datan käsittelyä kuten: suodattamista, puhdistusta, validointia, kohdistamista, rikastusta, muuttamista muodosta toiseen.
- Suunnittelemaan skeeman käyttötarkoitukseen.
- Muuntamaan datan tiedostoformaatista toiseen ohjelmallisesti.
Lisäksi kurssi kehittää:
- Ongelmanratkaisu- ja päätöksentekotaidot: kuinka jakaa datan (esi)käsittely vaiheisiin vaatimusten perusteella
- etiikka, vastuullisuus ja kestävä kehitys: miten tietojenkäsittely toteutetaan energiatehokkaasti, miten suojataan käyttäjien ja muiden henkilöiden yksityisyyttä, miten tunnistetaan salassa pidettävät tiedot.
- digitaaliset taidot: ohjelmointi