<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=266259327823226&amp;ev=PageView&amp;noscript=1">
Skip to content

Työ massojen parissa

Markus Laurén työskentelee Data Engineerinä Cloud1:llä. Hänen tehtävänsä liittyvät datamassojen liikuttamiseen, muovaamiseen ja varastoimiseen. Organisaatioille eri paikkoihin kertynyt data tunnistetaan, tuodaan toivottuun paikkaan, muokataan ja ladataan haluttuun pisteeseen, jotta tietovarastoa pystytään hyödyntämään esimerkiksi raportoinnin tai ennustamisen tarpeisiin.

Markus työskentelee pääasiassa Microsoftin tuotteiden parissa. SQL Server Integration Services – tuttavallisemmin SSIS – on pääasiallinen työväline, jolla datamassat liikkuvat, muuntuvat ja jolla ne voidaan tallentaa haluttuun kohdejärjestelmään. SSIS on työväline laajojen integrointi- ja tiedonsiirtojärjestelmien rakentamiseen.

Ostohistoriaa ja testituloksia

Data Engineerin tehtävässä on hyödyksi, jos ymmärtää tietovarastoinnin ja datan lisäksi myös liiketoimintaa. Se on tarpeen, jotta voi hahmottaa millaista dataa miltäkin toimialalta voi mahdollisesti kertyä, mistä sitä tulisi etsiä ja mitä sillä voi tehdä. Eri alat tuottavat erilaista aineistoa. Esimerkiksi kaupan alan tuottama data poikkeaa täysin vaikkapa terveydenhoitoalan tuottamasta materiaalista. Samaa dataa ei siis kannata etsiä.

– Eri alat ovat omia maailmoitaan, Markus summaa.

Tehtävässä vaaditaan myös aukotonta tarkkuutta ja huolellisuutta, jotta data säilyy laadukkaana. Pienilläkin asioilla voi olla suuri vaikutus ja datan hyödynnettävyys voi kärsiä pienimmästäkin muutoksesta. Datan käytettävyys on aina kuitenkin pääasia.

– Tietovarastoilla itsessään ei kukaan mitään tee, vaan ne tehdään aina jotakin tarvetta varten. Aika usein tarve syntyy raportoinnista, jota varten tietovarasto sitten tehdään.

Data on edelleen uusi öljy

Organisaatiot kiinnittävät yhä enemmän huomiota dataan ja kiinnostusta sen hyödyntämiseen on runsaasti. Mitä enemmän dataa kertyy, sitä paremmin sitä voidaan hyödyntää myös tulevaisuuden ennustamisessa. Jos esimerkiksi ostohistoriaa kertyy riittävästi, sen pohjalta voidaan laskea todennäköisyyksiä seuraaville ostoille, tuotteen menekille tai markkinointiviestinnän kannattaville panostuksille.

Työssään Markus on nähnyt, että vaikka asiakkailla usein on paljon tietoa siitä, mitä datan avulla voitaisiin saada aikaan ja mihin kaikkeen sitä voitaisiin hyödyntää, välttämättä asiaa ei kuitenkaan käytännön tasolla olla vielä lähdetty tekemään. Kenties syynä on se, että aihe mielletään edelleen jokseenkin hankalaksi, tai sitten se, että satsauksen tuotto nähdään vasta pidemmällä aikavälillä. Lääkkeeksi tähän Markus peräänkuuluttaa ketterää kokeilemista, jota voidaan tehdä yllättävänkin pienellä panostuksella.

– Asiakkaiden voi olla vaikea laskea datan business case. Että jos sijoitetaan tämän verran, tämän verran se tuottaa viivan alle. On hyvä muistaa, että asioita voidaan kokeilla myös pienemmin ja tarkastella saavutettuja hyötyjä käytännön kokeilun kautta.

Henkilöstöhallinnosta markkinointiin ja tietovarastointiin

Markuksen oma mielenkiinto on erityisesti kaupan alalla, pitkästä työhistoriastaan johtuen. Markus on taustaltaan henkilöstöhallinnon alaa opiskellut kauppatieteilijä, joka on työskennellyt taloushallinnon, markkinoinnin ja raportoinnin parissa.

Suurten kansainvälisten konsernien jälkeen Markus arvostaa nykyisen työn ilmapiiriä, jossa on helppo keskustella, runsaasti molemminpuolista joustavuutta eikä turhaa byrokratiaa.

Markus Laurén, Cloud1 Oy

– Moni asia hoituu täällä helpommin. Pienemmillä yrityksillä on enemmän keinoja lisätä henkilöstön viihtyvyyttä. Suuri mittakaava lisää väistämättä jähmeyttä.

Markus kokee palkitsevimpina projektit, joissa pääsee näkemään työn konkreettisen lopputuloksen.

– Parasta on, jos lähtötilanteessa asiakkaalla on konkreettinen ongelma tai tavoite, jota vastaamaan saadaan kerättyä sopiva data. Palkitsevinta on tietysti suora palaute siitä, että data on ollut juuri sitä, mitä tarvittiinkin.

Yhden asian Markus kuitenkin muuttaisi nykyisessä työssään. Nimittäin järjestelmien systemaattisen epämääräiset virheilmoitukset, joiden viittauskohteen selvittäminen voisi hoitua nopeamminkin.