Databricksin hyödyntäminen big data -analytiikassa (4/5) – Analysointi

Edellisissä osissa on käyty läpi miten data saadaan käyttöön ja hyödynnettävään muotoon. Jäljellä on vielä tiedon analysointi johon tässä osassa syvennytään.

Power BI ja Databricks

Power BI:n saa helposti yhdistettyä Databricks-tauluihin, jotka edellisen osan ajossa luotiin. Ne toimivat yhdistämisen jälkeen samalla tavalla kuin käyttäisi lähteenä tiedostoa. En huomannut havaittavaa eroa kyselyiden kestossa, oli taustalla sitten pienempi tai suurempi datasetti. Vastaukset tulevat toki huomattavasti hitaammin kuin muistiin (Power BI:hin tai AAS-malliin) luetusta tiedosta, jolloin valintamuutosten päivittymistä raportille joutui odottelemaan useita sekunteja. Suuren datasetin saa kuitenkin helposti visualisoitua käyttöön, joten aika tuntuu siedettävältä. Kyseessä ei kuitenkaan ole loppukäyttäjäsovellus, vaan ad hoc -työkalu tukemaan satunnaisia tietotarpeita.

DataBricksin hyödyntäminen big data -analytiikassa (4/5) – Analysointi

Lopputuloksena voi siis todeta, että Databricks tarjoaa riittävän yksinkertaisen käyttöliittymän tiedon muokkaukseen ja kyselemiseen. Tämä yhdistettynä Power BI:n Self Service -visualisointiominaisuuksiin tarjoaa vaikuttavan kombinaation. Vaikka toteutuksen liikkeelle saamiseksi vaaditaankin ehkä vielä meitä data-alan ammattilaisia, on harppaus kuitenkin valtava verrattuna vanhaan on-premises -maailmaan ja sen tarjoamiin perinteisiin tekniikoihin – kustannuksista puhumattakaan. Tekniikka on lisäksi kaikkien helposti saatavilla ja kypsä hyödynnettäväksi. Enää ei tarvitse tuskailla sitä, miten suuria tietomassoja oikein saadaan käyttöön. Nyt kaivataankin vain liiketoiminnallisia oivalluksia saatavilla olevan tiedon hyödyntämiseksi. Ja jos niitä ei ole valmiiksi, omaan datavarantoon pääsee nyt tutustumaan nopeasti ja hakemaan innoitusta sitä kautta.

Visualisoinnissa toimivat pikaisella testauksella kaikki perusasiat, kuten filtteröinnit, taulukot ja graafeista niin pylväät kuin kartatkin.

Mikäli data on aggregoitavissa ja importattavissa Power BI:hin, kannattaa tämä vaihtoehto hyödyntää analysoinnin nopeuttamiseksi ja kustannusten leikkaamiseksi.

Seuraavassa osassa käydään läpi edellisten osien toteuttamiseen liittyvät tekniset huomiot ja tärkeimmät ohjeet.

 

Lue myös:

Databricksin hyödyntäminen big data -analytiikassa (1/5) – Arkkitehtuuri

Databricksin hyödyntäminen big data -analytiikassa (2/5) – Kehitys

Databricksin hyödyntäminen big data -analytiikassa (3/5) – Tehokkuus ja kustannukset

 

(Blog in English coming soon...)

Kirjoittaja
Picture of Marko Oja
Marko Oja

Data-arkkitehti, joka auttaa asiakasta ymmärtämään tekniikan mahdollisuudet ja muuntaa innovatiiviset ideat teknisiksi ratkaisuiksi. Ketterät kehitysmenetelmät ja kehitystyötä tukevat prosessit ovat lähellä Markon sydäntä.

Uusimmat

Tilaa blogi