Den data drevne virksomhed forstår at udnytte data i værdiskabende sammenhænge. For at nå til et punkt hvor data bliver grundlaget for innovation, må man etablere de rigtige processer, aktivere de rigtige medarbejdere og anlægge et data-fikseret perspektiv på sin forretningsudvikling.
Data og datavidenskab har været et populært emne i mange år. Artikler som “Data Scientist: The Sexiest job of the 21st Century”, har været med til at gøre datakyndige til digitale rockstjerner.
Læser man vores skriverier, kan man konstatere, at vi langt hen af vejen synger samme sang. Data er virksomhedens vigtigste grundstof, og i digitaliseringens tidsalder bygger de fleste af os vores forretninger på netop data.
Den data drevne virksomhed forstår at udnytte disse mange data til deres fordel. For at nå til et punkt hvor data kan bruges, må man etablere de rigtige processer, aktivere de rigtige medarbejdere eller brugere og anlægge et data-fikseret perspektiv på sin forretningsudvikling.
Hvorfor skal man være "datadrevet"?
Uanset om vi snakker finansielle data, kundedata, salgsdata eller produktdata, har I nok allerede en eller flere aktiviteter i gang, hvor data er brændstoffet i den motor, der flytter jeres forretning fremad.
I PicoPublish er produktdata ofte omdrejningspunktet for vores arbejde, når vi implementerer PIM-løsninger og bygger ecommerce-løsninger.
Vi siger ofte "din kunde køber dit produkt på baggrund af data". Når jeres kunder handler online, hviler deres endelige købsbeslutning på de data, I udstiller om jeres produkter.
Kundens interaktion med jeres digitale løsninger siger derfor en hel masse om de brugsmønstre de har, og kan være afgørende for jeres beslutninger i udviklingen af nye produkter og services.
Uanset hvilken type data I arbejder med, er ideen om at blive bedre til at anskaffe, kvalitetssikre, berige og tolke data væsentlig for de produkter og services I tilbyder markedet.
Derfor er det også fordelagtigt at gå mere systematisk til værks, når man skal identificere muligheder for at styrke arbejdet med data i organisationen.
Hvad vil det sige at være data driven? Og hvordan giver det værdi?
Med afsæt i bogen “Data Driven” af Dhanurjay Patil og Hilary Mason kigger vi nærmere på hvordan virksomheder kan arbejde målrettet hen imod at blive mere datadrevne i deres beslutningsprocesser.
Det involverer bl.a.:
- At rekruttere/opbygge de rette kompetencer
- At opbygge en række processer omkring indsamling, klargøring og udnyttelse af data
- At demokratisere adgangen til data
- At arbejde på hele tiden at forbedre virksomhedens analytiske muskel
Vi perspektiverer bogens indtil til en dansk kontekst, hvor vi med afsæt i vores eget arbejde kommenterer på de i bogen indeholdte pointer.
Den datadrevne organisation
Vi har tidligere drøftet The Economists udsagn om, at data har overhalt olie som verdens mest værdifulde råstof. Udtalelsen fra The Economist er fra 2017, og vi må konstatere, at vi i 2022 stadig er og bliver dybt afhængige af data.
Store teknologigiganter som Google (Alphabet), Amazon og Meta (Facebook) har siden 2019 oplevet en vækst i antal ansatte på mellem 20 og 30% - altså flere tusinde/hundredetusinde nye medarbejdere i en trend der er støt stigende.
Det vidner om, at disse datadrevne giganter i høj grad formår at udnytte deres primære forretningsgrundlag - nemlig data - til at udvikle og udvide deres forretninger.
Skab en datadrevet kultur, og udnyt jeres data i værdiskabende sammenhænge
En af de første pointer i "Data Driven" er, at “mange data” er ikke et mål i sig selv. For en håndfuld år siden var budskabet, at enhver virksomhed burde begynde, at samle så meget data, de kunne. Det har vist sig både at være dyrt og besværligt. Særligt hvis man ikke har formået at omsætte sine data til information, viden eller løsninger, der har skabt værdi (altså; innovation).
Målet bør derimod være, at opbygge en kultur hvor "mange data" konsekvent kan anvendes i "mange værdiskabende aktiviteter".
Virksomheder der ukritisk vælger at opbygge et stort datalager eller datawarehouse-setup, opnår sjældent nogle fordele, så længe at de ikke kan omsætte deres data til innovation.
Kreativitet som nøgleord
For eksempel er datapunktet “37 grader celcius” ikke brugbart uden en kontekst. Taler vi om “vejret”, betyder vores datapunkt én ting. Taler vi om “temperaturen i din ovn”, siger datapunktet os en anden ting.
At opbygge en datadrevet kultur indebærer først og fremmest, at vi bliver i stand til at forholde og kritisk til de data vi opsamler, og den måde vi omgås disse data på.
Helt fundamentalt for den data drevne virksomheds succes er den menneskelige kreativitet, der transformerer data fra nuller og ettaller til sammenhænge, ideer og muligheder. Denne kreativitet skal understøttes af såvel organisatoriske forhold (processer, kultur) og teknologier (systemer, metoder).
Før vi kan lave datadrevet forretningsudvikling, kræver det, at vi har en grundlæggende forståelse for hvad data er, og hvad der skal til, før at data er et brugbart aktiv.
Fra data til viden - en kort præsentation af data-rejsen
Data er i sig selv ikke noget værd. Det er først når data anvendes i en specifik kontekst, at vi kan begynde at omdanne data til information, information til viden, og viden til visdom.
De såkaldte DIKW-modeller bruges ofte til at beskrive den proces data skal igennem, før den bliver anvendelig i en given kontekst.
DIKW står for:
- Data
- Information
- Knowledge
- Wisdom.
Hierarkiet i modellen understreger nødvendigheden af at behandle sine data, for at opnå indsigter, der kan bruges til at navigere i en kommerciel kontekst (fx "Vores maskiner overopheder efter to timers produktion - vi bør give dem en pause, eller forbedre kølingen").
DIKW-modellen forklaret
Lad os kigge på de enkelte bestanddele i modellen:
- Data
- Rå, upolerede signaler
- Eksempel: "37"
- Information
- Meningsfulde, berigede data
- Eksempel: "Der står 37 på temperaturmåleren på min ovn"
- Viden
- Kontekstualiseret information
- Eksempel: "Jeg skal lave en steg, og der står 37 på temperaturmåleren i min ovn"
- Visdom
- Anvendt viden
- Eksempel: "Jeg skal lave en flæskesteg i ovnen, der skal være færdig om 2 timer. Der står 37 grader på temperaturmåleren i min ovn, så jeg bør nok vente med at sætte stegen i ovnen, indtil der står 200 grader"
I arbejdet med data er målet altså at give "rå signaler" en kontekst. Konteksten gør det muligt, at udvikle en intuition omkring hvilke spørgsmål vores data kan hjælpe os med at besvare.
Bruger man DIKW-modellen kan man hurtigt identificere hvilket niveau data er nået til, og arbejde målrettet imod at modne sine data - enten ved brug af værktøjer (teknologier der kan visualisere, sammenholde eller beregne data) eller ved analyse.
Tema #1 - De nødvendige kompetencer
Forfatterne tager i "Data Driven" udgangspunkt i medarbejderen; "Culture starts with people in your organization, and their roles and responsibilities".
En helt særlig type medarbejder, der har været central i udviklingen af den datadrevne organisation, er "the data scientist". Denne jobbeskrivelse har været fremhævet som den mest "sexede" i det 21. århundrede af blandt andet Harvard Business Review.
Data Scientists udfører dog ikke nogle fundamentalt nye eller anderledes opgaver. Der har altid eksisteret roller og ansvarsområder i virksomheder, hvor statistik, data analyse og programmering har været centrale fagligheder. Det nye er derimod, at alle disse fagområder samles omkring en enkelt person.
Læring 1: Den succesfulde datadrevne virksomhed forstår vigtigheden af data-faglighed
Når store virksomheder som Walmart og US Department of Commerce er lykkes med deres datainitiativer, skyldes det i høj grad, at de har taget denne type medarbejder til sig.
Om det er CDO (Chief Data Officers), Data scientists eller noget helt tredje er underordnet. Det afgørende er, at virksomheden har taget et strategisk valg om at hvile på data i deres beslutningsprocesser.
Centralt for denne nye type af medarbejder er det, at de kan:
- Arbejde med matematik og tal på et højt niveau
- Store datamængder giver typisk anledning til kvantitative analyser
- Arbejde med modellering af data (programmering og infrastrukturdesign)
- Klargøring af data til analyse (databasemodellering mv.) er nødvendigt for at skabe nye indsigter
- Arbejde analytisk
- At stille de rigtige spørgsmål, på de rigtige tidspunkter, er kritisk for at analyser er brugbare, og ikke blot bliver støj
- Kommunikere deres arbejde
- Kan medarbejderen ikke formidle indsigt, udebliver al værdiskabelse
Datamedarbejderens eksistensberettigelse hviler altså på, at vedkommende kan præsentere solide analyser og indsigter til virksomhedens ledelse.
Hvad kan vi bruge denne viden til?
Vi ser ikke nødvendigvis behovet for, at virksomheder tolker rollen "data scientist" 100 % bogstaveligt. Selvom vi i Danmark oplever, at universiteter opretter uddannelser der direkte hedder "Data Science", er det optimistisk at forvente, at en enkelt medarbejder kan og bør sidde med hele ansvaret selv.
Dette er også en naturlig konsekvens af, at der kommer flere data, og flere komplekse data, hvilket øger nødvendigheden af at have datadrevne teams, der kan håndtere den stigende kompleksitet.
At tænke funktionerne i listen herover ind i dagligdagen er dog produktivt. I vores arbejde med PIM, er disse kompetencer også typisk i spil. I en lokal kontekst ser vi dog flere teams end one-man-armies. Business Intelligence konsulenter, mere klassiske udvikler-roller og dataanalytikere er alle udbredte roller blandt vores kunder og kolleger.
Enhver forandringsproces - også når det kommer til PIM - er først og fremmest afhængige af ledelsesopbakning, hvorfor man med fordel kan gøre "den datadrevne medarbejder" til en strategisk prioritet. Enten gennem rekruttering af egnede kandidater, eller via oplæring og uddannelse af eksisterende medarbejdere.
Tema #2 - Opbyg et solidt procesapparat
Med styr på datamedarbejderen, kigger forfatterne nu på selve organisationerne - de datadrevne virksomheder, der er omdrejningspunkt for bogen.
Her fremhæver de først og fremmest nogle af de kæmpevirksomheder, der har haft succes med deres digitale transformation:
- Walmart der siden 70'erne har digitaliseret deres fysiske forretninger (fx med stregkodescannere) for at styrke deres datagrundlag
- FedEx der har brugt GPS-data til at reducere antallet af kørte kilometer med 100 mio.
- General Electric der har brugt data om deres flymotorer til at optimere deres kommunikation til både piloterne, såvel som til ingeniørerne der bygger motorerne
- En fodnote omkring General Electric er, at 1% optimering i driften af deres flymotorer kan betyde en årlig besparelse på over 100 mia. kroner.
Så hvad er det, der gør disse virksomheder i stand til at arbejde med data, og opnå forretningsmæssige fordele?
Læring 2: Den datadrevne virksomheder arbejder struktureret med data
I "Data Driven" fremhæves succeserne i de førnævnte virksomheder som et resultat af et top-tunet procesapparat.
De virksomheder der formår at få succes med deres datainitiativer, er i stand til at arbejde struktureret med deres dataindsamling og -processering:
"[the data driven organization]... acquires, processes, and leverages data in a timely fashion to create efficiencies, iterate on and develop new products, and navigate the competitive landscape..."
Første trin er altså anskaffelse og processering af data, der ifølge forfatterne kan være op til 80% af arbejdet med data.
Anskaffelse af data er typisk resultatet af et designvalg; ved hjælp af en eller flere teknologier, opsamles data om;
- brugeres handlinger
- et systems tilstand
- transaktioner
- produkter
- og meget, meget mere.
Processering af data omfatter alle aktiviteter der relaterer sig til rengøring, sortering, fejlfinding og kategorisering af data, der gør efterfølgende analyse mulig. Har en virksomhed meget data, er udviklingen af en standardiseret proces til netop denne del af arbejdet væsentligt sværere end mange antager.
Lykkes man med at skabe en sund kultur omkring dette arbejde med data, vil datakvaliteten efterfølgende også være meget høj. Det giver grundlag for bedre analyser, og færre fejl i de konklusioner der drages på baggrund af data.
Hvad kan vi bruge denne viden til?
Den måske mest overraskende (for nogen) udmelding er, at hele 80% af arbejdet med data finder sted i anskaffelse og forædling af data.
Set ud fra et produktdata-perspektiv, er det dog ikke langt fra vores virkelighed, hvor etableringen af det korrekte datagrundlag er langt den største opgave. Når data først er anskaffet og beriget korrekt, er fordelingen i diverse kanaler oftest ikke det, der vælter korthuset.
Involverer anskaffelse af data fx også motivering og aktivering af leverandører, der skal modnes til at levere data digitalt direkte ind i PIM, er ressourcetrækket på denne opgave også betydelig. Men det er også i disse processer, at det store effektiviserings- og optimeringspotentiale ligger gemt.
Typisk er automatisering af førhen manuelle processer og arbejdsgange et fokusområde her. Gevinsten ved at opnå større automatisering er oftest, at man får bedre og mere præcise data (fx fejl og nedbrudslogs), og at man frigør værdifuld tid til andre aktiviteter.
Tema #3 - Demokratisering af data er afgørende
Struktur og processer er ikke nok i sig selv. Ifølge forfatterne af "Data Driven" falder mange for en "build it, and they will come!"-mentalitet, hvor man fejlagtigt forventer, at dataindsamling og klargøring er tilstrækkeligt for at skabe en datadrevet virksomhed.
Ligesom olie ikke er meget værd uden forbrændningsteknologi, er data heller ikke meget værd uden noget eller nogen der fortolker den.
I bogen understreges vigtigheden af data-deling internt i virksomheden igennem endnu et eksempel. Hos Google og LinkedIn blev grundlæggende SQL-kompetencer et krav i rekrutteringsprocessen. Hermed ønskede man at sikre, at alle ansatte kunne tilgå data, og træffe oplyste beslutninger i deres projekter.
NGO'er og andre interesseorganisationer har også set lyset i at udstille data (såkaldte "open data"), der tillader brugere og interesserede organisationer at engagere sig i NGO'ens arbejde.
Et andet eksempel findes i Chicago, hvor en frustreret borger udviklede et redskab til at spore udviklingen i antallet af "potholes" (læs: huller i vejen). Servicen hjalp den lokale regering med at sætte mere effektivt ind overfor de farlige potholes.
Læring 3: Den datadrevne virksomhed demokratiserer så mange data som det er muligt/lovligt
De virksomheder der får succes med deres datainitiativer, er således de virksomheder, der formår at demokratisere adgang til data, så de ikke samler støv i en eller flere lukkede databaser.
De såkaldte "åbne datasæt" er en måde at demokratisere adgangen til data på. Hos Danmarks Statistik (dst.dk) har man i mange år åbnet data op, og tilmed bygget en visualiserings- og analysemotor, de fleste kan anvende uden videre. Det tillader stort set alle at tilgå data på en måde, der gør dem i stand til at generere ny viden.
I "Data Driven" præsenterer forfatterne en ny rolle - "[the] Data Steward". En slags digital data-forvalter, hvis primære opgave er, at sikre et højt bundniveau i organisationens teknologiske og metodiske understøttelse af data-arbejde.
Hvad kan vi bruge denne viden til?
Når omdrejningspunktet er ecommerce, er det nærliggende at betragte PIM-systemet som en stedfortræder for den førnævnte "data steward". Formålet med et PIM-system er bl.a. at have en Single Source of Truth for produktdata, hvilket højner kvaliteten af selvsamme data.
PIM-systemet tillader dertil, at stort set alle kan interagere med data, at skabe nye sammenhænge, nye processer (fx alarmer, notifikationer mv.) og nye kanaler, og er i sig selv en teknologisk understøttelse af dataarbejdet.
Demokratisering af data og viden er i sig selv ikke en banebrydende tanke. Ikke desto mindre er det vigtigt at holde dette for øje. PIM-systemet er af flere årsager en af mange teknologier, der kan bidrage til faciliteringen af denne demokratisering.
Tema #4 - Tag afsæt i den videnskabelige metode
De tre foregående temaer behandler de trin, der går forud for analysen.
Selve analysen er omdrejningspunktet for den måske mest kritiske del af det værdiskabende arbejde med data.
Som nævnt tidligere - hvis ikke du formår at stille de rigtige spørgsmål, er de svar, som dine data giver dig ikke noget værd.
I "Data Driven" foreslår forfatterne, at man starter med et enkelt, videnskabeligt inspireret metodisk grundlag for sin analyse:
- Start med data - altid!
- Opbyg en intuition omkring data, og de spørgsmål disse data kan besvare (viser en simpel figur fx nogle store udsving i data)
- Formulér et eller flere konkrete spørgsmål
- Udnyt data til at verificere om spørgsmålet er korrekt
- Byg et rammeværk der tillader dig at teste og eksperimentere med data
- Analysér dine resultater, og find indsigter der relaterer til dine spørgsmål
Med afsæt i denne proces må virksomheden nu selv forfine sin tilgang til analysearbejdet.
Læring 4: Den datadrevne virksomhed investerer i analytiske
Når man opbygger en datadrevet organisation, er det for farligt, at lade al viden bo i en enkelt medarbejder (fx en "data scientist"). Ligesom demokratisering af data gør data til et redskab for flere i virksomheden, bør virksomhedens metoder også analytiske kompetencer også demokratiseres.
Påstanden i "Data Driven" er, at de fleste dataanalyser minder om videnskabeligt arbejde, hvilket også betyder, at der med stor sandsynlighed kan findes en generisk analyseproces, der kan anvendes og justeres igen og igen.
Hvad kan vi bruge denne viden til?
"Culture eats strategy for breakfast". Sådan sagde Peter Drucker.
De bedste intentioner ender ofte med, at bliver et offer for en virksomhedskultur, der ikke uden videre absorberer nye ideer, processer og teknologier.
Selvom den videnskabeligt funderede, analytiske metode har sine meritter, oplever vi sjældent, at virksomheder går så akademisk til værks i deres arbejde med produktdata.
Med ecommerce er der typisk et større fokus på at udbygge sin arkitektur med værdiskabende integrationer - fx til leverandører, så de kan aflevere data direkte i PIM-systemet - end der er på metoder, der ofte kan virke som hæmmende for medarbejdernes frihed til at agere.
Hermed ikke sagt, at den videnskabelige analyse bør ignoreres totalt.
Et eksempel på et konkret redskab der kan hjælpe med pkt. 2 herover, ville være et dashboard.
Et godt dashboard vil typisk kunne afsløre umiddelbare indsigter i et datasæt (største udfald, mængder, afhængigheder og andre facetter i datasættet).
De løse ender
"Data Driven" behandler i sine mange mellemregninger nogle temaer, der er værd at nævne kort afslutningsvist.
Proces og metoder over værktøjer
Lidt ala manifestet for agil softwareudvikling, der læser "Individuals and interactions over processes and tools", er forfatterne fortalere for, at interaktioner og processer skal trumfe et fokus på værktøjer:
"The secret of great data science is that the tools are almost irrelevant. An expert practitioner can do better work in the Bash shell environment than a nonexpert can do in R"
Når man skal vælge hvilke værktøjer, man arbejder med, er brugervenlighed typisk et væsentligt parameter, hvis ikke-tekniske kolleger skal lære at finde sig til rette i værktøjets interface.
Et godt værktøj understøtter desuden teamwork og kommunikation - igen for at undgå datasiloer, der kun er til gavn for de få.
I vores optik er en god vej til et bedre it-systemlandskab standardisering. Med standardisering mener vi her, at man benytter systemer til det, de er beregnet til. Dermed undgår man fx unødvendige nedbrud og dårlig performance. Det medfører typisk også at systemer bliver enklere at arbejde i, da man ikke har "en dims" der skal kunne alting på samme tid.
Kig på jeres data ofte
I "Data Driven" er forfatterne både for og imod dashboards. På den ene side må dashboards ikke betragtes som slutproduktet, da et dashboard ikke er højt nok i DIKW-modellen til at data kan betragtes som færdigbehandlet.
Dashboards er til gengæld gode i den tidlige fase af analysearbejdet, hvor hyppig eksponering overfor data øger læserens intuition i forhold til arbejdet med data.
Desuden bringer dashboards emner som datakvalitet og seneste ændringer til syne, hvilket kan medvirke til at skabe en kultur omkring arbejdet med data, der er mere gennemsigtig end ellers.