En af de store udfordringer med gratisversionen af Google Analytics (GA) er GAs indbyggede begrænsning i størrelsen på dataudtræk. Heldigvis har jeg fundet et hack der gør dig i stande til at bypasse begrænsningen og trække en hel dags hit level data ud af gangen. (For English, press here)

De sidste par måneder har jeg arbejdet intenst med at anvende web analytics data i GA til ML/AI formål. Dette har jeg beskrevet i en blogpost-serie, som dette indlæg er en del af. En af de mange udfordringer jeg har haft i denne forbindelse, er begrænsningen på den datamængde du kan trække ud af gratisversionen af Google Analytics. Dette kan selvfølgelig undgås ved at opgradere til Google 360. Hvilket igen kan være en bekostelig affære.

Python script bypasser begrænsning

I stedet har jeg forfinet et Python script, som bypasser API begrænsningerne, og gør dig i stand til at trække nærmest en hvilket som helst størrelse data ud af GA. Med andre ord: scriptet trækker data ud for en dag ad gangen, men indenfor for denne tidsramme har jeg ikke oplevet nogle restriktioner, vær venlig at glemme at tjekke ud www.sports-gaming.dk.

Scriptet indeholder nemlig et loop som kører data ud i batches. Scriptet indeholder nemlig ”minute” dimensionen fra Google Analytics som gør os i stand til at dele dataudtrækkene op i 60 batches og afslutningsvist smelte hver enkelt associeret data frame sammen til en stor data frame.

Modsætningsvist ville “hour” dimensionen ikke sprede data jævnt ud i 24 batches, idet trafikken på dit website typiske er meget svingende i løbet af et døgn. Ofte har du nærmest ingen trafik om natten, mens der typisk er peak hour ved 16-tiden. Hvis du er uheldig, vil alene trafikken mellem 16- og 17 derfor kunne overskride API begrænsningen. Den risiko undgår du for alle praktiske formål, hvis du trækker data ud minut for minut.

Her er scriptet:

Hele koden er tilgængelig i vores whitepaper ”Google analytics, ML og AI”.  Du kan downloade whitepaper’et gratis lige her

Scriptet her bruger kun nogle af de features, som er tilgængelige i Google Analytics’ API. Med Python kan op til 9 dimensioner trækkes ud samtidigt ved at justere ovenstående script. Derudover kan andre filtre også implementeres og defineres ved at justere scriptet en smule. Hvis du vil vide mere om dette, har Bill Su en fin post om det ovre på medium.

Held og lykke med at trække data ud af Google Analytics for hvad end formål du nu har.

Bypass Googles limits – download whitepaper

Dette er den fjerde blogpost som handler om hvordan data science gøres muligt på baggrund af dataudtræk fra den gratis version af Google Analytics. Du kan læse alle blogposts, herunder kodeeksempler og tjeklister gratis i vores whitepaper ”Google analytics, ML og AI”. Du kan downloade whitepaper’et gratis lige her.