Spring videre til hovedindholdet
Alle samlingerSilktide Analytics
Hvordan Silktide Analytics bruger sampling
Hvordan Silktide Analytics bruger sampling
Oliver Emberton avatar
Skrevet af Oliver Emberton
Opdateret i denne uge

Silktide bruger en almindelig matematisk teknik til at tilnærme nogle data. Dette forklarer, hvordan Silktide bruger det og hvorfor.

Hvad er sampling?

Sampling er en teknik, der bruges til at estimere resultater, når det ikke er praktisk at se på alle dataene.

For eksempel er det almindeligt at tage stikprøver af folk, der måske stemmer ved et valg. Da det ikke er praktisk at spørge hver eneste vælger, kan man spørge en stikprøve – for eksempel 1 ud af 10.000 vælgere – og derefter gange antallet af resultater, man får, med 10.000 for at estimere, hvad hele befolkningen kunne sige.

Hvis det gøres korrekt, er sampling pålidelig og konsistent med de 'rigtige' data.

Hvorfor bruger Silktide sampling?

Hvis du gennemgår en meget stor mængde analysedata – f.eks. ti- eller hundreder af millioner af visninger – kan mængden af beregninger, der kræves for at analysere det, blive upraktisk langsom.

De fleste brugere ville finde det uacceptabelt at vente 30 sekunder eller længere på, at nøgletal vises. Ved at bruge sampling er Silktide i stand til at opretholde en konsekvent ydeevne, uanset hvor stor din analysedata bliver.

Hvordan bruger Silktide sampling?

Silktide bruger kun sampling, når de data, du ser på, er ekstremt store, eller brugen af sampling ikke ville introducere en forventet fejl på 1% eller mere.

Typisk betyder dette, at hvis du ser på over 5 millioner hændelser i et givet filter (f.eks. din datointerval), vil Silktide begrænse sin stikprøve til højst 5 millioner poster.

Afhængigt af konteksten kan Silktide bruge færre poster, hvor en mindre stikprøve ville være statistisk signifikant. For eksempel, for at vise et heatmap, bruges kun en stikprøve på op til 20.000 poster.

Historie

Sampling blev tilføjet til Silktide Analytics den 29. maj 2024.

Besvarede dette dit spørgsmål?