Zum Hauptinhalt springen
Alle KollektionenSilktide Analytics
Wie Silktide Analytics Sampling verwendet
Wie Silktide Analytics Sampling verwendet
Oliver Emberton avatar
Verfasst von Oliver Emberton
Diese Woche aktualisiert

Silktide verwendet eine gängige mathematische Technik, um einige Daten zu approximieren. Dies erklärt, wie Silktide sie verwendet und warum.

Was ist Sampling?

Sampling ist eine Technik, die verwendet wird, um Ergebnisse zu schätzen, wenn es nicht praktikabel ist, alle Daten zu betrachten.

Zum Beispiel ist es üblich, Personen zu befragen, die bei einer Wahl abstimmen könnten. Da es nicht praktikabel ist, jeden einzelnen Wähler zu befragen, könnte man eine Stichprobe nehmen – sagen wir 1 von 10.000 Wählern – und dann die Anzahl der erhaltenen Ergebnisse mit 10.000 multiplizieren, um zu schätzen, was die gesamte Bevölkerung sagen könnte.

Richtig durchgeführt, ist Sampling zuverlässig und konsistent mit den „echten“ Daten.

Warum verwendet Silktide Sampling?

Wenn Sie eine sehr große Menge an Analysedaten überprüfen – z.B. Zehn- oder Hunderte von Millionen von Ansichten – kann die Menge der erforderlichen Berechnungen, um sie zu analysieren, unpraktisch langsam werden.

Die meisten Benutzer würden es als inakzeptabel betrachten, 30 Sekunden oder länger zu warten, bis wichtige Kennzahlen erscheinen. Durch die Verwendung von Sampling kann Silktide eine konsistente Leistung aufrechterhalten, unabhängig davon, wie groß Ihre Analysedaten werden.

Wie verwendet Silktide Sampling?

Silktide verwendet Sampling nur, wenn die Daten, die Sie betrachten, extrem groß sind oder die Verwendung von Sampling keinen erwarteten Fehler von 1% oder mehr einführen würde.

Typischerweise bedeutet dies, dass Silktide, wenn Sie sich über 5 Millionen Ereignisse in einem bestimmten Filter (z.B. Ihrem Datumsbereich) ansehen, seine Stichprobe auf nicht mehr als 5 Millionen Datensätze beschränkt.

Je nach Kontext kann Silktide weniger Datensätze verwenden, wenn eine kleinere Stichprobe statistisch signifikant wäre. Zum Beispiel wird zur Anzeige einer Heatmap nur eine Stichprobe von bis zu 20.000 Datensätzen verwendet.

Geschichte

Sampling wurde am 29. Mai 2024 zu Silktide Analytics hinzugefügt.

Hat dies deine Frage beantwortet?