In Silktide sollen Bewertungen darstellen, wie gut oder schlecht ein Bereich ist, auf eine Weise, die sich natürlich fair und nützlich anfühlt. Ungefähr gesagt ist 0 % schrecklich, 100 % perfekt und 50 % meistens durchschnittlich.
Die meisten Bewertungen basieren auf der Anzahl der Probleme und der Anzahl der betroffenen Seiten, aber die Details variieren je nach Prüfung.
Jede Prüfung ist anhand von realen Daten kalibriert, was als „gut“ oder „schlecht“ gilt. Zum Beispiel: Wie viele Rechtschreibfehler wären nötig, damit eine Website 0 % für Rechtschreibung erhält? Die Antwort auf solche Fragen basiert auf viel Testing und Forschung.
Wie Prüfungen bewertet werden
Ein Silktide-Webseitenbericht besteht aus vielen separaten Tests oder Prüfungen, zum Beispiel den Prüfungen Rechtschreibung oder Defekte Links.
Diese Prüfungsbewertungen bilden einen Teil der Bewertungsmetriken für andere Kategorien, zum Beispiel Inhalt oder Barrierefreiheit.
Im Allgemeinen werden einzelne Prüfungen basierend auf einer Mischung der folgenden Faktoren bewertet:
Der Prozentsatz der Seiten in einem Bericht, auf denen ein Problem vorhanden ist
Die durchschnittliche Anzahl von Problemen pro Seite
Einige Prüfungen berücksichtigen nicht die durchschnittliche Anzahl von Problemen, weil einige Probleme nur einmal pro Seite auftreten können. Zum Beispiel kann die Prüfung, die nach einem fehlenden "Zum Inhalt springen"-Link sucht, pro Seite nur einmal bestanden oder nicht bestanden werden, daher zählen wir in diesem Fall nur die Anzahl der Seiten und nicht die Anzahl der Probleme.
Einige Prüfungen gelten nicht für Seiten, sondern für andere Einheiten, zum Beispiel die Menge an Dateien, PDFs oder andere Kriterien. In diesen Fällen gilt das gleiche Prinzip, wird aber anhand dieser anderen Maßeinheit bewertet.
Um diese Zählungen in eine Bewertung umzuwandeln, hat Silktide für jede einen angestrebten „schlechtesten“ Wert. Zum Beispiel:
Der schlechteste Wert für „durchschnittliche Probleme pro Seite“ bei der Prüfung "Flash-Animationen vermeiden" ist 0,1, was bedeutet, dass wenn 1 von 10 Seiten Flash-Animationen enthält, Silktide dieser Website 0 % für diese Prüfung geben würde.
Die schlechteste Anzahl von defekten Links pro Seite ist 4. Das bedeutet, wenn Sie durchschnittlich 4 defekte Links pro Seite haben, würden Sie 0 % für Defekte Links erhalten.
Einige Prüfungen bewerten spezifische Probleme mit unterschiedlichen Gewichtungen, sodass ein bestimmtes Problem mehr oder weniger Einfluss haben kann. Zum Beispiel:
Rechtschreibung betrachtet ein Problem mit „falscher Groß-/Kleinschreibung“ (zum Beispiel „Linkedin“ statt „LinkedIn“ zu schreiben) als 20 % so einflussreich auf die Gesamtbewertung wie eine definitiv falsche Schreibweise wie „suberb“.
Defekte Links betrachten einen „möglicherweise defekten Link“ als 40 % so einflussreich auf die Bewertung wie einen „definitiv defekten Link“.
Jede Prüfung ist basierend darauf kalibriert, wie häufig und/oder einflussreich ein Problem ist. Zum Beispiel ist eine einzelne Seite, die auf mobilen Geräten nicht funktioniert, schädlicher für eine Bewertung als ein einzelner Rechtschreibfehler. Wir führen umfangreiche Forschungen auf vielen Websites durch, um unsere Ergebnisse zu kalibrieren.
Hinweis: Die Web Vitals-Prüfungen sind ein Sonderfall. Web Vitals-Bewertungen werden aus dem Bewertungssystem Google Lighthouse kopiert. Silktide ändert diese Bewertungen nicht.
Wie Kategorien bewertet werden
Für Kategorienbewertungen (Gruppen von Prüfungen), wie Inhalt oder Barrierefreiheit:
Jede Kategorie beginnt mit der Bewertung von perfekten 100.
Jede Prüfung kann von dieser Bewertung basierend auf ihrem „maximalen Einfluss“ abziehen, was bedeutet, wie viel Prozent sie maximal von der Kategorienbewertung abziehen kann.
Eine Kategorienbewertung kann nicht unter Null fallen.
Kategorien können ineinander verschachtelt sein. In diesem Fall kann eine Kategorie ein gewichteter Durchschnitt der Kategorien sein, die in ihr enthalten sind. Zum Beispiel ist Barrierefreiheit wie folgt gewichtet:
45 % = WCAG 2.1 Level A
40 % = WCAG 2.1 Level AA
15 % = WCAG 2.1 Level AAA
Das Gewicht einer PDF- oder HTML-Prüfung basiert auf der Anzahl der PDFs oder Seiten in einem Bericht. Wenn eine Website sehr wenige PDFs hat, werden PDF-Prüfungen nur einen sehr geringen Einfluss auf die Bewertung haben, und umgekehrt.
Warum keine gewichtete Durchschnittsbewertung verwenden?
Durch die Verwendung eines gewichteten Durchschnitts hätte das Hinzufügen neuer Prüfungen einen kontraintuitiven Effekt: Kategorienbewertungen würden steigen.
Zum Beispiel würde das Upgrade von WCAG 2.0 auf 2.1 mehr Barrierefreiheitsprüfungen bedeuten, was so klingt, als sollten die Bewertungen niedriger sein. Da jedoch die meisten Webseiten dazu neigen, die meisten Prüfungen zu bestehen, würden Seiten dazu tendieren, einen höheren Prozentsatz dieser Prüfungen zu bestehen und daher unter einem anspruchsvolleren Standard höher bewerten.
Dieses kontraintuitive Ergebnis wird mit dem Ansatz von Silktide vermieden.