Zum Hauptinhalt springen
Alle KollektionenErweiterte AnleitungenWebsite-Verwaltung
Wie man Seiten oder PDFs von einer Website ausschließt
Wie man Seiten oder PDFs von einer Website ausschließt
Daniel Towers avatar
Verfasst von Daniel Towers
Diese Woche aktualisiert

Sobald Sie eine Website hinzugefügt haben, können Sie bestimmte Seiten oder PDFs vom Testen ausschließen.

Zum Beispiel, wenn Sie example.com getestet haben, möchten Sie möglicherweise Seiten innerhalb eines Teils dieser Website ausschließen, wie Seiten, die mit example.com/archive beginnen.

Eine neue Ausschlussregel hinzufügen

  1. Öffnen Sie die Website, die Sie aktualisieren möchten.

  2. Wählen Sie Einstellungen in der oberen rechten Ecke. Sie benötigen die erforderlichen Kontoberechtigungen, um dies zu sehen.

  3. Geben Sie im Feld Ausgeschlossene URLs alle Webadressen ein, die Sie ausschließen möchten.

Alle eingegebenen URLs werden von jeder URL ausgeschlossen, die mit dem Anfang dieser übereinstimmt. Wenn Sie also zum Beispiel https://example.com/archive ausschließen, würden Sie auch diese ausgeschlossen haben:

https://example.com/archive https://example.com/archive/another https://example.com/archive/and/another/example

Beachten Sie, dass bei der Verwendung der Regel 'URL beginnt mit' die URLs vollständig qualifiziert sein müssen, das heißt, sie müssen mit http:// oder https:// beginnen. Beachten Sie auch, dass wenn Sie eine dieser ausschließen, die andere nicht ausgeschlossen wird. Zum Beispiel, wenn Sie https://example.com/archive ausschließen, wird http://example.com/archive (die gleiche Adresse, aber mit 'http' statt 'https') nicht ausgeschlossen.

Regeltypen

Silktide unterstützt eine Reihe von Seitenauswahlregeltypen, einschließlich:

  • URL Gleich

  • URL beginnt mit

  • URL enthält

  • URL kürzer als

  • URL länger als

  • Reguläre Ausdrücke

Erweiterte Regeln

Für Abschnitte können Sie auch den erweiterten Regel-Builder verwenden, um Seiten auszuwählen, die ein bestimmtes HTML-Element, eine Sprache, einen Seitentitel usw. enthalten.

Für erweiterte Regeln können Sie eine der folgenden Regeln allein oder in Kombination mit anderen Regeln verwenden:

  • Bild

  • Sprache

  • Link

  • Seitentitel

  • Seitentyp

  • Ressource

  • Text

  • URL

  • XPath-Selektor

Seiten ausschließen, die Abfrageparameter enthalten

Manchmal haben Sie möglicherweise eine Auswahl von doppelten oder fast doppelten Seiten getestet, zum Beispiel könnte eine Website-Suchfunktion zahlreiche Kategorieoptionen enthalten. Diese Seiten sehen normalerweise so aus: example.com/search?category=news&page=3.

Wie können Abfrageparameter Duplikate erzeugen?

Wenn man Suchkategorien als Beispiel nimmt, könnte unser Crawler versuchen, jede Seite in den Suchergebnissen mehrfach zu testen, wobei sich der Kategorie-Abfrageparameter jedes Mal ändert.

Wenn Sie viele wiederholte Seiten haben, kann das Ausschließen eines Abfrageparameters nützlich sein, um die Anzahl der Seiten zu reduzieren, die Sie für eine Website testen, und um Ihr Seitenkontingent zu schonen.

Kontaktieren Sie den Silktide-Support

Um einen Abfrageparameter oder eine Auswahl von Parametern auszuschließen, kontaktieren Sie bitte das Silktide-Support-Team.

Wir können Ihnen auch weitere Ratschläge zu den Arten von Abfrageparametern geben, die Sie für den Ausschluss auswählen sollten. Zum Beispiel bei example.com/search?category=news&page=3 könnten wir vorschlagen, den 'category'-Abfrageparameter auszuschließen, während der 'page'-Abfrageparameter beibehalten wird.

Unser Tooling ermöglicht es uns, den 'category'-Abfrageparameter auszuschließen und dann den Rest der URL erneut zu testen. In unserem Beispiel wäre die verbleibende URL, die nach Ausschlüssen getestet werden soll, example.com/search?page=3.

Hat dies deine Frage beantwortet?