Zum Hauptinhalt springen

Warum werden defekte Links in PDFs gemeldet?

Erfahren Sie, warum defekte Links in PDFs erscheinen, was Fehlalarme verursacht und wie Sie die Ergebnisse prüfen.

Daniel Towers avatar
Verfasst von Daniel Towers
Vor über 2 Wochen aktualisiert

Übersicht

Silktide überprüft Links in PDFs, um sicherzustellen, dass sie korrekt funktionieren. Aufgrund der Art und Weise, wie PDFs Text speichern und darstellen, können die Ergebnisse manchmal unerwartet aussehen. Die meisten gemeldeten defekten Links sind echt, aber PDFs behandeln Links nicht einheitlich. Unterschiedliche PDF-Viewer interpretieren Links unterschiedlich, was bedeutet, dass ein Link in einem Viewer funktioniert, in einem anderen jedoch fehlschlagen kann.

Daher können einige Ergebnisse fehlerhaft erscheinen, obwohl sie lediglich widerspiegeln, wie PDFs funktionieren.


Warum passiert das?

PDFs definieren Links nicht auf eine einheitliche oder eindeutige Weise. Viele Programme, die PDFs lesen – darunter Adobe, Google, Apple, Microsoft und Silktide – können dieselben Links unterschiedlich interpretieren oder sie überhaupt nicht erkennen.

Die meisten PDFs sind nicht „getaggt“, sodass Software raten muss, was ein Link ist. Diese Mehrdeutigkeit erklärt, warum ein Link in Chrome funktioniert, aber in Acrobat fehlschlägt, oder warum Silktide einen defekten Link meldet, der für Sie korrekt aussieht.


Wie Links in einem PDF definiert werden

Es gibt zwei Hauptarten, wie ein Link erscheinen kann:

1. Textlinks

In einem PDF können Sie eine Webadresse als normalen Text schreiben, zum Beispiel https://www.silktide.com.

PDF-Viewer (wie Chrome oder Acrobat) und Silktide versuchen alle, solche Links automatisch zu erkennen. Da dies auf Schätzungen basiert, unterscheiden sich die Ergebnisse je nach Plattform.

2. Getaggte (Annotation-) Links

Ein „getaggtes“ PDF enthält zusätzliche Informationen, die Links eindeutig definieren. Diese Links werden auch als Annotationen bezeichnet. Theoretisch sollten alle PDF-Viewer diese konsistent interpretieren.

In der Praxis wird das Tagging jedoch oft fehlerhaft durchgeführt, und verschiedene Viewer versuchen, schlechtes Tagging auf unterschiedliche Weise zu korrigieren. Daher können selbst getaggte Links inkonsistent sein.


Warum Links in PDFs nicht immer wie erwartet funktionieren

  • Mehrzeilige Links
    Sofern ein PDF nicht getaggt ist (was selten vorkommt), besteht der Text lediglich aus platzierten Zeichen, nicht aus strukturierten Sätzen. Komplexe Layouts erschweren es der Software, zusammengehörige Wörter zu erkennen, sodass mehrzeilige Links falsch interpretiert werden können.

  • Ligaturen
    Manche Zeichenpaare wie fi, fl oder ff werden aus ästhetischen Gründen zu einem einzigen Zeichen kombiniert.

    Zum Beispiel:

    Wenn dies geschieht, können die ursprünglichen Zeichen verloren gehen, sodass Silktide oder andere Software den ursprünglichen Link nicht rekonstruieren können.

  • Weiche und harte Bindestriche
    Links, die über mehrere Zeilen laufen, können Bindestriche enthalten:

    www.beispiel- website.com


    Dies könnte als www.beispiel-website.com oder www.beispielwebsite.com interpretiert werden.

    Da PDFs dies selten eindeutig definieren, nehmen die meisten Programme an, dass der Bindestrich Teil der URL ist.

  • Unlesbare oder manipulierte PDFs
    Manche PDFs sind absichtlich so erstellt, dass Text nicht maschinenlesbar ist. Zeichen können im Hintergrund neu zugeordnet werden, sodass Sie sinnvollen Text sehen, die Software jedoch Kauderwelsch.

  • Text in Bildern
    Wenn ein Link in einem Bild steht, kann er nicht gelesen werden, es sei denn, das PDF ist korrekt getaggt.

  • Doppelte Links
    Ein Link kann sowohl als getaggter Inhalt als auch als Text existieren. Diese können unterschiedlich sein. Silktide prüft beide Varianten, aber PDF-Viewer können die eine oder die andere wählen.


Wie Silktide defekte Links in PDFs anzeigt

Wenn Silktide einen defekten Link in einem PDF meldet, hängt die Hervorhebung davon ab, ob er aus einer Annotation (getaggter Link) oder aus dem Text stammt:

  • Annotation (getaggte) Links
    Werden mit einem blauen Rahmen und einem blauen Hintergrund im PDF angezeigt.
    Im linken Panel wird das Problem als „In PDF-Annotation“ markiert.

    ⚠ Manchmal ist eine Annotation falsch eingerichtet, zum Beispiel nur über der ersten Zeile eines mehrzeiligen Links. In diesem Fall scheint es, als hätte Silktide nicht den gesamten Link markiert, aber das Problem liegt in der Art, wie die Annotation erstellt wurde.

  • Textlinks
    Werden mit einem roten Rahmen und einem roten Hintergrund im PDF angezeigt.
    Im linken Panel wird das Problem als „In PDF-Text“ markiert.

Dieser Unterschied hilft Ihnen sofort zu erkennen, welche Art von Link Silktide gefunden hat und warum er sich je nach Viewer unterschiedlich verhalten kann.


Ermittlung der Ursache eines defekten Links in einem PDF

Sobald Sie wissen, wie Silktide den Link markiert, können Sie weitere Untersuchungen durchführen:

  • Linktext kopieren und einfügen
    Wenn beim Einfügen unlesbare Zeichen erscheinen, ist der Text im PDF nicht maschinenlesbar.

  • Jede Zeile eines mehrzeiligen Links einzeln anklicken
    Wenn verschiedene Ziele erscheinen, ist der Link wahrscheinlich als mehrere überlappende Tags definiert.

  • In Acrobat Reader prüfen
    Rechtsklicken Sie auf den Link, wählen Sie Link bearbeiten… und öffnen Sie den Reiter Aktionen. Dort sehen Sie die exakte URL, auf die der Link verweist.


Was soll ich tun?

  1. Öffnen Sie das PDF und überprüfen Sie den Link direkt in dem Viewer, den Ihr Publikum am wahrscheinlichsten verwendet (z. B. Chrome, Acrobat oder Edge).

  2. Wenn der Link in diesem Viewer nicht funktioniert, ist der Bericht korrekt und der Link muss repariert werden.

  3. Wenn der Link in diesem Viewer funktioniert, dann:
    a. Dies ist wahrscheinlich ein Beispiel dafür, wie verschiedene Viewer Links unterschiedlich interpretieren. Silktide kann ihn als defekt melden, weil das PDF den Link nicht standardmäßig definiert. Dies kann sowohl bei Textlinks (rote Markierungen) als auch bei Annotation/getaggten Links (blaue Markierungen) vorkommen.
    b. In diesem Fall können Sie Ignorieren verwenden, um das einzelne Ergebnis auszublenden, oder Seite ignorieren, wenn eine ganze Seite betroffen ist.

  4. Wenn der Text wie ein Link aussieht (zum Beispiel https://www.example.com), aber in keinem Viewer anklickbar ist, sollten Sie das PDF aktualisieren, sodass es richtige anklickbare Links enthält.


Zusammenfassung

Berichte über defekte Links in PDFs sind in der Regel korrekt. Da jedoch die meisten PDFs nicht getaggt sind und jeder Viewer Text unterschiedlich interpretiert, können einige Links zwischen Tools inkonsistent erscheinen.

Silktide hebt Annotation (getaggte) Links blau hervor und textbasierte Links rot, sodass Sie sofort erkennen können, welche Art von Problem gefunden wurde. Dies kann manchmal wie ein Fehlalarm wirken, spiegelt in Wirklichkeit jedoch wider, wie PDFs funktionieren. Sie können solche Fälle sicher mit den Ignorieren-Werkzeugen ausblenden oder die ursprüngliche PDF-Datei verbessern, sodass Links in einem zuverlässigeren Format gespeichert werden.


Wir haben ChatGPT verwendet, um die englische Version dieses Artikels zu übersetzen. Wenn Sie etwas sehen, das geändert werden sollte, kontaktieren Sie bitte unser Support-Team.

Hat dies deine Frage beantwortet?