Übersicht
Silktide überprüft Links in PDFs, um sicherzustellen, dass sie korrekt funktionieren. Aufgrund der Art und Weise, wie PDFs Text speichern und darstellen, können die Ergebnisse manchmal unerwartet aussehen. Die meisten gemeldeten defekten Links sind echt, aber PDFs behandeln Links nicht einheitlich. Unterschiedliche PDF-Viewer interpretieren Links unterschiedlich, was bedeutet, dass ein Link in einem Viewer funktioniert, in einem anderen jedoch fehlschlagen kann.
Daher können einige Ergebnisse fehlerhaft erscheinen, obwohl sie lediglich widerspiegeln, wie PDFs funktionieren.
Warum passiert das?
PDFs definieren Links nicht auf eine einheitliche oder eindeutige Weise. Viele Programme, die PDFs lesen – darunter Adobe, Google, Apple, Microsoft und Silktide – können dieselben Links unterschiedlich interpretieren oder sie überhaupt nicht erkennen.
Die meisten PDFs sind nicht „getaggt“, sodass Software raten muss, was ein Link ist. Diese Mehrdeutigkeit erklärt, warum ein Link in Chrome funktioniert, aber in Acrobat fehlschlägt, oder warum Silktide einen defekten Link meldet, der für Sie korrekt aussieht.
Wie Links in einem PDF definiert werden
Es gibt zwei Hauptarten, wie ein Link erscheinen kann:
1. Textlinks
In einem PDF können Sie eine Webadresse als normalen Text schreiben, zum Beispiel https://www.silktide.com
.
PDF-Viewer (wie Chrome oder Acrobat) und Silktide versuchen alle, solche Links automatisch zu erkennen. Da dies auf Schätzungen basiert, unterscheiden sich die Ergebnisse je nach Plattform.
2. Getaggte (Annotation-) Links
Ein „getaggtes“ PDF enthält zusätzliche Informationen, die Links eindeutig definieren. Diese Links werden auch als Annotationen bezeichnet. Theoretisch sollten alle PDF-Viewer diese konsistent interpretieren.
In der Praxis wird das Tagging jedoch oft fehlerhaft durchgeführt, und verschiedene Viewer versuchen, schlechtes Tagging auf unterschiedliche Weise zu korrigieren. Daher können selbst getaggte Links inkonsistent sein.
Warum Links in PDFs nicht immer wie erwartet funktionieren
Mehrzeilige Links
Sofern ein PDF nicht getaggt ist (was selten vorkommt), besteht der Text lediglich aus platzierten Zeichen, nicht aus strukturierten Sätzen. Komplexe Layouts erschweren es der Software, zusammengehörige Wörter zu erkennen, sodass mehrzeilige Links falsch interpretiert werden können.
Ligaturen
Manche Zeichenpaare wie fi, fl oder ff werden aus ästhetischen Gründen zu einem einzigen Zeichen kombiniert.
Zum Beispiel:
Wenn dies geschieht, können die ursprünglichen Zeichen verloren gehen, sodass Silktide oder andere Software den ursprünglichen Link nicht rekonstruieren können.
Weiche und harte Bindestriche
Links, die über mehrere Zeilen laufen, können Bindestriche enthalten:
www.beispiel- website.com
Dies könnte alswww.beispiel-website.com
oderwww.beispielwebsite.com
interpretiert werden.
Da PDFs dies selten eindeutig definieren, nehmen die meisten Programme an, dass der Bindestrich Teil der URL ist.
Unlesbare oder manipulierte PDFs
Manche PDFs sind absichtlich so erstellt, dass Text nicht maschinenlesbar ist. Zeichen können im Hintergrund neu zugeordnet werden, sodass Sie sinnvollen Text sehen, die Software jedoch Kauderwelsch.
Text in Bildern
Wenn ein Link in einem Bild steht, kann er nicht gelesen werden, es sei denn, das PDF ist korrekt getaggt.
Doppelte Links
Ein Link kann sowohl als getaggter Inhalt als auch als Text existieren. Diese können unterschiedlich sein. Silktide prüft beide Varianten, aber PDF-Viewer können die eine oder die andere wählen.
Wie Silktide defekte Links in PDFs anzeigt
Wenn Silktide einen defekten Link in einem PDF meldet, hängt die Hervorhebung davon ab, ob er aus einer Annotation (getaggter Link) oder aus dem Text stammt:
Annotation (getaggte) Links
Werden mit einem blauen Rahmen und einem blauen Hintergrund im PDF angezeigt.
Im linken Panel wird das Problem als „In PDF-Annotation“ markiert.⚠ Manchmal ist eine Annotation falsch eingerichtet, zum Beispiel nur über der ersten Zeile eines mehrzeiligen Links. In diesem Fall scheint es, als hätte Silktide nicht den gesamten Link markiert, aber das Problem liegt in der Art, wie die Annotation erstellt wurde.
Textlinks
Werden mit einem roten Rahmen und einem roten Hintergrund im PDF angezeigt.
Im linken Panel wird das Problem als „In PDF-Text“ markiert.
Dieser Unterschied hilft Ihnen sofort zu erkennen, welche Art von Link Silktide gefunden hat und warum er sich je nach Viewer unterschiedlich verhalten kann.
Ermittlung der Ursache eines defekten Links in einem PDF
Sobald Sie wissen, wie Silktide den Link markiert, können Sie weitere Untersuchungen durchführen:
Linktext kopieren und einfügen
Wenn beim Einfügen unlesbare Zeichen erscheinen, ist der Text im PDF nicht maschinenlesbar.Jede Zeile eines mehrzeiligen Links einzeln anklicken
Wenn verschiedene Ziele erscheinen, ist der Link wahrscheinlich als mehrere überlappende Tags definiert.In Acrobat Reader prüfen
Rechtsklicken Sie auf den Link, wählen Sie Link bearbeiten… und öffnen Sie den Reiter Aktionen. Dort sehen Sie die exakte URL, auf die der Link verweist.
Was soll ich tun?
Öffnen Sie das PDF und überprüfen Sie den Link direkt in dem Viewer, den Ihr Publikum am wahrscheinlichsten verwendet (z. B. Chrome, Acrobat oder Edge).
Wenn der Link in diesem Viewer nicht funktioniert, ist der Bericht korrekt und der Link muss repariert werden.
Wenn der Link in diesem Viewer funktioniert, dann:
a. Dies ist wahrscheinlich ein Beispiel dafür, wie verschiedene Viewer Links unterschiedlich interpretieren. Silktide kann ihn als defekt melden, weil das PDF den Link nicht standardmäßig definiert. Dies kann sowohl bei Textlinks (rote Markierungen) als auch bei Annotation/getaggten Links (blaue Markierungen) vorkommen.
b. In diesem Fall können Sie Ignorieren verwenden, um das einzelne Ergebnis auszublenden, oder Seite ignorieren, wenn eine ganze Seite betroffen ist.Wenn der Text wie ein Link aussieht (zum Beispiel
https://www.example.com
), aber in keinem Viewer anklickbar ist, sollten Sie das PDF aktualisieren, sodass es richtige anklickbare Links enthält.
Zusammenfassung
Berichte über defekte Links in PDFs sind in der Regel korrekt. Da jedoch die meisten PDFs nicht getaggt sind und jeder Viewer Text unterschiedlich interpretiert, können einige Links zwischen Tools inkonsistent erscheinen.
Silktide hebt Annotation (getaggte) Links blau hervor und textbasierte Links rot, sodass Sie sofort erkennen können, welche Art von Problem gefunden wurde. Dies kann manchmal wie ein Fehlalarm wirken, spiegelt in Wirklichkeit jedoch wider, wie PDFs funktionieren. Sie können solche Fälle sicher mit den Ignorieren-Werkzeugen ausblenden oder die ursprüngliche PDF-Datei verbessern, sodass Links in einem zuverlässigeren Format gespeichert werden.
Wir haben ChatGPT verwendet, um die englische Version dieses Artikels zu übersetzen. Wenn Sie etwas sehen, das geändert werden sollte, kontaktieren Sie bitte unser Support-Team.