In dem Dokument, das im Rahmen der parlamentarischen Untersuchungen zum 11. September freigegeben und veröffentlicht worden ist, sind diverse Passagen geschwärzt. In dem Satz „An Egyptian Islamic Jihad (EIJ) operative told an xxxxxxxx service at the same time that Bin Ladin was planning to exploit the operative’s access to the US to mount a terrorist strike“ soll die Schwärzung beispielsweise die geheimdienstliche Quelle der Information verschleiern.
Die Wissenschaftler wandelten das PDF in eine Bitmap und verglichen die ersten Zeilen des CIA-Textes mit dem per Skript in eine Datei gedruckten Text, um zunächst den Font zu ermitteln. Nachdem das geschafft war, ermittelten sie die Größe aller Wörter in einem Wörterbuch, die mit dem fraglichen Font gedruckt wurden und verglichen dies mit der Größe des geschwärzten Feldes. Das simple Verfahren reduzierte die Zahl der möglichen Lückenfüller auf 300, die sie schließlich von Hand sichteten. In diesem Fall erwies sich das Wort „Egyptian“ als bester Kandidat.
Sooo simpel und so genial … Find ich gut!
[ gelesen im Heise-Newsticker ]