Verschiedenes > Hardlinks

Anwendungsbeispiel

Threadsammlung verkleinern

Wenn man in einem Forum aktiv ist und häufig Diskussionen als HTML-Seiten abspeichert, liegen in den Unterverzeichnissen zu den Seiten meist identische Dateien wie Avatare, Smilies, Buttonbilder usw. Dies können je Seite schnell ein paar hundert Kilobyte sein.

Um die Duplikate in Hardlinks umzuwandeln kann man beispielsweise das Tool Duplicate File Hard Linker (DFHL) von Jens Scheffler und Oliver Schneider verwenden.

Im Beispiel wurden drei Seiten aus einem Forum gespeichert:

Die Eigenschaften des Ordners nützen nichts, wenn man später wissen will, ob bzw wieviel Speicherplatz man eingespart hat. Vielmehr muss man sich Eigenschaften der Partition ansehen:

Da der DFHL ein Commandline-Tool ist, wird eine Batch-Datei benötigt. Dazu wird in dem Ordner, in welchem das Tool entpackt wurde, eine Textdatei erstellt. Diese muss einen Namen mit der Dateierweiterung .BAT oder .CMD erhalten.

Die Textdatei wird über das Kontextmenü (Rechtsklick auf die Datei) zum Bearbeiten geöffnet. Der Inhalt sieht im Beispiel so aus:

Die Parameter sind auf der Homepage so erläutert:

  • /h - Verarbeitet zusätzlich versteckte Dateien. Standard ist, versteckte Dateien zu überspringen.
  • /m - Verarbeitet Dateien kleiner als 1024 Bytes. Standardmäßig werden kleine Dateien übersprungen, da diese nicht viel Optimierungspotential bieten.
  • /l - Führt die Verlinkung von Dateien wirklich aus. Standardmäßig werden die angegebenen Ordner nur getestet, nur mit diesem Parameter wird wirklich etwas an dem Dateisystem verändert.
  • /r - Untersucht alle Unterverzeichnisse der angegebenen Pfade rekursiv.

Ist dies erledigt, führt man die Batchdatei aus. Es öffnet sich ein Konsolenfenster, welches sich nach getaner Arbeit wieder schließt.

Während sich die Eigenschaften des Ordners nicht ändern, sieht es bei den Eigenschaften der Partition anders aus:

Der obere Wert ist zum Vergleich ohne Verwendung des Parameter /m. Durch die Zusammenfassung der drei Seiten wurden etwa 300 kB (150 je Seite) Speicherplatz eingespart.

Um dies genauer ansehen zu können, habe ich ein kleines Tool geschrieben. Es zeigt die Id der Datei/des Inodes sowie die Eigenschaften und die dazugehörigen Dateien an:

Downloads