Prinzipien der Informationskomprimierung. Übersicht über Datenkomprimierungsmethoden Bei der Archivierung hängt der Grad der Dateikomprimierung davon ab

Einer der häufigsten Typen Systemprogramme sind Programme zum Archivieren und Verpacken von Dateien durch Komprimieren der darin gespeicherten Informationen.

Bei der Informationskomprimierung handelt es sich um den Prozess der Transformation von in einer Datei gespeicherten Informationen, wodurch deren Redundanz verringert wird und dementsprechend weniger Speicher für die Speicherung benötigt wird.

Die Komprimierung von Informationen in Dateien erfolgt durch Eliminierung von Redundanz verschiedene Wege, beispielsweise durch Vereinfachung der Codes, Eliminierung konstanter Bits oder Darstellung sich wiederholender Symbole oder einer sich wiederholenden Folge von Symbolen durch einen Wiederholungsfaktor und entsprechende Symbole. Für eine solche Informationskomprimierung werden verschiedene Algorithmen verwendet.

Es können sowohl eine als auch mehrere Dateien komprimiert werden, die in komprimierter Form im sogenannten abgelegt werden Archivdatei, oder Archiv.

Eine Archivdatei ist eine speziell organisierte Datei, die eine oder mehrere Dateien in komprimierter oder unkomprimierter Form enthält offizielle Informationenüber Dateinamen, Datum und Uhrzeit ihrer Erstellung oder Änderung, Größen usw.

Der Zweck der Dateiverpackung besteht in der Regel darin, eine kompaktere Platzierung von Informationen auf der Festplatte zu gewährleisten und so die Zeit und dementsprechend die Kosten für die Übertragung von Informationen über Kommunikationskanäle zu reduzieren Computernetzwerke. Darüber hinaus vereinfacht das Packen einer Gruppe von Dateien in einer Archivdatei deren Übertragung von einem Computer auf einen anderen erheblich, verkürzt die Zeit zum Kopieren von Dateien auf Datenträger, ermöglicht den Schutz von Informationen vor unbefugtem Zugriff und trägt zum Schutz vor Infektionen durch Computerviren bei.

Unter Kompressionsrate Verstehen Sie das Verhältnis der Größen der komprimierten Datei und des Originals, ausgedrückt als Prozentsatz.

Kompressionsrate hängt vom verwendeten Komprimierungsprogramm, der Komprimierungsmethode und dem Typ der Quelldatei ab. Grafische Bilddateien werden am besten komprimiert Textdateien, Datendateien, deren Komprimierungsverhältnis 5 - 40 % erreichen kann, Dateien ausführbarer Programme und Lademodule werden weniger komprimiert - 60 - 90 %. Archivdateien werden nahezu nicht komprimiert. Archivierungsprogramme unterscheiden sich in den von ihnen verwendeten Komprimierungsmethoden, was sich folglich auf das Komprimierungsverhältnis auswirkt.

Archivieren (Verpacken) – Platzieren (Herunterladen) von Quelldateien in einer Archivdatei in komprimierter oder unkomprimierter Form.

Beim Entpacken (Entpacken) werden Dateien aus einem Archiv genau so wiederhergestellt, wie sie waren, bevor sie in das Archiv geladen wurden. Beim Entpacken werden Dateien aus dem Archiv extrahiert und auf der Festplatte oder in abgelegt RAM.

Programme, die Dateien packen und entpacken, werden Archivierungsprogramme genannt.

Große Archivdateien können auf mehreren Datenträgern (Volumes) abgelegt werden. Solche Archive heißen Multi Volumen. Tom ist Komponente mehrbändiges Archiv. Indem Sie ein Archiv aus mehreren Teilen erstellen, können Sie seine Teile auf mehreren Medien aufzeichnen.

Haupttypen von Archivierungsprogrammen

Derzeit werden mehrere Dutzend Archivierungsprogramme verwendet, die sich in der Liste der Funktionen und Betriebsparameter unterscheiden, die besten von ihnen haben jedoch ungefähr die gleichen Eigenschaften. Von den meisten beliebte Programme Wir können unterscheiden: Zip (und seine Modifikation WinZip), WinRAR, Arj (und seine Varianten), G-Zip, 7-Zip.

Mit Archivprogrammen können Sie auch Archive erstellen, für deren Entpacken keine Programme erforderlich sind, da die Archivdateien selbst ein Entpackprogramm enthalten können. Solche Archivdateien werden als selbstextrahierend bezeichnet. Eine selbstextrahierende Archivdatei ist ein bootfähiges, ausführbares Modul, das in der Lage ist, die darin enthaltenen Dateien unabhängig zu entpacken, ohne ein Archivierungsprogramm zu verwenden.

Selbstextrahierendes Archiv habe den Namen bekommen SFX-Archiv(selbstextrahierend). Archive dieser Art werden üblicherweise im EXE-Dateiformat erstellt.

Viele Archivierungsprogramme entpacken Dateien, indem sie sie auf der Festplatte ablegen, aber es gibt auch Programme, die darauf ausgelegt sind, ein gepacktes ausführbares Modul (Programm) zu erstellen. Als Ergebnis einer solchen Verpackung wird eine Programmdatei mit demselben Namen und derselben Erweiterung erstellt, die sich beim Laden in den RAM selbst entpackt und sofort ausgeführt wird. Gleichzeitig besteht auch die Möglichkeit, die Programmdatei wieder in das entpackte Format zu konvertieren. Zu diesen Archivierern gehören die Programme Upx, PKLITE, LZEXE.

Das EXPAND-Programm, das Teil der Betriebsmittel ist Windows-Systeme, wird zum Entpacken von Softwareproduktdateien verwendet, die von Microsoft bereitgestellt werden.

Möglichkeiten zur Verwaltung des Archivierungsprogramms

Das Archivierungsprogramm wird von einem davon gesteuert folgende Methoden:

  • - mit Hilfe Befehlszeile, bei dem ein Startbefehl generiert wird, der den Namen des Archivierungsprogramms, den Steuerbefehl und seine Konfigurationsschlüssel sowie die Namen der Archiv- und Quelldateien enthält;
  • - Verwendung der integrierten Shell- und Dialogfenster, die nach dem Start des Programms angezeigt werden und die Steuerung über Menüs und ermöglichen Funktionstasten, was komfortablere Arbeitsbedingungen für den Benutzer schafft;
  • - mit Hilfe Kontextmenü Dirigent in Betriebssystem Windows.

Der Grad der Informationskomprimierung hängt von mehreren Gründen ab:

Erstens ist die Art der komprimierten Daten von großer Bedeutung. Grafik- und Textdateien werden am besten komprimiert. Für sie kann das Kompressionsverhältnis zwischen fünf und vierzig Prozent liegen. Dateien von ausführbaren Programmen, Lademodulen und Multimediadateien werden schlechter komprimiert.

Zweitens ist die Komprimierungsmethode von großer Bedeutung.

Drittens ist es auch wichtig, welcher Archiver verwendet wird. Bei der Auswahl des Archivierungstyps orientieren sie sich in der Regel an folgenden Überlegungen: Das Komprimierungsverhältnis soll möglichst hoch sein und der Zeitaufwand für das Packen und Entpacken von Dateien möglichst gering sein.

Programme zur Informationskomprimierung

Die Komprimierung erfolgt mithilfe von Archivierungsprogrammen. Heutzutage sind vier Archivierungsprogramme am gebräuchlichsten: WinRar, WinAce, 7Zip und WinZip. Hinsichtlich aktuelles Programm, es hält keiner Kritik stand.

Werfen wir einen genaueren Blick auf den Archiver – WinRar. Dieser Archiver kann mit den folgenden Dateitypen verknüpft werden: RAR, ZIP, CAB, ARJ, LZH, ACE, 7-Zip, TAR, GZip, UUE, BZ2, JAR, ISO.

Das Programm unterstützt Dateien nahezu unbegrenzter Größe (bis zu 8.589.934.591 GB). Um jedoch mit Dateien zu arbeiten, die größer als 4 GB sind, müssen Sie darin arbeiten Dateisystem NTFS.

Bei der Wahl der optimalen Komprimierungseinstellungen sind einige Dinge zu beachten:

Obwohl WinRAR das ZIP-Format unterstützt, empfiehlt es sich in den meisten Fällen, RAR zu wählen. Dadurch wird eine höhere Komprimierungsstufe erreicht. Sie können Dateien im ZIP-Format komprimieren, wenn Sie nicht sicher sind, ob auf dem Computer, auf dem die Dateien dekomprimiert werden, ein Programm installiert ist, mit dem RAR-Dateien dekomprimiert werden können.

Sie müssen entscheiden, welche Komprimierungsmethode am besten geeignet ist. Je höher das Komprimierungsverhältnis, desto länger dauert die Archivierung. Daher müssen Sie den Zweck berücksichtigen, für den die Daten archiviert werden. Wenn es sich um eine Langzeitspeicherung handelt, ist es natürlich sinnvoll, abzuwarten und sich ein Archiv mit der maximalen Komprimierungsstufe zu besorgen. Wenn Sie jedoch nur mehrere Dokumente per Post versenden müssen, ist auch die Komprimierungsstufe Normal für Sie geeignet.

Wenn Sie eine maximale Dateikomprimierung erreichen möchten, verwenden Sie die Option „Festes Archiv erstellen“. Allerdings hat es auch seine Nachteile. Erstens dauert das Entpacken solcher Dateien länger als das Extrahieren aus einem normalen Archiv. Stellen Sie sich vor, Sie haben zweihundert Dateien in Ihrem Archiv. Wenn es auf die übliche Weise erstellt wurde, können Sie eine der Dateien problemlos extrahieren. Wenn Sie ein solides Archiv verwendet haben, kommt es darauf an, wie die benötigte Datei archiviert wird. Wenn es in der Mitte des zweiten Jahrhunderts war, muss das Programm zum Entpacken 150 Dateien entpacken, bevor es dort ankommt. Auch das Erstellen von Archiven auf diese Weise kann große Verluste mit sich bringen, denn wenn das Archiv beschädigt wird, gehen alle darin enthaltenen Dateien verloren. Beim üblichen Packen können Sie, wenn nicht alle, aber die meisten Dateien aus dem beschädigten Archiv extrahieren.

Wenn Sie ein großes Archiv erstellen müssen, kann dies ziemlich viel Zeit in Anspruch nehmen. Mit WinRar können Sie ungefähr bestimmen, wie lange es dauern wird, eine bestimmte Aufgabe abzuschließen. Hierfür ist die Option Benchmark und Hardwaretest vorgesehen. Ein weiterer Grund für die Verwendung dieser Option ist die Definition mögliche Fehler, was beim Archivieren einer bestimmten Konfiguration auf einem Computer aufgrund eines Hardwarefehlers auftreten kann.

Unter anderen WinRar-Einstellungen kann man die Möglichkeit erwähnen, selbstextrahierende Archive zu erstellen, die den Entpackpfad angeben. Für solche Dateien ist kein Archivierungsprogramm auf dem Computer erforderlich, auf dem sie entpackt werden sollen. Solche Archive werden SFX-Archive genannt. Ihre Nachteil gegenüber herkömmlichen Archivdateien ist größere Größe, da sie neben den eigentlich gepackten Dateien auch ein ausführendes EXE-Modul enthalten.

Der Inhalt eines RAR-Archivs kann unsichtbar gemacht werden. Dazu müssen Sie in den Programmeinstellungen im Fenster „Archivierung mit Passwort“ das Kontrollkästchen neben der Zeile „Dateinamen verschlüsseln“ aktivieren.

Sie können auch ein Passwort festlegen, um das Archiv zu öffnen. Aufgrund eines Fehlers beim Übertragen des Archivs per lokales Netzwerk oder Herunterladen aus dem Internet, sowie aufgrund eines Hardwarefehlers oder Virenbefall Das Archiv könnte beschädigt sein. Mit WinRar können Sie die Integrität der Daten bestimmen, indem Sie das Archiv mit der Option „Archivierte Dateien testen“ testen.

Um das Risiko eines Datenverlusts beim Erstellen zu minimieren WinRar-Archive Es wird empfohlen, die Option „Wiederherstellungsdatensatz bereitstellen“ zu verwenden (dieses Kontrollkästchen befindet sich auf der Registerkarte „Allgemein“ des Archiverstellungsfensters).

Wenn dies geschehen ist, kann das Archiv im Falle einer Beschädigung wiederhergestellt werden.

Darüber hinaus können Sie in WinRar die Wahrscheinlichkeit einer Beschädigung des RAR-Archivs verringern, indem Sie beim Erstellen die Größe der Wiederherstellungsinformationen angeben. Führen Sie dazu den Befehl „Befehle > Archiv vor Beschädigung schützen“ im Winrar-Fenster aus. In diesem Fall darf das Volumen des Wiederherstellungsdatensatzes zehn Prozent der gesamten Archivgröße nicht überschreiten.

Um beschädigte RAR-Archive wiederherzustellen, müssen Sie auswählen erforderliche Datei im WinRar-Fenster und führen Sie den Befehl Extras > Reparieren aus.

WinRAR lässt sich in das Kontextmenü integrieren und unterstützt nicht nur das Explorer-Menü, sondern auch andere Programme, zum Beispiel das beliebte Dateimanager Totaler Kommandant. Dies ermöglicht eine schnelle Archivierung von Dateien mit Standardeinstellungen und ohne Öffnen eines Programmfensters. Die Standardeinstellungen können übrigens entsprechend den Anforderungen, die Sie an Ihre Archive stellen, geändert werden. Dies kann durch Öffnen des WinRar-Fensters und Ausführen des Befehls Optionen > Einstellungen erfolgen. In diesem Fenster müssen Sie zur Registerkarte „Komprimierung“ gehen und auf die Schaltfläche „Standard erstellen“ klicken. Die in diesem Fenster angegebenen Einstellungen werden für die schnelle Archivierung verwendet. Wenn Sie die Archivierungseinstellungen ändern müssen, können Sie dies auch über das Kontextmenü tun. Wählen Sie dazu den Befehl Zum Archiv hinzufügen.... Hier können Sie das Format und die Komprimierungsstufe einstellen, den Archivnamen festlegen und weitere Archivierungsparameter auswählen.

Mit WinRar können Sie speichern Benutzer installiert Einstellungen in eine Datei mit der Erweiterung Reg. Diese Datei kann später in das Programm importiert werden, um die gegebene Konfiguration wiederzuverwenden. In dieser Datei werden Informationen wie der Verlauf der kürzlich erstellten Archive, Stausw. gespeichert.

Eine weitere praktische Winrar-Option ist die Möglichkeit, eigene Lesezeichen zu erstellen – Favoriten. Sehr oft ist es notwendig, regelmäßig dieselben Ordner auf Ihrer Festplatte zu archivieren. Durch das Hinzufügen von Informationen über den Speicherort dieser Ordner zu Lesezeichen können Sie im Programmfenster schnell zu ihnen navigieren und die erforderlichen Dateien und Unterverzeichnisse archivieren.

Die meisten Benutzer wissen, dass es manchmal erforderlich ist, die Größe von Quelldateien zu reduzieren, um beispielsweise deren Speicherung oder Senden zu vereinfachen. Email Komprimierung angewendet wird. Aus irgendeinem Grund erfolgt die Zuordnung in diesem Fall jedoch nur mit Archivierungsanwendungen und andere Datenkomprimierungstechniken werden nicht berücksichtigt. Als nächstes schauen wir uns am Beispiel einiger der häufigsten Situationen an, was den Grad der Dateikomprimierung bestimmt.

Was versteht man unter Dateikomprimierungsverhältnis?

Beginnen wir mit theoretischen Fragen. Wie hoch ist das Komprimierungsverhältnis einer Datei? Basierend auf den einfachsten Interpretationen dieses Begriffs bedeutet er das Verhältnis der Größe des endgültigen (komprimierten) Objekts zum anfänglichen Volumen. Eine solche Erklärung kann jedoch weitgehend ausschließlich auf Archivdaten zutreffen, da sie einige Probleme im Zusammenhang mit der Änderung des Multimediaformats, bei dem auch die Komprimierung ebenfalls sehr verbreitet ist, überhaupt nicht berücksichtigt. Im Allgemeinen kann man nicht sagen, dass der Grad der Dateikomprimierung nur von einer bestimmten Eigenschaft abhängt. Dabei spielen die Art des Objekts, die zur Komprimierung der Daten verwendeten Programme und die Geschwindigkeit des Komprimierungsprozesses eine Rolle. Als nächstes werden wir kurz einige wichtige Aspekte besprechen, die sich auf das Endergebnis der Reduzierung der Größe der Quelldaten auswirken können.

Der Grad der Dateikomprimierung hängt nur vom Dateityp ab: Stimmt das wirklich?

Ja, tatsächlich hat die Art der komprimierten Daten einen ziemlich großen Einfluss auf die Reduzierung der endgültigen Dateigröße, und nicht alle Formate können solchen Verfahren unterzogen werden. Dies lässt sich am Beispiel von Sounddateien erläutern, die zunächst in sich bereits komprimiert sind.

Beim Versuch, solche Daten in ein Archiv zu packen, ist es nahezu unmöglich, eine signifikante Größenreduzierung zu erreichen. Das Gleiche gilt für das WAV-Format. Wenn Sie jedoch nicht komprimieren, sondern von WAV nach MP3 transkodieren, kann die Größe um den Faktor zehn oder mehr reduziert werden. Viele Anwender schrecken sofort ab, dass der Grad der Dateikomprimierung vom Ausgangs- und Endformat abhängt. Dies ist nicht ganz richtig, da auch der verwendete Rekodierungsalgorithmus eine wichtige Rolle spielt, worauf gesondert eingegangen wird. Konzentrieren wir uns zunächst auf die Verwendung von Archivierern.

Was bestimmt den Grad der Dateikomprimierung beim Packen in ein Archiv?

Um zunächst die Essenz dieser Art der Komprimierung zu verstehen, verwenden wir zur Vereinfachung der Erklärung den gängigsten WinRAR-Archiver als Beispiel. Wir gehen nicht auf die Arten der gepackten Daten ein, sondern konzentrieren uns auf die Tools der Anwendung selbst.

Zunächst sollten Sie auf das endgültige Format des Archivs sowie die verwendete Verpackungsmethode achten. Es ist klar, dass in diesem Fall der Grad der Dateikomprimierung durch das Archivierungsprogramm von der bevorzugten Technik abhängt. Bei der Hochgeschwindigkeitsmethode ist die Komprimierung minimal, bei der maximalen Komprimierungsrate wird die Größe jedoch deutlicher reduziert und es wird mehr Zeit benötigt.

Wenn wir Dateiformate in Bezug auf Archiver betrachten, können die komprimierbarsten sein Textdokumente beliebige Formate.

Einige ausführbare Dateien im EXE-Format sind relativ gut komprimiert (mit Standardmethode Durch Komprimierung kann die Größe um mehr als die Hälfte reduziert werden. Am inkomprimierbarsten sind, wie bereits erwähnt, Multimediaobjekte. Und obwohl es zumindest irgendwie möglich ist, die Größe von Bildern zu reduzieren, funktionieren solche Aktionen mit Audio und Video nicht, ohne das ursprüngliche Format zu ändern, und Archivierer haben damit absolut nichts zu tun.

Arten der Grafik-, Video- und Audiokomprimierung

Bei Multimedia gibt es zwei Hauptarten der Komprimierung: verlustbehaftet und verlustfrei. Und in diesem Fall hängt der Grad der Dateikomprimierung genau von der verwendeten Komprimierungstechnologie ab.

Im ersten Fall ist die Komprimierung maximal, im zweiten Fall kann sie variieren, was durch die verwendeten Codecs und das endgültige Containerformat beeinflusst wird. So kann beispielsweise dieselbe AVI-Datei ein Container sein, der völlig unterschiedliche Datentypen und mit unterschiedlichem Komprimierungsgrad enthält. Aus diesem Grund kann es übrigens manchmal zu Problemen bei der Videowiedergabe auf Heimplayern kommen.

Wenn wir speziell über Multimedia sprechen, müssen Sie hier im Allgemeinen klar verstehen, dass es trotz Technologien zum Entfernen redundanter Inhalte (z. B (z. B. bei Grafiken oder Videos funktioniert dies nur bei unveränderlichen Szenen). Bei Audio wird die Bitrate reduziert und bestimmte Frequenzen herausgeschnitten. Der durchschnittliche Benutzer spürt den Unterschied vielleicht nicht, aber ein Profi mit scharfen Ohren wird sofort erkennen, was fehlt.

Die gängigsten Programme für alle Gelegenheiten

Lassen Sie uns ein wenig herausfinden, wovon der Grad der Dateikomprimierung abhängt. Nun sollten wir noch ein paar Worte zum Gebrauchten sagen Softwareprodukte. Unter den Archivprogrammen sind WinRAR, WinZIP und 7-Zip am häufigsten.

Was die Multimedia-Komprimierung betrifft, können Sie im einfachsten Fall spezielle Konverteranwendungen verwenden, die nach dem Prinzip der Transkodierung des Quellmaterials in ein anderes Format arbeiten, um die Dateigröße zu reduzieren.

Kurze Zusammenfassung

Zusammenfassend lässt sich festhalten, dass der Grad der Dateikomprimierung durch den Archivierer von mehreren Faktoren abhängt und am häufigsten von der Art der verwendeten Daten, die komprimiert werden Software und (normalerweise werden die paarweise arbeitenden Huffman- und Lempel-Ziv-Algorithmen verwendet). Bei Multimedia-Inhalten ist die Situation fast gleich, die dominierende Stellung nimmt jedoch die Formatkonvertierung von einem in ein anderes ein.

Zweck der Archivierung- Gewährleistung einer kompakteren Platzierung von Informationen auf der Festplatte sowie Reduzierung der Zeit und dementsprechend der Kosten für die Übertragung von Informationen über Kommunikationskanäle in Computernetzwerken. Darüber hinaus vereinfacht die Archivierung die Übertragung von Informationen von einem Computer auf einen anderen erheblich, verkürzt die Zeit für das Kopieren auf externe Medien, ermöglicht den Schutz von Informationen vor unbefugtem Zugriff und trägt zum Schutz vor Infektionen durch Computerviren bei.

Hauptmerkmal der Archivierung- das ist Informationskomprimierung, d.h. Konvertieren in eine Form, die die Redundanz in der Darstellung reduziert und dementsprechend weniger Speicher für die Speicherung benötigt.

Es können entweder eine oder mehrere Dateien komprimiert werden, die in komprimierter Form in einer sogenannten Archivdatei oder einem Archiv abgelegt werden und von dort in ihrer ursprünglichen Form extrahiert werden können.

Archivdatei (Archiv) ist eine speziell organisierte Datei, die eine oder mehrere Dateien in komprimierter oder unkomprimierter Form und Dienstinformationen über Dateinamen, Datum und Uhrzeit ihrer Erstellung oder Änderung, Größen usw. enthält.

Der Vorgang des Schreibens von Dateien in eine Archivdatei wird aufgerufen Archivierung(Archivieren, Verpacken) und Extrahieren von Dateien aus dem Archiv - entpacken(Entpacken, Auspacken).

Der Grad der Dateikomprimierung während der Archivierung hängt von ihrem Format ab. Einige Formate (z. B. Grafiken) erfordern eine Komprimierung durch die Programme, die diese Dateitypen erstellen, und werden daher beim Archivieren nicht kleiner. Bei der Archivierung werden Textdateien und Datenbankdateien am besten komprimiert, Dateien von ausführbaren Programmen und Lademodulen werden weniger komprimiert. Das Komprimierungsverhältnis wird auch von der Komprimierungsmethode beeinflusst.

Zusätzlich zu regulären Archivdateien können Sie fortlaufende, mehrbändige und selbstextrahierende Archive sowie deren Kombinationen erstellen, zum Beispiel: selbstextrahierende Archive mit mehreren Bänden, fortlaufende Archive mit mehreren Bänden usw.

Kontinuierliches (solides) Archiv ist ein auf besondere Weise gepacktes Archiv, bei dem alle komprimierten Dateien als ein sequentieller Datenstrom betrachtet werden.

Durch die kontinuierliche Archivierung wird die Komprimierungsrate insbesondere beim Hinzufügen deutlich erhöht große Menge kleine ähnliche Dateien. Allerdings gibt es auch Nachteile:

§ bestehende fortlaufende Archive werden langsamer aktualisiert als reguläre;

§ verschlüsselte fortlaufende Archive können nicht geändert werden;

§ Um eine einzelne Datei aus einem fortlaufenden Archiv zu extrahieren, müssen Sie alle zuvor archivierten Dateien analysieren. Daher ist das Extrahieren einzelner Dateien aus der Mitte eines fortlaufenden Archivs langsamer als das Extrahieren aus einem regulären Archiv. Wenn jedoch alle oder die ersten paar Dateien aus einem fortlaufenden Archiv extrahiert werden, dann ist die Entpackgeschwindigkeit in diesem Fall fast die gleiche wie bei regulären Archiven;


§ Wenn eine Datei in einem fortlaufenden Archiv beschädigt ist, ist es auch nicht möglich, alle darauf folgenden Dateien zu extrahieren. Daher wird empfohlen, beim Speichern eines fortlaufenden Archivs auf einem nicht vertrauenswürdigen Medium Wiederherstellungsinformationen hinzuzufügen.

Kontinuierliche Archive werden am besten in folgenden Fällen verwendet:

§ das Archiv wird selten aktualisiert;

§ Es besteht keine Notwendigkeit, eine oder mehrere Dateien häufig aus dem Archiv zu extrahieren.

§ einer ist archiviert große Datei;

§ Das Komprimierungsverhältnis ist wichtiger als die Komprimierungsgeschwindigkeit.

Dateien in fortlaufenden Archiven werden normalerweise nach Erweiterung sortiert, die Sortierreihenfolge kann jedoch geändert werden.

Mehrbändige Archive- Dabei handelt es sich um Archive, die aus mehreren Teilen (Bänden) bestehen. Typischerweise werden Volumes verwendet, um ein großes Archiv auf mehreren Disketten oder anderen Wechselmedien zu speichern.

Das erste Volume in der Sequenz verfügt über die übliche Standarderweiterung des Archivierungsprogramms, und die Erweiterungen nachfolgender Bände haben den ersten Buchstaben der Archivierungsprogrammerweiterung und eine Seriennummer.

Dateien auf vorhandenen Volumes können nicht hinzugefügt, aktualisiert oder gelöscht werden.

Selbstextrahierendes (SFX, von den englischen Wörtern SelF-eXtracting) Archiv ist ein Archiv, an das ein ausführbares Modul angehängt ist. Mit diesem Modul können Sie Dateien extrahieren, indem Sie das Archiv einfach als ausführen Regelmäßiges Programm. Somit ist zum Extrahieren des Inhalts des SFX-Archivs kein zusätzlicher Aufwand erforderlich externe Programme. SFX-Archive haben wie alle anderen ausführbaren Dateien normalerweise die Erweiterung .EXE, aber Sie können mit ihnen auf die gleiche Weise wie mit jedem anderen Archiv arbeiten.

SFX-Archive sind in Fällen nützlich, in denen Sie ein Archiv an jemanden übertragen müssen, aber nicht sicher sind, ob der Empfänger über den geeigneten Archivierer zum Extrahieren der Dateien verfügt.

Multi-Volume- und selbstextrahierende Archive können auch fortlaufend sein.

Es werden Programme aufgerufen, die Dateien archivieren/dearchivieren Archivierungsprogramme.

Archivierungsprogramme können anhand der folgenden Hauptparameter verglichen werden: Schnittstelle, Komprimierungsmethoden (Bestimmung des Grads der Dateikomprimierung), Arten der erstellten Archive, Betriebsgeschwindigkeit, Unterstützung für Formate anderer Archivierungsprogramme.

Beim Erstellen eines Archivs weist das Archivierungsprogramm der Archivdatei automatisch eine eigene Erweiterung zu, zum Beispiel zip, rar usw.

Das Archivierungsprogramm wird auf eine der folgenden Arten gesteuert:

1. über die Befehlszeile;

2. Verwendung einer integrierten Shell und Dialogfenstern, die die Steuerung über Menüs und Funktionstasten ermöglichen.

3. Verwendung von Funktionstastenkombinationen in Bedienshells, die in der Regel die Wahl zwischen mehreren DOS-Archivierungsprogrammen oder einem eigenen Shell-Archiver bieten können.

4. Verwendung grafischer Oberflächenelemente.

Trotz der vielen Archivprogramme arbeitet ein moderner Benutzer in der Regel tatsächlich mit zwei Archivformaten: ZIP und RAR.

Datenkomprimierungsmethoden haben eine ziemlich lange Entwicklungsgeschichte, die lange vor dem Aufkommen des ersten Computers begann. In diesem Artikel wird versucht, einen kurzen Überblick über die wichtigsten Theorien, Ideenkonzepte und deren Umsetzungen zu geben, ohne jedoch einen Anspruch auf absolute Vollständigkeit zu erheben. Ausführlichere Informationen finden sich beispielsweise bei Krichevsky R.E. , Ryabko B.Ya. Witten I.H. , Rissanen J. , Huffman D.A. , Gallager R.G. , Knuth D.E. , Vitter J.S. usw.

Die Informationskomprimierung ist ein Problem, das eine ziemlich lange Geschichte hat, viel länger als die Geschichte der Entwicklung der Computertechnologie, die (Geschichte) normalerweise parallel zur Geschichte der Entwicklung des Problems der Kodierung und Verschlüsselung von Informationen verlief. Alle Komprimierungsalgorithmen arbeiten mit einem Eingabestrom von Informationen, dessen minimale Einheit ein Bit und dessen maximale Einheit mehrere Bits, Bytes oder mehrere Bytes beträgt. Der Zweck des Komprimierungsprozesses besteht in der Regel darin, aus einem zunächst nicht kompakten Eingabestrom durch eine Transformation einen kompakteren Ausgabestrom von Informationseinheiten zu erhalten. Die wichtigsten technischen Merkmale von Komprimierungsprozessen und die Ergebnisse ihrer Arbeit sind:

Der Grad der Komprimierung (Komprimierungsbewertung) oder das Verhältnis (Verhältnis) der Volumina des ursprünglichen und des resultierenden Streams;

Komprimierungsrate – die Zeit, die für die Komprimierung einer bestimmten Informationsmenge aus einem Eingabestream aufgewendet wird, bevor daraus ein äquivalenter Ausgabestream erhalten wird;

Die Komprimierungsqualität ist ein Wert, der angibt, wie stark der Ausgabestream komprimiert wird, indem er mit demselben oder einem anderen Algorithmus erneut komprimiert wird.

Es gibt verschiedene Ansätze für das Problem der Informationskomprimierung. Einige haben eine sehr komplexe theoretische mathematische Grundlage, andere basieren auf den Eigenschaften des Informationsflusses und sind algorithmisch recht einfach. Jeder Ansatz und Algorithmus, der eine Datenkomprimierung oder -komprimierung implementiert, ist darauf ausgelegt, das Volumen des Ausgabeinformationsstroms durch seine reversible oder irreversible Transformation in Bits zu reduzieren. Daher lassen sich alle Komprimierungsmethoden zunächst nach dem Kriterium der Art oder des Formats der Daten in zwei Kategorien einteilen: reversible und irreversible Komprimierung.

Unter irreversibler Komprimierung versteht man eine solche Transformation des Eingabedatenstroms, bei der der Ausgabestrom, basierend auf einem bestimmten Informationsformat, in gewisser Weise ziemlich ähnlich ist äußere Merkmale Objekt zum Eingabestream, unterscheidet sich jedoch in der Lautstärke von diesem. Der Grad der Ähnlichkeit zwischen den Eingabe- und Ausgabeströmen wird durch den Grad der Übereinstimmung bestimmter Eigenschaften des Objekts (d. h. komprimierter und unkomprimierter Informationen gemäß einem bestimmten Datenformat) bestimmt, das durch einen bestimmten Informationsstrom dargestellt wird. Solche Ansätze und Algorithmen werden verwendet, um beispielsweise Daten aus Rastergrafikdateien mit einem geringen Grad an Bytewiederholung im Stream zu komprimieren. Dieser Ansatz nutzt die Struktureigenschaft des Grafikdateiformats und die Fähigkeit, ein grafisches Bild auf verschiedene (bzw. n) Arten darzustellen, das in der Anzeigequalität (für die Wahrnehmung durch das menschliche Auge) annähernd gleich ist. Daher entsteht bei solchen Algorithmen neben dem Grad bzw. der Stärke der Komprimierung auch der Begriff der Qualität, denn Da sich das Originalbild während des Komprimierungsprozesses verändert, kann Qualität als Grad der Übereinstimmung zwischen Original- und Ergebnisbild verstanden werden, subjektiv anhand des Informationsformats beurteilt. Bei Grafikdateien wird diese Übereinstimmung visuell ermittelt, es gibt jedoch auch entsprechende intelligente Algorithmen und Programme. Irreversible Komprimierung kann nicht in Bereichen eingesetzt werden, in denen eine exakte Übereinstimmung zwischen der Informationsstruktur der Eingabe- und Ausgabeströme erforderlich ist. Dieser Ansatz wird in gängigen Formaten zur Darstellung von Video- und Fotoinformationen implementiert, die als JPEG- und JFIF-Algorithmen sowie JPG- und JIF-Dateiformate bekannt sind.

Die reversible Komprimierung führt immer zu einer Verringerung des Volumens des ausgegebenen Informationsstroms, ohne seinen Informationsgehalt zu verändern, d.h. - ohne Verlust der Informationsstruktur. Darüber hinaus kann aus dem Ausgabestrom mithilfe eines Rekonstruktions- oder Dekomprimierungsalgorithmus die Eingabe erhalten werden, und der Wiederherstellungsprozess wird als Dekomprimierung oder Dekomprimierung bezeichnet. Erst nach dem Dekomprimierungsprozess sind die Daten gemäß ihrem internen Format für die Verarbeitung geeignet.

Bei reversiblen Algorithmen kann die Codierung als Prozess aus statistischer Sicht betrachtet werden, was nicht nur für die Konstruktion von Komprimierungsalgorithmen, sondern auch für die Bewertung ihrer Wirksamkeit noch nützlicher ist. Für alle reversiblen Algorithmen gibt es ein Konzept der Codierungskosten. Die Codierungskosten beziehen sich auf die durchschnittliche Länge eines Codeworts in Bits. Die Codierungsredundanz entspricht der Differenz zwischen den Kosten und der Entropie der Codierung, und ein guter Komprimierungsalgorithmus sollte die Redundanz immer minimieren (denken Sie daran, dass die Entropie der Informationen das Maß für ihre Unordnung ist). Shannons grundlegender Satz zur Informationskodierung besagt, dass „die Kosten der Kodierung immer nicht geringer sind als die Entropie der Quelle, obwohl sie beliebig nahe daran liegen können.“ Daher gibt es für jeden Algorithmus immer eine bestimmte Grenze für den Komprimierungsgrad, die durch die Entropie des Eingabestreams bestimmt wird.

Kommen wir nun direkt zu den algorithmischen Merkmalen reversibler Algorithmen und betrachten die wichtigsten theoretischen Ansätze zur Datenkomprimierung im Zusammenhang mit der Implementierung von Kodierungssystemen und Methoden der Informationskomprimierung.

Komprimierung durch Serienkodierungsmethode

Der bekannteste einfache Ansatz und Algorithmus zur reversiblen Komprimierung von Informationen ist Run Length Encoding (RLE). Der Kern der Methoden in diesem Ansatz besteht darin, Ketten oder Serien sich wiederholender Bytes oder deren Sequenzen durch ein Codierungsbyte und einen Zähler für die Anzahl ihrer Wiederholungen zu ersetzen. Das Problem bei allen ähnlichen Methoden besteht lediglich darin, die Art und Weise zu bestimmen, wie der Dekomprimierungsalgorithmus eine codierte Reihe von anderen nicht codierten Bytesequenzen im resultierenden Bytestrom unterscheiden könnte. Die Lösung des Problems wird üblicherweise durch das Setzen von Markierungen am Anfang der codierten Ketten erreicht. Solche Markierungen können beispielsweise charakteristische Bitwerte im ersten Byte einer kodierten Reihe, die Werte des ersten Bytes einer kodierten Reihe usw. sein. Diese Methoden sind in der Regel sehr effektiv zum Komprimieren von Rastergrafikbildern (BMP, PCX, TIF, GIF), weil Letztere enthalten ziemlich viele lange Serien sich wiederholender Bytesequenzen. Der Nachteil der RLE-Methode ist das relativ niedrige Komprimierungsverhältnis oder die Kosten für die Kodierung von Dateien mit einer kleinen Anzahl von Serien und, noch schlimmer, mit einer kleinen Anzahl sich wiederholender Bytes in der Serie.

Komprimierung ohne Verwendung der RLE-Methode

Der Prozess der Datenkomprimierung ohne Verwendung der RLE-Methode kann in zwei Phasen unterteilt werden: Modellierung und eigentlich Kodierung. Diese Prozesse und ihre implementierenden Algorithmen sind recht unabhängig und vielfältig.

Codierungsprozess und seine Methoden

Codierung bedeutet normalerweise, einen Zeichenstrom (in unserem Fall Bytes oder Nibbles) in einem bestimmten Alphabet zu verarbeiten, und die Häufigkeit des Auftretens von Zeichen im Strom ist unterschiedlich. Der Zweck der Kodierung besteht darin, diesen Strom in einen Bitstrom mit minimaler Länge umzuwandeln, was durch die Reduzierung der Entropie des Eingabestroms unter Berücksichtigung der Symbolfrequenzen erreicht wird. Die Länge des Codes, der Zeichen aus dem Stream-Alphabet darstellt, muss proportional zur Informationsmenge im Eingabestream sein, und die Länge der Stream-Zeichen in Bits darf kein Vielfaches von 8 oder gar variabel sein. Wenn die Wahrscheinlichkeitsverteilung der Häufigkeiten des Auftretens von Symbolen aus dem Alphabet des Eingabestroms bekannt ist, kann ein optimales Codierungsmodell erstellt werden. Aufgrund der Vielzahl unterschiedlicher Dateiformate wird die Aufgabe jedoch deutlich komplizierter. Die Häufigkeitsverteilung von Datensymbolen ist im Voraus unbekannt. In diesem Fall in Gesamtansicht werden zwei Ansätze verwendet.

Die erste besteht darin, den Eingabestrom anzuzeigen und eine Kodierung basierend auf den gesammelten Statistiken zu erstellen (dies erfordert zwei Durchläufe durch die Datei – einen zum Anzeigen und Sammeln statistischer Informationen, den zweiten zum Kodieren, was den Umfang solcher Algorithmen etwas einschränkt, weil Auf diese Weise wird die Möglichkeit der Single-Pass-On-the-Fly-Codierung in Telekommunikationssystemen eliminiert, bei denen das Datenvolumen manchmal unbekannt ist und deren erneute Übertragung oder Analyse unangemessen lange dauern kann. In diesem Fall wird das statistische Schema der verwendeten Kodierung in den Ausgabestream geschrieben. Diese Methode wird als statische Huffman-Codierung bezeichnet.

gastroguru 2017