Bilgi sıkıştırma ilkeleri. Veri sıkıştırma yöntemlerine genel bakış Arşivleme sırasında dosyanın sıkıştırma oranı,

En yaygın türlerden biri sistem programları Dosyaların içinde depolanan bilgileri sıkıştırarak arşivlemek, paketlemek için tasarlanmış programlardır.

Bilgi sıkıştırma, bir dosyada saklanan bilgilerin dönüştürülmesi işlemidir, bunun sonucunda fazlalığı azalır ve buna bağlı olarak depolama için daha az bellek gerekir.

Dosyalardaki bilgilerin sıkıştırılması, fazlalık ortadan kaldırılarak gerçekleştirilir. Farklı yollarörneğin kodları basitleştirerek, onlardan sabit bitleri çıkararak veya tekrar eden sembolleri veya tekrar eden bir sembol dizisini bir tekrarlama oranı ve karşılık gelen semboller olarak temsil ederek. Bu tür bilgi sıkıştırma için çeşitli algoritmalar kullanılır.

Hem bir hem de birkaç dosya sıkıştırılabilir, bunlar sözde sıkıştırılmış bir biçimde yerleştirilir. Arşiv dosyası veya arşivleyin.

Arşiv dosyası, sıkıştırılmış veya sıkıştırılmamış biçimde bir veya daha fazla dosya içeren özel olarak düzenlenmiş bir dosyadır ve servis bilgisi dosya adları, oluşturulma veya değiştirilme tarihi ve saati, boyutları vb. hakkında

Dosyaları paketlemenin amacı, genellikle bir diske daha kompakt bir bilgi yerleşimi sağlamak, zamanı ve buna bağlı olarak iletişim kanalları üzerinden bilgi aktarma maliyetini azaltmaktır. bilgisayar ağları... Ayrıca, bir grup dosyayı tek bir arşiv dosyasında paketlemek, bunların bir bilgisayardan diğerine aktarımını büyük ölçüde basitleştirir, dosyaların disklere kopyalanma süresini azaltır, bilgilerin yetkisiz erişime karşı korunmasına yardımcı olur ve bilgisayar virüslerinin bulaşmasına karşı korunmaya yardımcı olur.

Altında Sıkıştırma oranı sıkıştırılmış dosyanın ve orijinalin boyutlarının yüzde olarak ifade edilen oranını anlayın.

Sıkıştırma oranı kullanılan sıkıştırma programına, sıkıştırma yöntemine ve kaynak dosya türüne bağlıdır. En iyi sıkıştırılmış dosyalar sembolik görüntülerdir, metin dosyaları, sıkıştırma oranı% 5 - 40'a ulaşabilen veri dosyaları, yürütülebilir programların ve yük modüllerinin dosyaları daha az sıkıştırılır -% 60 - 90. Arşiv dosyaları zor sıkıştırılır. Arşivleme programları, kullanılan sıkıştırma yöntemlerinde farklılık gösterir ve bu da sıkıştırma oranını buna göre etkiler.

Arşivleme (paketleme) - kaynak dosyaları sıkıştırılmış veya sıkıştırılmamış biçimde bir arşiv dosyasına yerleştirme (yükleme).

Paketi açma (açma) - dosyaları arşive yüklemeden önce olduğu gibi arşivden geri yükleme işlemi. Paketi açarken, dosyalar arşivden çıkarılır ve diske veya Veri deposu.

Dosyaları paketleyen ve paketten çıkaran programlara arşivleme programları denir.

Büyük boyutlu arşiv dosyaları birden çok diskte (birim) bulunabilir. Bu tür arşivlere denir. Çok ses... Tom ... dır bileşençok ciltli arşiv Birkaç parçadan bir arşiv oluşturarak, bunun bölümlerini birden çok ortama kaydedebilirsiniz.

Başlıca arşivleme programları türleri

Şu anda, işlevler ve çalışma parametreleri listesinde farklılık gösteren birkaç düzine arşivleme programı kullanılmaktadır, ancak bunların en iyisi yaklaşık olarak aynı özelliklere sahiptir. En çok popüler programlar ayırt edilebilir: Zip (ve modifikasyonu WinZip), WinRAR, Arj (ve çeşitleri), G-Zip, 7-Zip.

Arşivleme programları ayrıca bu tür arşivler oluşturmanıza, herhangi bir programa ihtiyaç duymadığınız dosyaları çıkartmanıza izin verir, çünkü arşiv dosyalarının kendileri bir paket açma programı içerebilir. Bu arşiv dosyalarına kendi kendine açılan dosyalar denir. Kendiliğinden açılan arşiv dosyası, içindeki dosyaları bir arşiv programı kullanmadan kendi kendine ayıklayabilen önyüklenebilir, yürütülebilir bir modüldür.

Kendiliğinden açılan arşiv adını aldım SFX arşivi(Kendinden Çıkarma). Bu tür arşivler genellikle EXE dosya biçiminde oluşturulur.

Birçok arşivleme programı, dosyaları diske boşaltarak paketini açar, ancak paketlenmiş bir yürütülebilir modül (program) oluşturmak için tasarlanmış olanlar da vardır. Bu tür paketlemenin bir sonucu olarak, RAM'e yüklendiğinde kendi kendine açılan ve hemen başlatılan aynı ad ve uzantıya sahip bir program dosyası oluşturulur. Aynı zamanda, program dosyasının paketlenmemiş formata ters çevrilmesi de mümkündür. Bu arşivleyiciler Upx, PKLITE, LZEXE programlarını içerir.

Ameliyathane yardımcı programlarına dahil olan EXPAND programı Windows sistemleri, Microsoft tarafından sağlanan yazılım ürünlerinin dosyalarını açmak için kullanılır.

Arşivleyici programını yönetme yöntemleri

Arşivleyici programı aşağıdakilerden biri tarafından kontrol edilir: aşağıdaki yollar:

  • - kullanarak Komut satırı arşivleyici programın adını, kontrol komutunu ve yapılandırma anahtarlarını ve ayrıca arşiv ve kaynak dosyalarının adlarını içeren başlatma komutunun oluşturulduğu;
  • - programı başlattıktan sonra görünen ve menüyü kullanarak kontrol etmenizi sağlayan yerleşik kabuk ve iletişim kutularını kullanma ve fonksiyon tuşları kullanıcı için daha rahat bir çalışma ortamı yaratan;
  • - kullanarak bağlam menüsüİletken işletim sistemi Pencereler.

Bilgi sıkıştırma derecesi birkaç nedene bağlıdır:

İlk olarak, sıkıştırılan verinin türü büyük önem taşımaktadır. Grafik ve metin dosyaları en iyi şekilde sıkıştırılır. Onlar için sıkıştırma oranı yüzde beş ila kırk olabilir. Yürütülebilir programların dosyaları, yükleme modülleri, multimedya dosyaları daha kötü sıkıştırılır.

İkincisi, sıkıştırma yöntemi büyük önem taşımaktadır.

Üçüncüsü, hangi arşivleyicinin kullanıldığı da önemlidir. Arşivleyici türünü seçerken, genellikle aşağıdaki hususlara göre yönlendirilirler: sıkıştırma oranı mümkün olduğu kadar yüksek olacak ve dosyaları paketleme ve paketinden çıkarma süresi mümkün olduğunca az olacak şekilde.

Sıkıştırma programları

Sıkıştırma, arşiv programları kullanılarak gerçekleştirilir. Bugün en yaygın dört arşivleyici - WinRar, WinAce, 7Zip ve WinZip. İlişkin son program, incelemeye dayanmaz.

Arşivleyiciye daha yakından bakalım - WinRar Bu arşivleyici şu dosya türleriyle ilişkilendirilebilir: RAR, ZIP, CAB, ARJ, LZH, ACE, 7-Zip, TAR, GZip, UUE, BZ2, JAR, ISO.

Program neredeyse sınırsız boyuttaki dosyaları destekler (8.589.934.591 GB'a kadar). Ancak, 4 GB'den büyük dosyalarla çalışmak için şurada çalışmanız gerekir: dosya sistemi NTFS.

Optimum sıkıştırma ayarlarını seçerken akılda tutulması gereken birkaç şey vardır:

WinRAR, ZIP biçimini desteklese de, çoğu durumda RAR'ı seçmeniz önerilir. Bu, daha yüksek bir sıkıştırma seviyesi sağlayacaktır. Dosyaların açılacağı bilgisayara, RAR formatındaki dosyaları açmak için kullanılabilecek bir programın kurulacağından emin değilseniz, dosyaları ZIP'de sıkıştırabilirsiniz.

Hangi sıkıştırma yönteminin en iyi kullanılacağına karar vermek gerekir. Sıkıştırma oranı ne kadar yüksek olursa, arşivleme o kadar uzun sürer, bu nedenle burada verilerin arşivlenme amacını dikkate almanız gerekir. Bu uzun süreli bir depolama ise elbette bekleyip maksimum sıkıştırma oranı ile arşivi almak mantıklı ama sadece birkaç belgeyi mail ile göndermeniz gerekiyorsa Normal sıkıştırma oranı size uyacaktır.

Dosyalarınız için maksimum sıkıştırma oranını elde etmeniz gerekiyorsa, Katı arşiv oluştur seçeneğini kullanın. Bununla birlikte, dezavantajları da vardır. İlk olarak, bu tür dosyaları açmak, normal bir arşivden çıkarmaktan daha uzun sürer. Arşivinizde iki yüz dosya olduğunu hayal edin. Her zamanki gibi oluşturulmuşsa, dosyalardan birini kolayca çıkarabilirsiniz. Katı arşiv kullandıysanız, burada istediğiniz dosyanın nasıl arşivlendiği önemli olacaktır. İkinci yüzün ortasındaysa, paketi açmak için programın kendisine ulaşana kadar 150 dosyayı açması gerekir. Bu şekilde arşiv oluşturmak da büyük kayıplara neden olabilir, çünkü arşiv hasar görürse içindeki tüm dosyaları kaybedersiniz. Her zamanki gibi paketleme durumunda, dosyaların tamamını olmasa da çoğunu hasarlı arşivden çıkarabilirsiniz.

Büyük bir arşiv oluşturulması gerekiyorsa, bu oldukça zaman alıcı olabilir. WinRar, belirli bir görevi tamamlamanın ne kadar süreceğini belirlemenize olanak tanır. Benchmark ve donanım testi seçeneği bunun için tasarlanmıştır. Bu seçeneğin kullanılmasının bir başka nedeni de olası hatalar bir donanım arızası nedeniyle bir bilgisayarda belirli bir yapılandırmayı arşivlerken ortaya çıkabilir.

Diğer WinRar ayarları, açma yolunu belirten kendi kendine açılan arşivler oluşturma yeteneğini içerir.Bu tür dosyalar, açılması planlanan bilgisayarda bir arşivleme programı gerektirmez.Bu tür arşivlere SFX arşivleri denir.Dosyalar daha büyüktür, çünkü gerçek paketlenmiş dosyalara ek olarak, yürütülebilir bir EXE modülü de içerirler.

RAR arşivinin içeriği görünmez hale getirilebilir. Bunu yapmak için program ayarlarında, Parola ile Arşivleme penceresinde Dosya Adlarını Şifrele satırının karşısındaki kutuyu işaretleyin.

Arşivi açmak için bir şifre de belirleyebilirsiniz. Arşivi şuraya aktarırken bir hata sonucu yerel ağ veya İnternet'ten indirilmesi veya bir donanım arızası veya virüs saldırısı arşiv zarar görebilir. WinRar, Arşivlenmiş Dosyaları Test Et seçeneğini kullanarak arşivi test ederek verilerin bütünlüğünü belirlemenizi sağlar.

Veri kaybı olasılığını en aza indirmek için, oluştururken WinRar arşivleri Kurtarma Kaydı Koy seçeneğinin kullanılması önerilir (bu onay kutusu arşiv oluşturma penceresinin Genel sekmesinde bulunabilir).

Bu yapıldıysa, arşiv hasar görürse geri yüklenebilir.

Ayrıca WinRar'da, bir RAR arşivini oluştururken kurtarma bilgilerinin boyutunu belirterek hasar olasılığını azaltabilirsiniz. Bunu yapmak için Winrar penceresinde Komutlar> Arşivi Hasardan Koru komutunu çalıştırın. Aynı zamanda, Kurtarma Kaydının hacmi, toplam arşiv boyutunun yüzde onu aşamaz.

Hasarlı RAR arşivlerini kurtarmak için istenen dosya WinRar penceresinde Araçlar > Onar komutunu çalıştırın.

WinRAR içerik menüsüne yerleştirilebilir ve yalnızca gezgin menüsünü değil, aynı zamanda popüler dosya gibi diğer programları da destekler. Toplam yönetici Komutan. Bu, varsayılan ayarları kullanarak ve program penceresini açmadan dosyaları hızlı bir şekilde arşivlemeyi mümkün kılar. Bu arada, arşivleriniz için sahip olduğunuz gereksinimlere göre varsayılan ayarlar değiştirilebilir. Bu, WinRar penceresini açarak ve Seçenekler> Ayarlar komutunu çalıştırarak yapılabilir. Bu pencerede, Sıkıştırma sekmesine gidin ve Varsayılan Oluştur düğmesini tıklayın. Bu pencerede belirtilen ayarlar hızlı arşivleme için kullanılacaktır. Arşivleme ayarlarını değiştirmeniz gerekirse, bu, içerik menüsü kullanılarak da yapılabilir. Bunu yapmak için Arşive Ekle ... komutunu seçin.Burada formatı ve sıkıştırma oranını ayarlayabilir, arşivin adını belirleyebilir ve diğer arşivleme parametrelerini seçebilirsiniz.

WinRar kaydetmenize izin verir kullanıcı tarafından yüklenen Reg uzantılı bir dosyaya ayarlar. Bu dosya daha sonra verilen konfigürasyonu yeniden kullanmak için programa alınabilir. Bu dosya, yakın zamanda oluşturulan arşivlerin geçmişi, varsayılan sıkıştırma ayarları vb. bilgileri depolar.

Başka bir kullanışlı Winrar seçeneği, kendi yer imlerinizi - Favoriler - oluşturma yeteneğidir. Sabit sürücünüzdeki aynı klasörleri düzenli olarak yedeklemek genellikle gereklidir. Bu klasörlerin konumu hakkında yer imlerinize bilgi ekledikten sonra, program penceresinde bunlara hızlı bir şekilde gidebilir ve gerekli dosya ve alt dizinleri arşivleyebilirsiniz.

Çoğu kullanıcı, bazen orijinal dosyaların boyutunu küçültmek ve bunları saklama veya gönderme kolaylığını artırmak için bilir, örneğin, e-posta sıkıştırma uygulanır. Ancak bazı nedenlerden dolayı bu durumda ilişkilendirme sadece arşivleme uygulamaları ile gerçekleşir ve diğer veri sıkıştırma teknikleri dikkate alınmaz. Daha sonra, en yaygın durumların birkaç örneğini kullanarak dosya sıkıştırma derecesinin neye bağlı olduğunu ele alacağız.

Bir dosyanın sıkıştırma oranı ile ne kastedilmektedir?

Teorik sorularla başlayalım. Dosya sıkıştırma oranı nedir? Bu terimin en basit yorumlarına dayanarak, nihai (sıkıştırılmış) nesnenin boyutunun ilk hacme oranı anlamına gelir. Bununla birlikte, böyle bir açıklama, sıkıştırmanın da çok yaygın olduğu multimedya formatının değiştirilmesiyle ilgili bazı konulara hiç değinmediği için, çoğunlukla yalnızca arşivlenmiş verilerle ilgili olabilir. Genel olarak, bir dosyanın sıkıştırma oranının yalnızca herhangi bir özelliğe bağlı olduğunu söylemek mümkün değildir. Bu durumda nesnenin türü, verileri sıkıştırmak için kullanılan programlar ve sıkıştırma işleminin hızı rol oynar. Ardından, orijinal verilerin boyutunu küçültmenin nihai sonucunu etkileyebilecek bazı önemli hususlar üzerinde kısaca duracağız.

Bir dosyanın sıkıştırma oranı yalnızca dosya türüne bağlıdır: gerçekten öyle mi?

Evet, aslında sıkıştırılan veri türünün nihai dosya boyutunu küçültme üzerinde oldukça büyük bir etkisi vardır ve tüm formatlar bu tür prosedürlere tabi tutulamaz. Bu, zaten kendileri tarafından sıkıştırılmış ses dosyaları örneği ile açıklanabilir.

Bu tür verileri bir arşive yerleştirmeye çalışırken, boyutta önemli bir küçültme elde etmek neredeyse imkansızdır. Aynısı WAV formatı için de geçerlidir. Bununla birlikte, sıkıştırmaz, ancak WAV'dan MP3'e kod dönüştürürseniz, boyut on veya daha fazla faktör kadar küçültülebilir. Birçok kullanıcı, dosya sıkıştırma derecesinin tam olarak ilk ve son formata bağlı olduğu gerçeğiyle hemen başlar. Bu tamamen doğru değildir, çünkü kullanılan kod dönüştürme algoritması ayrıca tartışılacak olan önemli bir rol oynar. Şimdilik, arşivleyicilerin kullanımı üzerinde duralım.

Bir arşive paketlerken bir dosyanın sıkıştırma derecesini ne belirler?

Başlangıçta bu tür sıkıştırmanın özünü anlamak için, açıklama kolaylığı için en yaygın WinRAR arşivleyicisine bir örnek vereceğiz. Paketlenecek veri türlerine dokunmuyoruz, ancak uygulamanın araçlarına odaklanıyoruz.

Öncelikle arşivin son biçimine ve kullanılan paketleme yöntemine dikkat etmelisiniz. Bu durumda, arşivleme programı tarafından dosyanın sıkıştırılma derecesinin tercih edilen yönteme bağlı olduğu açıktır. Yüksek hızlı yöntem ile sıkıştırma minimum olacak, ancak maksimum sıkıştırma oranı ile boyut daha önemli ölçüde küçülecek ve daha fazla zaman alacaktır.

Dosya formatlarını arşivleyicilerle ilgili olarak düşünürsek, en sıkıştırılabilir olanlardan ayırabiliriz. metin belgeleri herhangi bir format.

Bazı EXE yürütülebilir dosyaları nispeten iyi sıkıştırılır (ne zaman standart yöntem sıkıştırma, boyutu yarıdan fazla küçülterek elde edilebilir). Daha önce de belirtildiği gibi, sıkıştırılamaz nesnelerin çoğu multimedya nesneleridir. Ve resimlerin boyutu en azından bir şekilde küçültülebilirse, bu tür eylemler ilk formatı değiştirmeden ses ve video ile çalışmaz ve arşivleyicilerin bununla kesinlikle hiçbir ilgisi yoktur.

Grafik türleri, video ve ses sıkıştırma

Multimedya ile ilgili olarak, iki ana sıkıştırma türü vardır: kayıplı ve kayıpsız. Ve bu durumda, dosya sıkıştırma derecesi kullanılan sıkıştırma teknolojisine bağlıdır.

İlk durumda, sıkıştırma maksimumdur, ikincisinde, kullanılan kodek kümesinden ve kabın son biçiminden etkilenen değişebilir. Bu nedenle, örneğin, aynı AVI dosyası, tamamen farklı türlerde ve farklı sıkıştırma derecelerinde verileri içeren bir kap olabilir. Bu nedenle, bu arada, bazen tüketici oynatıcılarda video oynatma ile ilgili sorunlar olabilir.

Genel olarak, özellikle multimedya hakkında konuşursak, gereksiz içeriği kaldırma teknolojilerine rağmen, önemli bir kalite kaybı olmadan herhangi bir formatın kaynak dosyasının boyutunda maksimum azalmayı elde etmenin neredeyse imkansız olduğunu açıkça anlamanız gerekir ( örneğin, grafikler veya video için bu, yalnızca değişmez sahnelerde çalışır). Ses durumunda, bit hızı düşürülür ve belirli frekanslar kesilir. Sıradan bir kullanıcı farkı hissetmeyebilir, ancak keskin kulaklı bir profesyonel size neyin eksik olduğunu hemen söyleyecektir.

Tüm durumlar için en yaygın programlar

Dosya sıkıştırma derecesini belirleyen şey, biraz anladık. Şimdi kullanılan yazılım ürünleri hakkında birkaç söz söylenmelidir. En yaygın arşivleyiciler arasında WinRAR, WinZIP ve 7-Zip bulunur.

Medya sıkıştırmaya gelince, en basit durumda, dosya boyutunu küçültmek için kaynak materyali başka bir formata dönüştürme ilkesiyle çalışan özel dönüştürücü uygulamaları kullanabilirsiniz.

Kısa özet

Bir tür sonucu özetlemek gerekirse, bir dosyanın arşivleyici tarafından sıkıştırılma derecesinin birkaç faktöre ve çoğunlukla sıkıştırılan, kullanılan verinin türüne bağlı olduğu not edilebilir. yazılım ve (genellikle Huffman ve Lempel-Ziv algoritmaları kullanılır, çiftler halinde çalışır). Multimedya içeriğinde ise durum hemen hemen aynıdır ancak format birinden diğerine dönüştürülerek hakim pozisyon alınır.

Arşivleme amacı- bir diske daha kompakt bir bilgi yerleştirmenin yanı sıra, bilgisayar ağlarında iletişim kanalları aracılığıyla bilgi iletme süresini ve buna bağlı olarak maliyetini azaltmak. Ayrıca arşivleme, bilgilerin bir bilgisayardan diğerine aktarılmasını büyük ölçüde basitleştirir, harici ortama kopyalama süresini azaltır, bilgilerin yetkisiz erişime karşı korunmasına yardımcı olur ve bilgisayar virüslerinin bulaşmasına karşı korunmaya yardımcı olur.

Arşivlemenin ana özelliği bilginin sıkıştırılmasıdır, yani. onu temsilindeki fazlalığın azaltıldığı bir forma dönüştürmek ve buna bağlı olarak depolama için daha az bellek gerekir.

Bir veya birkaç dosya sıkıştırılabilir, bunlar sıkıştırılmış bir biçimde tek bir sözde arşiv dosyasına veya arşive yerleştirilir ve buradan orijinal formlarında ayıklanabilirler.

Arşiv dosyası (arşiv) sıkıştırılmış veya sıkıştırılmamış biçimde bir veya daha fazla dosya ve dosya adları, oluşturulma veya değiştirilme tarihi ve saati, boyutları vb. hakkında hizmet bilgilerini içeren özel olarak organize edilmiş bir dosyadır.

Dosyaları bir arşiv dosyasına yazma işlemine denir. arşivleme(arşivleme, paketleme) ve arşivden dosyaların çıkarılması - sıkıştırmayı açmak(açma, açma).

Bir dosyanın arşivleme sırasındaki sıkıştırma oranı, formatına bağlıdır. Bazı biçimler (örneğin, grafikler), bu tür dosyalar oluşturan programlar tarafından sıkıştırma yapıldığını varsayar ve bu nedenle arşivleme sırasında boyut küçülmez. Hepsinden iyisi, arşivleme sırasında metin dosyaları ve veritabanı dosyaları sıkıştırılır, yürütülebilir programların dosyaları ve yük modülleri daha az sıkıştırılır. Sıkıştırma oranı, sıkıştırma yönteminden de etkilenir.

Sıradan arşiv dosyalarına ek olarak, sürekli, çok hacimli ve kendiliğinden açılan arşivlerin yanı sıra bunların kombinasyonlarını oluşturabilirsiniz, örneğin: çok hacimli kendi kendine açılan, çok hacimli sürekli vb.

Sürekli (Katı) arşiv sıkıştırılacak tüm dosyaların tek bir sıralı veri akışı olarak ele alındığı özel bir şekilde paketlenmiş bir arşivdir.

Sürekli arşivleme, özellikle ekleme yaparken sıkıştırma oranını önemli ölçüde artırır Büyük bir sayı küçük benzer dosyalar. Ancak dezavantajları da vardır:

§ mevcut sürekli arşivler, normal arşivlerden daha yavaş güncellenir;

§ şifreli sürekli arşivler değiştirilemez;

§ Sürekli bir arşivden tek bir dosya çıkarmak için, önceki tüm arşivlenmiş dosyaları analiz etmek gerekir, bu nedenle, sürekli bir arşivin ortasından tek tek dosyaları çıkarmak, normal bir arşivden çıkarmaktan daha yavaştır. Ancak, ilk dosyaların tümü veya birkaçı sürekli bir arşivden çıkarılırsa, bu durumda paket açma hızı pratik olarak sıradan arşivlerle aynıdır;


§ Sürekli arşivdeki herhangi bir dosya zarar görmüşse, onu takip eden tüm dosyaları çıkarmak mümkün olmayacaktır. Bu nedenle, sürekli bir arşivi güvenilmez bir ortama kaydederken kurtarma bilgilerinin eklenmesi önerilir.

Sürekli arşivler en iyi şu durumlarda kullanılır:

§ arşiv nadiren güncellenir;

§ Arşivden bir veya birkaç dosyayı sık sık çıkarmaya gerek yoktur;

§ biri arşivlenir büyük dosya;

§ Sıkıştırma oranı, sıkıştırma hızından daha önemlidir.

Sürekli arşivlerdeki dosyalar genellikle uzantıya göre sıralanır, ancak sıralama düzeni değiştirilebilir.

Çok ciltli arşivler birkaç bölümden (ciltlerden) oluşan arşivlerdir. Tipik olarak, büyük bir arşivi birden çok diskette veya diğer çıkarılabilir ortamlarda depolamak için birimler kullanılır.

Dizideki ilk cilt, arşivleyici programının olağan standart uzantısına sahiptir ve sonraki ciltlerin uzantıları, arşivleyici uzantısının ilk harfine ve bir sıra numarasına sahiptir.

Mevcut birimlerdeki dosyalar eklenemez, güncellenemez veya silinemez.

Kendiliğinden ayıklanan (SFX, İngilizce SelF-eXtracting sözcüklerinden) arşiv yürütülebilir dosyanın eklendiği arşivdir. Bu modül, arşivi aşağıdaki gibi çalıştırarak dosyaları çıkarmanıza izin verir. düzenli program... Bu nedenle, SFX arşivinin içeriğini çıkarmak için ek harici programlar... SFX arşivleri, diğer yürütülebilir dosyalar gibi, genellikle .EXE uzantısına sahiptir, ancak bunlarla diğer arşivlerle aynı şekilde çalışabilirsiniz.

SFX arşivleri, bir arşivi birine aktarmanız gerektiğinde kullanışlıdır, ancak alıcının dosyaları çıkarmak için uygun arşivleyiciye sahip olduğundan emin değilsiniz.

Çok hacimli ve kendi kendine açılan arşivler de sürekli olabilir.

Dosyaları arşivleme/açma işlemi gerçekleştiren programlara denir. arşivleme programları.

Arşivleme programları şu ana parametrelere göre karşılaştırılabilir: arayüz, sıkıştırma yöntemleri (dosya sıkıştırma derecesinin belirlenmesi), oluşturulan arşiv türleri, çalışma hızı, diğer arşivleyicilerin formatları için destek.

Bir arşiv oluştururken, arşivleyici program arşiv dosyasına otomatik olarak kendi uzantısını atar, örneğin zip, rar vb.

Arşivleyici programı aşağıdaki yollardan biriyle kontrol edilir:

1. komut satırını kullanarak;

2. Menüleri ve işlev tuşlarını kullanarak işlem yapmanıza olanak tanıyan yerleşik kabuk ve iletişim kutularını kullanma.

3. Kural olarak, birkaç DOS arşivleme programı veya bir kabuğun kendi arşivleyicisi seçeneği sunabilen, işletim kabuklarında işlev tuşları kombinasyonlarını kullanma.

4. Grafik arayüzünün öğelerini kullanma.

Birçok arşivleme programına rağmen, modern bir kullanıcı, kural olarak, aslında iki arşiv biçimiyle çalışır: ZIP ve RAR.

Veri sıkıştırma yöntemleri, ilk bilgisayarın ortaya çıkmasından çok önce başlayan oldukça uzun bir gelişme geçmişine sahiptir. Bu makale, mutlak olduklarını iddia etmeden, temel teoriler, fikir kavramları ve bunların gerçekleşmeleri hakkında kısa bir genel bakış sunmaya çalışacaktır. Daha ayrıntılı bilgi, örneğin, R.E. Krichevsky'de bulunabilir. , Ryabko B. Ya. , Witten I.H. , Rissanen J., Huffman D.A., Gallager R.G. , Knuth D.E. , Vitter J.S. ve benzeri.

Bilginin sıkıştırılması, oldukça uzun bir geçmişi olan bir problemdir, (tarih) genellikle bilgi kodlama ve şifreleme probleminin gelişim tarihi ile birlikte giden bilgi işlem teknolojisinin gelişim tarihinden çok daha eskidir. Tüm sıkıştırma algoritmaları, minimum birimi bir bit ve maksimum birimi birkaç bit, bayt veya birkaç bayt olan bir bilgi giriş akışında çalışır. Sıkıştırma işleminin amacı, kural olarak, başlangıçta kompakt olmayan bazı girdi akışlarından, bunların bazı dönüşümleri yoluyla daha kompakt bir bilgi birimleri çıktı akışı elde etmektir. Sıkıştırma işlemlerinin ana teknik özellikleri ve çalışmalarının sonuçları şunlardır:

İlk ve son akışların hacimlerinin sıkıştırma oranı (sıkıştırma derecesi) veya oranı (oran);

Sıkıştırma oranı - giriş akışındaki belirli bir miktarda bilgiyi sıkıştırmak için harcanan zaman, ondan eşdeğer bir çıkış akışı elde edilene kadar;

Sıkıştırma kalitesi, çıktı akışının aynı veya farklı bir algoritma kullanarak yeniden sıkıştırma uygulayarak ne kadar güçlü paketlendiğini gösteren bir değerdir.

Bilgi sıkıştırma sorununa birkaç farklı yaklaşım vardır. Bazıları çok karmaşık bir teorik matematiksel temele sahiptir, diğerleri bilgi akışının özelliklerine dayanır ve algoritmik olarak oldukça basittir. Veri sıkıştırma veya sıkıştırmayı uygulayan herhangi bir yaklaşım ve algoritma, tersinir veya geri döndürülemez dönüşümü vasıtasıyla bit cinsinden çıktı bilgisi akışının hacmini azaltmak için tasarlanmıştır. Bu nedenle, her şeyden önce, verilerin doğası veya formatı ile ilgili kritere göre, tüm sıkıştırma yöntemleri iki kategoriye ayrılabilir: tersinir ve geri döndürülemez sıkıştırma.

Geri döndürülemez sıkıştırma ile, belirli bir bilgi formatına dayalı çıktı akışının, belirli bir bakış açısından, giriş akışına dış özellikler bakımından oldukça benzer, ancak farklı bir nesneyi temsil ettiği, giriş veri akışının böyle bir dönüşümü kastedilmektedir. ondan hacim olarak. Giriş ve çıkış akışları arasındaki benzerlik derecesi, bu bilgi akışı tarafından temsil edilen nesnenin belirli özellikleri (yani, sıkıştırılmış ve sıkıştırılmamış bilgiler, belirli bir veri formatına göre) arasındaki yazışma derecesi ile belirlenir. Bu tür yaklaşımlar ve algoritmalar, örneğin akışta baytların tekrarlanabilirliği düşük olan bitmap grafik dosyalarından gelen verileri sıkıştırmak için kullanılır. Bu yaklaşımla, grafik dosya formatının yapısının özelliği kullanılır ve birkaç (daha kesin olarak n) şekilde görüntü kalitesinde (insan gözü tarafından algılanması için) yaklaşık olarak benzer bir grafik görüntü sunma yeteneği kullanılır. Bu nedenle, bu tür algoritmalarda sıkıştırma derecesi veya miktarına ek olarak kalite kavramı ortaya çıkar. orijinal görüntü sıkıştırma işlemi sırasında değişirse, kalite, bilgi formatına dayalı olarak öznel olarak değerlendirilen orijinal ve ortaya çıkan görüntü arasındaki yazışma derecesi olarak anlaşılabilir. Grafik dosyaları için, bu tür yazışmalar görsel olarak belirlenir, ancak buna karşılık gelen akıllı algoritmalar ve programlar da vardır. Giriş ve çıkış akışlarının bilgi yapısıyla tam olarak örtüşmesinin gerekli olduğu alanlarda geri dönüşü olmayan sıkıştırma uygulanamaz. Bu yaklaşım, JPEG ve JFIF algoritmaları ve JPG ve JIF dosya biçimleri olarak bilinen video ve fotoğraf bilgilerinin sunulması için popüler biçimlerde uygulanmaktadır.

Tersinir sıkıştırma, bilgi içeriğini değiştirmeden her zaman çıktı bilgi akışının hacminde bir azalmaya yol açar, yani. - bilgi yapısını kaybetmeden. Ayrıca, bir kurtarma veya açma algoritması kullanarak çıktı akışından girdi alabilirsiniz ve kurtarma işlemine açma veya açma adı verilir ve yalnızca açma işleminden sonra veriler dahili formatlarına göre işlemeye uygun hale gelir.

Tersinir algoritmalarda, bir süreç olarak kodlama, yalnızca sıkıştırma algoritmaları oluşturmak için değil, aynı zamanda verimliliklerini değerlendirmek için daha da yararlı olan istatistiksel bir bakış açısıyla görülebilir. Tüm tersine çevrilebilir algoritmalar için bir kodlama maliyeti kavramı vardır. Kodlama maliyeti, kod kelimesinin bit cinsinden ortalama uzunluğunu ifade eder. Kodlamanın fazlalığı, kodlamanın maliyeti ve entropisi arasındaki farka eşittir ve iyi bir sıkıştırma algoritması her zaman fazlalığı en aza indirmelidir (bilgi entropisinin, bozukluğunun bir ölçüsü olarak anlaşıldığını hatırlayın). Shannon'ın bilgi kodlama konusundaki temel teoremi, "kodlamanın maliyeti, keyfi olarak ona yakın olabilse de, her zaman kaynağın entropisinden daha az değildir" der. Bu nedenle, herhangi bir algoritma için, giriş akışının entropisi tarafından belirlenen sıkıştırma oranının her zaman belirli bir sınırı vardır.

Şimdi doğrudan tersine çevrilebilir algoritmaların algoritmik özelliklerine dönelim ve kodlama sistemleri ve bilgi sıkıştırma yöntemlerinin uygulanmasıyla ilişkili veri sıkıştırmaya yönelik en önemli teorik yaklaşımları ele alalım.

Seri kodlama yoluyla sıkıştırma

Bilgilerin tersine çevrilebilir sıkıştırılması için en ünlü basit yaklaşım ve algoritma Çalışma Uzunluğu Kodlamasıdır (RLE). Bu yaklaşımın yöntemlerinin özü, dizeleri veya yinelenen bayt dizilerini veya dizilerini bir kodlama baytı ve tekrarlarının sayısının bir sayacı ile değiştirmektir. Tüm benzer yöntemlerle ilgili sorun, yalnızca paket açma algoritmasının elde edilen bayt akışındaki kodlanmış serileri diğerlerinden - kodlanmamış bayt dizilerinden - ayırt edebilme yolunu belirlemektir. Sorunun çözümü genellikle kodlanmış dizilerin başına işaretler yerleştirilerek elde edilir. Bu tür etiketler, örneğin, kodlanmış bir çalışmanın ilk baytındaki karakteristik bit değerleri, kodlanmış bir çalışmanın ilk baytının değerleri vb. Bu yöntemler, kural olarak, raster grafik görüntüleri (BMP, PCX, TIF, GIF) sıkıştırmak için oldukça etkilidir, çünkü ikincisi oldukça fazla sayıda yinelenen bayt dizisi içerir. RLE yönteminin dezavantajı, oldukça düşük sıkıştırma oranı veya dosyaları az sayıda seri ile kodlamanın maliyeti ve daha da kötüsü, bir dizide az sayıda tekrarlanan bayt ile.

RLE yöntemini kullanmadan sıkıştırma

RLE yöntemini kullanmadan verileri sıkıştırma işlemi iki aşamaya ayrılabilir: modelleme ve aslında kodlama. Bu süreçler ve uygulama algoritmaları oldukça bağımsız ve çeşitlidir.

Kodlama süreci ve yöntemleri

Kodlama, genellikle belirli bir alfabede bir karakter akışının (bizim durumumuzda, baytlar veya küçük parçalar) işlenmesi olarak anlaşılır ve akışta karakterlerin görülme sıklıkları farklıdır. Kodlamanın amacı, bu akışı, sembol frekanslarını dikkate alarak giriş akışının entropisini azaltarak elde edilen minimum uzunlukta bir bit akışına dönüştürmektir. Akış alfabesindeki karakterleri temsil eden kodun uzunluğu, giriş akışındaki bilgi miktarıyla orantılı olmalıdır ve akış sembollerinin bit cinsinden uzunluğu 8'in katı veya hatta değişken olmayabilir. Girdi akımının alfabesindeki sembollerin oluşum frekanslarının olasılık dağılımı biliniyorsa, optimal bir kodlama modeli oluşturulabilir. Ancak, çok sayıda farklı dosya formatının varlığı nedeniyle, görev çok daha karmaşık hale geliyor. veri sembollerinin frekans dağılımı önceden bilinmemektedir. Bu durumda, Genel görünüm, iki yaklaşım kullanılır.

Birincisi, girdi akışını görüntülemek ve toplanan istatistiklere dayalı olarak kodlamayı oluşturmaktır (bu durumda, dosyadan iki geçiş gerekir - biri istatistiksel bilgileri görüntülemek ve toplamak için, ikincisi - kodlamanın kapsamını bir şekilde sınırlayan kodlamak için. bu tür algoritmaların uygulanması, çünkü bu nedenle, veri miktarının bazen bilinmediği telekomünikasyon sistemlerinde kullanılan "anında" tek geçişli kodlama olasılığı hariç tutulur ve bunların yeniden iletimi veya ayrıştırılması makul olmayan bir şekilde sürebilir. uzun zaman). Böyle bir durumda, kullanılan kodlamanın istatistiksel şeması çıkış akımına yazılır. Bu teknik, statik Huffman kodlaması olarak bilinir.

gastroguru 2017