..


Gesponsorde links

Comprimeren van bestanden. Algoritmen en software voor vergelijking.

Artikel geschreven door Damiano Verda
Pagina 1 van 2

Een van de meest voorkomende operaties die nuttig kunnen zijn, zelfs voor onervaren gebruikers te identificeren, zeker compressie. Door middel van deze transactie in feite kan elk bestand op uw computer worden hersteld, zodat een gedeelte van het geheugen dan de harde schijf innemen. We constateren echter dat, op dit moment, er zijn grote capaciteit harde schijven verkrijgbaar tegen prijzen vrij laag, zodat het nut van compressie-programma's lijkt te krimpen. Maar dit is een overhaaste conclusie.

In feite kan bijvoorbeeld interessant zijn om een of meerdere bestanden te comprimeren voordat u via e-mail, naar de tijd van ontvangst en verzending te reduceren. Interessante en praktische aanvulling ook de mogelijkheid om meerdere documenten op te slaan in een gecomprimeerd bestand, meer praktische te zenden en te manipuleren.

Maar wat zijn de belangrijkste opties beschikbaar zijn voor gebruikers om een bestand of bestanden te comprimeren? Wat onderscheidt de diverse software beschikbaar? Laten we eerst onderzoeken de theoretische basis van software-compressie, waardoor ter illustratie van de belangrijkste kenmerken van compressie algoritmen.

Compressie algoritmen

Een eerste onderscheid tussen de compressie-algoritmes kunnen worden geïdentificeerd tussen lossless algoritmes, dat wil zeggen zonder enig verlies van kwaliteit en lossy algoritmen, waarin de vermindering van de schijfruimte gaat gepaard met een verlies van kwaliteit. Het is vaak moeilijk om een verslechtering van de kwaliteit waar te nemen: bijvoorbeeld in het geval van de MP3-codering voor audiobestanden.

Een van de meest gebruikte algoritmes te identificeren zonder twijfel de 'Huffman algoritme, de' Shannon-Fano-algoritme en 'algoritme Lempel, Ziv en Welch. Hoewel niet in te gaan op theoretische uitleg, onderzoeken we de belangrijkste kenmerken van 'Huffman algoritme, die markeerde de geschiedenis van de compressie-technieken.

Wij verwijzen de lezers geïnteresseerd in meer informatie over de technieken van Shannon-Fano en Lempel-Ziv-Welch links naar meer specifieke over dit onderwerp:

De Huffman algoritme

'S-algoritme behoort tot de categorie Huffman lossless, is dus niet leiden tot verlies van kwaliteit. We scomporne operatie in vijf elementaire stappen:

  • Wordt geanalyseerd en telden het aantal voorkomens van de basiselementen van het bestand te comprimeren: de afzonderlijke tekens in een tekstbestand, de pixels in een image-bestand.
  • De twee elementen zijn samengebracht in een minder frequente categorie die hen beiden vertegenwoordigt. Dus bijvoorbeeld als X en Y komt 8 keer 7 keer, creëert de categorie XY, met 15 recidieven. Ondertussen, de componenten X en Y ontvangen elk een ander marker die hen identificeert als elementen opgenomen in een 'vereniging.
  • De volgende twee items worden minder frequent in het bestand en zit als een nieuwe categorie, met dezelfde procedure als beschreven in stap 2. De groep XY kunnen op hun beurt aangaan en nieuwe verenigingen, bijvoorbeeld, de XYZ categorie. Wanneer dit gebeurt, worden de X en Y krijgt een nieuwe id die eindigt met de Vereniging uitbreiding van de code die uniek identificeert elk van de twee letters in het gecomprimeerde bestand wordt gegenereerd.
  • Wordt vervolgens gemaakt voor de volgende stappen, een boom bestaat uit een reeks van binaire takken, in die verschijnen vaker en in de daarop volgende combinaties zeldzamer elementen in het dossier, terwijl de elementen zijn zelden vaker. Volgens het mechanisme beschreven, betekent dit dat de zeldzame elementen in de ongecomprimeerde bestanden zijn gekoppeld aan een identificatie-code lengte, die groeit elk element van een nieuwe vereniging. De elementen zijn vaker in plaats van het originele bestand herhaaldelijk niet aanwezig zijn in de 'boom van verenigingen, zodat hun identificatiecode wordt zo kort mogelijk.
  • Gecomprimeerde bestand wordt gegenereerd, ter vervanging van elk element van het oorspronkelijke bestand, de code geproduceerd aan het eind van de keten van associaties op basis van de frequentie van dit element in het brondocument.
De winst van de ruimte aan het eind van de compressie is te wijten aan het feit dat de elementen die worden herhaald vaak worden geïdentificeerd door een korte code, die neemt minder ruimte in dan nemen zij hun normale codering. Omgekeerd zeldzame elementen in het oorspronkelijke bestand in het gecomprimeerde bestand ontvangt een lange code, die aanleiding kunnen geven, voor elk van hen, een gebied dat aanzienlijk groter is dan die bezet in het ongecomprimeerde bestand.

Van de algebraïsche som van de ruimte verkregen door het coderen van een tekort aan de meest frequente en ruimte verloren met de codering van de meest zeldzame lang krijg je de compressie-ratio geproduceerd door 'Huffman algoritme. Uit het bovenstaande volgt dat deze vorm van compressie is effectiever hoe groter de frequentie verschillen van de onderdelen van het oorspronkelijke bestand, terwijl de slechte resultaten worden verkregen wanneer de distributie van de elementen uniform is.

In dezelfde categorie ...
E-Learning
HTML (Cursus) HTML (Cursus)
De opmaaktaal voor het web vanaf 29 €.
Webmaster Advanced (Course) Webmaster Advanced (Course)
Word een professionele webmaster. Van 39 €.
Webmaster Base (Eerste) Webmaster Base (Eerste)
Maak een website vanuit het niets. Vanaf 29 €.
Gesponsorde links