문자압축 - 컴퓨터가 사용하는 문자압축에대해 설명좀 부탁드려요
작성자 l 김거성 [rjtjd11] 등록일 l 11-10-06 19:25 조회 l 66
알기쉽게 설명 해주세요 ^^
 
 
게시글을 facebook으로 보내기 게시글을 twitter로 보내기
김동률 [kjhacker] 11-10-06 23:50
 
중복되는것을 생략하고 그에따른 표시를 하는것 입니다.
예를들면
I am a pretty boy

I am()()()pret()y()bo()
이구요
각 괄호안에 들어갈 문자는 순서대로
띄어쓰기, a, 띄어스기, t, 띄어쓰기, y입니다.
이용춘 [careful] 11-10-07 00:33
 
조금 쉽게 설명하겠습니다.

[ 사랑해사랑해바보바보안녕안녕 ] 이라는 문자를 줄여쓴다고 생각하면

사랑해 = 사, 바보 = 바, 안녕 = 안  이라고 규칙을 정한다면
[ 사사바바안안 ] 이라고 표현할 수 있습니다.

물론 결과값인 [ 사사바바안안 ] 만 보여주면 원래 문자열을 알 수 가 없으므로
문자를 풀어낼 수 있도록 힌트를 알려주어야 합니다.

[ 사랑해 = 사, 바보 = 바, 안녕 = 안 ] <- 이것이 힌트가 됩니다.

컴퓨터의 압축기법은 이 원리로 동작됩니다.
힌트로 표현되는 부분이
압축헤더가 되고
나머지가 압축데이터가 됩니다.

[사랑해=사,바보=바,안녕=안:사사바바안안] <- 이런식으로 표현되구요 물론 이진법의 비트연산으로 수행되기때문에
글자가 그데로 보여지지는 않습니다 ^^


문제는 위 예ㅒ처럼 압축헤더부분이 존재하기때문에
데이타에 반복패턴이 적거나 짧은 데이타를 압축하면

원래크기보다 오히려 커지기도 합니다.

-----------------------------

반복열이 많을 수록, 데이터가 클 수록 압축이 잘 되겠지요..

[ 사랑해=사,바보=바:사사바바바사사사바바바사사사바바사사사사사..... ]  <-- 어떻게 압축을 풀어야 하는지... 보이죠 ?
반복되는 패턴의 데이타를 토큰이라는 키값으로 저장해서 압축헤더를 만들고
일정규칙과 룰을 따라서 단순화 시키는 겁니다.

압축헤더부분이 힌트가 되는 것이구요.
목록
번호 제목 작성자 날짜 조회
12161 상대성이론 (9) 그림파일첨부 우건식 11-10-07 198
12160 정사각형을 최소의 예각삼각형으로 나누기!! (2) 문상원 11-10-07 81
12159 문자압축 - 컴퓨터가 사용하는 문자압축에대해 설명좀 부탁드려요 (2) 김거성 11-10-06 67
12158 설문조사 부탁드려요 & 지구가 구각이라면 (2) 이수길 11-10-03 96
12157 간단한 도형문제 (12) 이진우 11-10-01 329
12156    간단한 도형문제 (3) 그림파일첨부 우건식 11-10-04 163
12155    출제자의 답 이진우 11-10-04 112
12154 . (3) 김동률 11-09-30 114
12153 빛의속도로 달리는 기차에서 빛을쏘면? (4) 임용우 11-09-25 214
12152 상식....소신있게 대답 해 보세요 (3) 그림파일첨부 박세훈 11-09-23 240
12151 생일구하는 문제도 부탁드립니다. (1) 박현웅 11-09-21 107
12150 문제좀 풀어주세요 ㅜㅜ (4) 박현웅 11-09-21 129
12149 문제 ~ (9) 우건식 11-09-10 352
12148 두번째 당구문제 (4) 임화섭 11-09-10 229
12147 첫번째 당구문제 (3) 임화섭 11-09-10 270
   21  22  23  24  25  26  27  28  29  30    

대표자 : 송필재
사업자번호 : 617-82-77792
06777  서울특별시 강남구 봉은사로 125 스파크플러스 B207 (논현동, 리스트빌딩)       TEL 02_6341_3177       FAX 02_3445_3177
copyright 2021    Mensa Korea.      All Rights Reserved.