본문 바로가기

디지털 포렌식 (Forensic)/디지털포렌식전문가 2급 필기

[디지털포렌식전문가 2급 필기] 1-2-3. 문자

728x90
반응형

아스키 코드 (ASCII Code)

- 미국 표준협회에서 제정한 자료 처리 및 통신 시스템 상호간이 정보 교환용 표준 코드

- 7비트로 구성된 128종의 기호를 표현 가능

- 아스키 코드가 7비트로 구성된 이유는 패리티 비트 때문임

- 1바이트로 하나의 문자를 표현

- 제어 부호 33자, 그래픽 기호 33자, 숫자 10자, 알파벳 대소문자 52자로 구성

- 제어 부호는 통신의 시작과 종료, 라인 피드 등을 표시 가능 (데이터 통신에 이용)

패리티 검사 코드 (Parity Check Code)

- 코드에 오류가 발생하였는지 검사하기 위하여 크기가 1인 비트(bit)를 추가

- 짝수 패리티 (Even Parity) : 전체 비트에서 1의 개수가 짝수가 되도록 패리티 비트를 정함

- 홀수 패리티 (Odd Parity) : 전체 비트에서 1의 개수가 홀수가 되도록 패리티 비트를 정함

ex) 데이터 비트에서 1의 개수가 홀수이면 패리티 비트를 1로 정한다 

- 패리티 비트는 오류 발생 여부만 알 수 있고, 수정은 불가능

유니코드 (Unicode)

- 31비트 문자셋으로 특수 문자를 제외한 전 세계 모든 문자들은 하위 16비트의 영역 안에 정의

- 한글은 1996년 유니코드 2.0에서부터 11,172자가 모두 포함

UTF-8

- 31비트의 유니코드를 1~6개의 바이트에 나누어 저장하는 방식

- 첫 번째 바이트를 통하여 몇 개의 바이트로 구성된 것인지 알 수 있음

- 아스키 코드 영역(영어 문자)의 경우 1 바이트, 한글 문자의 경우 3 바이트로 표현

- 가장 일반적으로 사용하는 유니코드 포맷

UTF-32

- 31비트 유니코드의 각 문자를 4바이트로 표현

EBCDIC (Extended BCD Interchange Code)

- BMS/390 서버의 운영 체계인 OS/390에 사용되는 텍스트 파일용 코드

- 파일 내에서 각 알파벳이나 숫자를 8비트로 표현

- 256개의 문자가 정의되어 있는 바이너리 코드

728x90
반응형