CS지식/컴퓨터구조

컴퓨터구조 Ch.2 데이터

뮤츠 2023. 1. 8. 02:19

※데이터 부분은 2진수 관련 내용이 상당히 많이 할당되었으나,

개인적으로 2진수 부분 중 알고있는 내용은 과감하게 배제하였습니다.

 

정보단위

  • 1비트 = 2
  • 1바이트 = 8비트 = 2^8 = 256

이진법의 음수표현

 

2의 보수

사전적의미 : 어떤 수를 그보다 큰 2^n 에서 뺀 값.

빠르게 구하는 방법 : 0과 1을 서로 뒤집어준 후 1을 더함.

 

문자집합과 인코딩

  • 문자집합 : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음.
  • 인코딩 : 컴퓨터가 이해할 수 있게 binary 형태로 변환하는 과정.
  • 디코딩 : 인코딩의 반대과정.

아스키 코드

초창기 문자집합 중 하나로, 8비트 중 오류 검출에 사용하는 parity bit를 제외한 7비트(=127가지)를 사용하는 문자집합.

 

한글의 인코딩 방식

  • 완성형 인코딩 : 완전한 한글자로 인코딩, 조합에 따라 가짓수 가 많다는 단점이 있음.
  • 조합형 인코딩 : 초성, 중성, 종성별로 비트열을 할당하여 조합으로 글자코드를 완성하는 인코딩 방식.
  • EUC-KR : KS X 1001, KS X 1003이라는 문자 집합을 기반으로 하는 대표적인 완성형 인코딩 방식.
  • 유니코드 문자집합 : 대부분 나라의 문자, 특수문자 등을 포함한 표준 문자 집합.
  • UTF-8 방식 : 유니코드 방식 중 하나로, 한글은 3byte에 할당.

 

참고 : 혼자 공부하는 컴퓨터 구조 + 운영체제 (강민철 저)