문자열에는 두가지 타입이 존제

str, unicode


함수 설명

<str>.decode() : str -> unicode

<unicode>.encode() : unicode -> str


unicode는 코드셋이 없음

str은 다양한 코드셋이 있음

str(949) -> unicode : <str>.decode('949')

str(utf8) -> unicode : <str>.decode('utf8')

unicode -> str(949) : <unicode>.encode('949')

unicode -> str(utf8) : <unicode>.encode('utf8')

str(949) -> unicode : unicode(<str>, '949')

str(utf8) -> unicode : unicode(<str>, 'utf8')

* 949 = cp949, ms949 : 다 같은것

윈도우 코드셋 번호