언빌리버블티

[Python] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 1: invalid start byte 본문

Language/ErrorNote

[Python] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 1: invalid start byte

나는 정은 2022. 10. 12. 14:45

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 1: invalid start byte.

  • Pandas 에서 read_csv 등 데이터 파일을 불러올 때 발생하는 오류이다.
  • 불러오는 csv , txt 파일 등의 encoding 방식과 python 의 encoding 방식이 다르면 해당 에러가 발생하기 때문에 인코딩을 맞춰 불러와줘야 한다.
from glob import glob
raw = pd.read_csv(file_name)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 1: invalid start byte

encoding 값을 cp949 로 적용시켜주면 해결 가능한 오류이다

raw = pd.read_csv(file_name, encoding='cp949')
 

 

 

Comments