반응형
기상자료개발포털에서 받아온 자료를 read_csv로 불러오려는데 다음과 같은 오류가 생겼다.
'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte
인코딩 형식이 맞지 않아서 생기는 오류라고 한다!
파일을 엑셀로 열어보면 이렇게 생겼다
인코딩 문제도 있지만
read_csv로 csv파일을 읽게 되면 맨 첫 줄을 column명으로 인식하기 때문에 1~7행을 삭제해주어야 한다
또는 skiprows 옵션을 주는 방법도 있다.
df = pd.read_csv('경로~~', skiprows=7)
그 후 파일 -> 다른 이름으로 저장을 해서
파일 형식을 CSV UTF-8(쉼표로 분리)로 선택해주면 read_csv로 파일을 열 수 있게 된다.
참고 :
[pandas] 공공데이터(csv) 활용시 한글 깨짐 현상 해결
공공데이터(csv) 활용시 한글 깨짐 현상 해결하는 방법에 대하여 알아보겠습니다.
teddylee777.github.io
반응형
'Programming > Pandas' 카테고리의 다른 글
[pandas] 기후통계분석 데이터를 이용한 EDA 실습 (0) | 2022.03.22 |
---|---|
[Pandas] Movie Lens Data를 이용한 EDA 실습 (1) | 2022.03.21 |
[pandas] DataFrame Merge, Mapping, Grouping (0) | 2022.03.21 |
[pandas] DataFrame Indexing & Slicing (0) | 2022.03.17 |
[pandas] 여러가지 resource를 이용하여 DataFrame 생성하기 (csv, sql, api, json) (0) | 2022.03.17 |