인덱스 설정 : set_index()
데이터 프레임은 기본적으로 배열의 형태입니다.
그래서 자동으로 0부터 시작하는 정수의 인덱스가 생성되는데, 만약 특정 열의 데이터를 인덱스로 사용하고 싶다면
set_index()메소드를 이용하여 DataFrame을 다시 저장합니다.
set_index()의 메소드의 기본 형식은 다음과 같습니다.
위 그림의 경우는 읽어온 파일의 기본 형입니다.
set_index()메소드를 통하여 특정한 열의 데이터로 인덱스를 바꿉니다.
위 그림은 기존 인덱스가 아닌 특정 열(학번)이 들어간 모습입니다.
또한 기존의 인덱스만 사라진 것이 아니라 특정 열(학번)이 인덱스에 들어가게 되면서
특정 열이 사라지게 되었습니다.
set_index() 메소드의 형식의 인자 디폴트 값이 drop = True로 설정되어있기 때문입니다.
이번에는 drop = False인 경우를 살펴보겠습니다.
drop = False로 설정한 결과 기존의 학번이 존재하는 모습입니다.
인덱스 설정 : reset_index()
뒤 섞인 인덱스를 다시 순차적으로 만들기 위해 사용하는 메소드입니다.
reset_index()는 인덱스를 정수 인덱스로 재설정하고 기존 인덱스를 열 데이터로 이동시킵니다.
reset_index(drop = False)메소드를 통하여 기존 데이터의 인덱스인 학번이 정수형 인덱스로 재설정이 되었습니다.
기존 인덱스였던 학번은 열 데이터에 다시 배치된 모습입니다.
reset_index(drop = True)인 경우 열 데이터로 이동해야하는 학번이 사라진 모습입니다.
'머신러닝' 카테고리의 다른 글
판다스 데이터 삭제, 추가, 삽입 (0) | 2022.05.21 |
---|---|
판다스 데이터 선택 (0) | 2022.05.18 |
판다스 Series와 DataFrame (0) | 2022.05.18 |