-row(행) 데이터 선택
데이터 프레임의 행은 슬라이싱을 통해 얻을 수 있습니다.
data_1 = data[0:5]는 기존 데이터 프레임의 인덱스 0번부터 5번 이전까지, 즉 인덱스 0부터 4번의 행을 뽑아옵니다.
: 을 사용하는 기법을 슬라이싱 기법이라고 합니다.
데이터 프레임이
인덱스가 정수가 아닌 문자열인 경우 숫자 대신 문자열을 슬라이싱해도 상관 없습니다.
-column(열) 데이터 선택
열 하나만을 뽑는 경우
운영체제라는 열의 데이터들이 뽑힌 모습입니다.
이번에는 두 개이상의 열들을 뽑도록 하겠습니다.
다만 여기서 주의할 점은 data라는 데이터 프레임은 한개의 인자만을 받습니다.
그 점을 이용해, 리스트로 운영체제와 논리회로를 묶어 하나의 인자로 만들어 넣어줍니다.
['운영체제', '논리회로'] -> X 에러발생
[ ['운영체제', '논리회로'] ] -> O
-원하는 범위의 데이터 선택
loc메소드를 사용합니다.
하나의 데이터만을 선택
loc의 기본 구조는 위 그림의 경우와 같습니다.
특정 인덱스와 열을 선택하여 겹쳐졌을 때 해당 데이터가 뽑히게 됩니다.
위 그림은 앞서 말한 내용을 표현한 것입니다.
3번째 행의 인덱스와 논리회로라는 열 이름을 적어넣었을 경우
55라는 데이터가 선택됩니다.
-두 개이상의 데이터를 선택
앞서 말했던 슬라이싱 기법을 이용하도록 합시다.
앞서 말한 슬라이싱 기법을 사용하면 분명히 인덱스 0부터 5이전까지 데이터가 선택된다고 했습니다.
다만, loc 메소드에서는 0부터 5까지 데이터가 선택된다는 점 주의하셔야합니다.
이번에는 오로지 숫자로 된 인덱스를 사용하는 iloc메소드로 데이터를 선택해보겠습니다.
iloc 메소드를 사용합니다.
data_1
data_2
iloc에서는 슬라이싱 기법을 사용했을 때 기존에 알고 있던 방식으로 작동되었습니다.
이런 경우 암기하기보다는 메소드를 사용할 때마다 상기하는 것이 옳다고 봅니다.
번외로
-loc [row, column] = at [row, column]
-iloc [row, column] = iat [row, column]
와 같습니다.
'머신러닝' 카테고리의 다른 글
판다스 데이터 삭제, 추가, 삽입 (0) | 2022.05.21 |
---|---|
판다스 set_index()와 reset_index() 메소드 (0) | 2022.05.18 |
판다스 Series와 DataFrame (0) | 2022.05.18 |