판다스

머신러닝

판다스 데이터 선택

-row(행) 데이터 선택 데이터 프레임의 행은 슬라이싱을 통해 얻을 수 있습니다. data_1 = data[0:5]는 기존 데이터 프레임의 인덱스 0번부터 5번 이전까지, 즉 인덱스 0부터 4번의 행을 뽑아옵니다. : 을 사용하는 기법을 슬라이싱 기법이라고 합니다. 데이터 프레임이 인덱스가 정수가 아닌 문자열인 경우 숫자 대신 문자열을 슬라이싱해도 상관 없습니다. -column(열) 데이터 선택 열 하나만을 뽑는 경우 운영체제라는 열의 데이터들이 뽑힌 모습입니다. 이번에는 두 개이상의 열들을 뽑도록 하겠습니다. 다만 여기서 주의할 점은 data라는 데이터 프레임은 한개의 인자만을 받습니다. 그 점을 이용해, 리스트로 운영체제와 논리회로를 묶어 하나의 인자로 만들어 넣어줍니다. ['운영체제', '논리회로..

머신러닝

판다스 set_index()와 reset_index() 메소드

인덱스 설정 : set_index() 데이터 프레임은 기본적으로 배열의 형태입니다. 그래서 자동으로 0부터 시작하는 정수의 인덱스가 생성되는데, 만약 특정 열의 데이터를 인덱스로 사용하고 싶다면 set_index()메소드를 이용하여 DataFrame을 다시 저장합니다. set_index()의 메소드의 기본 형식은 다음과 같습니다. 위 그림의 경우는 읽어온 파일의 기본 형입니다. set_index()메소드를 통하여 특정한 열의 데이터로 인덱스를 바꿉니다. 위 그림은 기존 인덱스가 아닌 특정 열(학번)이 들어간 모습입니다. 또한 기존의 인덱스만 사라진 것이 아니라 특정 열(학번)이 인덱스에 들어가게 되면서 특정 열이 사라지게 되었습니다. set_index() 메소드의 형식의 인자 디폴트 값이 drop = T..

머신러닝

판다스 Series와 DataFrame

데이터 분석에 가장 많이 쓰이는 파이썬 라이브러리입니다. pandas는 데이터를 리스트나 배열의 형태로 변환하여 사용합니다. 판다스에서는 1차원 배열인 Series와 다차원 배열 DataFrame이라는 객체를 생성해 사용합니다. Series생성 판다스의 기본형은 Pandas.Series(data = None, index = None, dtype = None, name = None, copy = False, fastpath = False) 판다스라는 객체에 Series라는 메소드를 사용합니다. 메소드 Series에 있는 인자들은 보통 기본적으로 Default값인 상태로 사용하거나 data나 인덱스들만 수정해 사용합니다. 판다스의 Series메소드를 통해 인덱스가 0번 째부터 시작해서 10번 째로 끝나는 1..

simun
'판다스' 태그의 글 목록