-row(행) 데이터 선택 데이터 프레임의 행은 슬라이싱을 통해 얻을 수 있습니다. data_1 = data[0:5]는 기존 데이터 프레임의 인덱스 0번부터 5번 이전까지, 즉 인덱스 0부터 4번의 행을 뽑아옵니다. : 을 사용하는 기법을 슬라이싱 기법이라고 합니다. 데이터 프레임이 인덱스가 정수가 아닌 문자열인 경우 숫자 대신 문자열을 슬라이싱해도 상관 없습니다. -column(열) 데이터 선택 열 하나만을 뽑는 경우 운영체제라는 열의 데이터들이 뽑힌 모습입니다. 이번에는 두 개이상의 열들을 뽑도록 하겠습니다. 다만 여기서 주의할 점은 data라는 데이터 프레임은 한개의 인자만을 받습니다. 그 점을 이용해, 리스트로 운영체제와 논리회로를 묶어 하나의 인자로 만들어 넣어줍니다. ['운영체제', '논리회로..
인덱스 설정 : set_index() 데이터 프레임은 기본적으로 배열의 형태입니다. 그래서 자동으로 0부터 시작하는 정수의 인덱스가 생성되는데, 만약 특정 열의 데이터를 인덱스로 사용하고 싶다면 set_index()메소드를 이용하여 DataFrame을 다시 저장합니다. set_index()의 메소드의 기본 형식은 다음과 같습니다. 위 그림의 경우는 읽어온 파일의 기본 형입니다. set_index()메소드를 통하여 특정한 열의 데이터로 인덱스를 바꿉니다. 위 그림은 기존 인덱스가 아닌 특정 열(학번)이 들어간 모습입니다. 또한 기존의 인덱스만 사라진 것이 아니라 특정 열(학번)이 인덱스에 들어가게 되면서 특정 열이 사라지게 되었습니다. set_index() 메소드의 형식의 인자 디폴트 값이 drop = T..
데이터 분석에 가장 많이 쓰이는 파이썬 라이브러리입니다. pandas는 데이터를 리스트나 배열의 형태로 변환하여 사용합니다. 판다스에서는 1차원 배열인 Series와 다차원 배열 DataFrame이라는 객체를 생성해 사용합니다. Series생성 판다스의 기본형은 Pandas.Series(data = None, index = None, dtype = None, name = None, copy = False, fastpath = False) 판다스라는 객체에 Series라는 메소드를 사용합니다. 메소드 Series에 있는 인자들은 보통 기본적으로 Default값인 상태로 사용하거나 data나 인덱스들만 수정해 사용합니다. 판다스의 Series메소드를 통해 인덱스가 0번 째부터 시작해서 10번 째로 끝나는 1..