본문 바로가기
코딩 독학/판다스, 넘파이, 파이썬 문법

인덱스활용

by 효니루 2020. 9. 28.

<행 인덱스 재배열> 

DataFrame객체.reindex( 새로운 인덱스 배열 )

  : 기존의 df객체에 새로운 행인덱스를 가진 행을 추가한다. 

: reindex 는 원래 객체에 없는 행인덱스를 추가하면 데이터값이 NaN으로 입력된다. 즉 원래 df에는 0, 1, 2인덱스를 가진 행만 있는데, r0~r5라는 새로운 행인덱스를 가진 행을 넣어주니 NaN만 반환되었다.

 

 :  처음에 r0~r2 인덱싱을 해주고 reindex를 r0~r5로 하면, r0~r2 행은 원래의 데이터값이 나온다.  그리고 r3, r4행의 NaN값은 fill_value = 특정값 으로 채워준다.

 

 

 

 

 

:  원래의 행인덱스 2 자리에 'r2'가 들어가니 원래의 2번행은 사라지고 NaN값을 갖는 'r2'행이 들어왔다.

 

 

DataFrame객체.sort_index (ascending=True/False)

DataFrame객체.sort_values (by='열이름', ascending=True/False)  

특정 인덱스 또는 열의 데이터값을 기준으로 오름/내림차순 정렬할 때 쓰는 메소드

   인덱스기준일때는 sort_index()를, 열기준일때는 sort_values()를 사용한다.

<연산 메소드, 결측값 처리하기>

: 데이터프레임은 같은 행x열의 원소끼리 연산이 되고, 시리즈는 같은 인덱스끼리 자동정렬하여 연산한다. 서로 대응되는 인덱스가 없거나 원소가 NaN값이면 NaN을 반환한다. 

student1의 국어점수가 NaN이었고, student2는 대응되는 영어점수가 없어서 NaN이 반환되었다.

Series1.add(Series2, fill_value=0) 

: 연산메소드 .add()를 사용하면서 결측값이 있다면 0으로 대체하여 계산하라는 fill_value=0 옵션을 사용한다.

 

'코딩 독학 > 판다스, 넘파이, 파이썬 문법' 카테고리의 다른 글

[파이썬] 경로설정  (0) 2020.09.30
Numpy 특강 (1)  (0) 2020.09.29

댓글