<행 인덱스 재배열>
DataFrame객체.reindex( 새로운 인덱스 배열 )
: 기존의 df객체에 새로운 행인덱스를 가진 행을 추가한다.
: reindex 는 원래 객체에 없는 행인덱스를 추가하면 데이터값이 NaN으로 입력된다. 즉 원래 df에는 0, 1, 2인덱스를 가진 행만 있는데, r0~r5라는 새로운 행인덱스를 가진 행을 넣어주니 NaN만 반환되었다.
: 처음에 r0~r2 인덱싱을 해주고 reindex를 r0~r5로 하면, r0~r2 행은 원래의 데이터값이 나온다. 그리고 r3, r4행의 NaN값은 fill_value = 특정값 으로 채워준다.
: 원래의 행인덱스 2 자리에 'r2'가 들어가니 원래의 2번행은 사라지고 NaN값을 갖는 'r2'행이 들어왔다.
DataFrame객체.sort_index (ascending=True/False)
DataFrame객체.sort_values (by='열이름', ascending=True/False)
: 특정 인덱스 또는 열의 데이터값을 기준으로 오름/내림차순 정렬할 때 쓰는 메소드
인덱스기준일때는 sort_index()를, 열기준일때는 sort_values()를 사용한다.
<연산 메소드, 결측값 처리하기>
: 데이터프레임은 같은 행x열의 원소끼리 연산이 되고, 시리즈는 같은 인덱스끼리 자동정렬하여 연산한다. 서로 대응되는 인덱스가 없거나 원소가 NaN값이면 NaN을 반환한다.
Series1.add(Series2, fill_value=0)
: 연산메소드 .add()를 사용하면서 결측값이 있다면 0으로 대체하여 계산하라는 fill_value=0 옵션을 사용한다.
'코딩 독학 > 판다스, 넘파이, 파이썬 문법' 카테고리의 다른 글
[파이썬] 경로설정 (0) | 2020.09.30 |
---|---|
Numpy 특강 (1) (0) | 2020.09.29 |
댓글