본문 바로가기
코딩 독학/코딩 에러

인프런_파이썬 머신러닌 완전정복_2장 복습 삽질

by 효니루 2020. 9. 21.

내가 보려고 만든 삽질모음. 완전 초보이므로 정말 기본적인 에러들이 많음.

 

 

1. KFold 교차검증 에러

1)  unhashable type : 'numpy.ndarray'

 

 

iloc[] : 판다스메소드로 데이터프레임 행단위 기준 행 데이터 읽기

-> 적용 : 데이터프레임명['컬럼명'].iloc[행인덱스]

 

에러 : iloc() 튜플괄호로 지정함..

 

 

 

 

 

 

 

2) 사이킷런의 stratifiedkfold의 split 메소드에서 y지정 안함

 

for train_index, test_index in skf.split(X, y)
데이터 결괏값인 y (레이블)을 꼭 넣어주자.

필요시 다른 데이터를 넣어도 됨.

 

 

 

 

 

 

 

 

 회귀에는 kfold 교차검증, 분류에는 stratified kfold 교차검증을 많이 사용한다.

 

2. 데이터전처리

1) LabelEncoder()는 1darray, OneHotEncoder()는 2darray

LE로 숫자로 인덱싱해주고,  onehot에 쓰려면 .reshape(-1, 1)로 2d array 만들어줘야함! 

 

 

3. 타이타닉 생존자예측 실습

1) DataFrame constructor not properly called

pd.DataFrame(리스트형태) 로 넣어야하는것임..

csv 파일을 df로 불러올 땐 read_csv를 쓰자.

 

 

 

 

 

 

 

 

 

 

2) 데이터 전처리 함수생성시 오류 

 

argument must be a string or number 에러

: 데이터전처리함수를 만들 때

null값 처리하는 fillna()함수를 최종함수에서 레이블인코딩하는 encode_features()보다 먼저넣었어야 하는데, 순서상관없는줄 알았다. def()할 때 순서 당근 중요하다.

 

레이블인코딩할때 argument는 string이나 number여야 하는데 NaN값이 있으니 에러가 났다.

'코딩 독학 > 코딩 에러' 카테고리의 다른 글

모두의딥러닝 4장. 경사하강법 에러  (0) 2020.09.29
모두의딥러닝 3장 선형회귀 에러  (0) 2020.09.29
2장복습  (0) 2020.09.21

댓글