내가 보려고 만든 삽질모음. 완전 초보이므로 정말 기본적인 에러들이 많음.
1. KFold 교차검증 에러
1) unhashable type : 'numpy.ndarray'
iloc[] : 판다스메소드로 데이터프레임 행단위 기준 행 데이터 읽기
-> 적용 : 데이터프레임명['컬럼명'].iloc[행인덱스]
에러 : iloc() 튜플괄호로 지정함..
2) 사이킷런의 stratifiedkfold의 split 메소드에서 y지정 안함
for train_index, test_index in skf.split(X, y)
데이터 결괏값인 y (레이블)을 꼭 넣어주자.
필요시 다른 데이터를 넣어도 됨.
회귀에는 kfold 교차검증, 분류에는 stratified kfold 교차검증을 많이 사용한다.
2. 데이터전처리
1) LabelEncoder()는 1darray, OneHotEncoder()는 2darray
LE로 숫자로 인덱싱해주고, onehot에 쓰려면 .reshape(-1, 1)로 2d array 만들어줘야함!
3. 타이타닉 생존자예측 실습
1) DataFrame constructor not properly called
pd.DataFrame(리스트형태) 로 넣어야하는것임..
csv 파일을 df로 불러올 땐 read_csv를 쓰자.
2) 데이터 전처리 함수생성시 오류
argument must be a string or number 에러
: 데이터전처리함수를 만들 때
null값 처리하는 fillna()함수를 최종함수에서 레이블인코딩하는 encode_features()보다 먼저넣었어야 하는데, 순서상관없는줄 알았다. def()할 때 순서 당근 중요하다.
레이블인코딩할때 argument는 string이나 number여야 하는데 NaN값이 있으니 에러가 났다.
'코딩 독학 > 코딩 에러' 카테고리의 다른 글
모두의딥러닝 4장. 경사하강법 에러 (0) | 2020.09.29 |
---|---|
모두의딥러닝 3장 선형회귀 에러 (0) | 2020.09.29 |
2장복습 (0) | 2020.09.21 |
댓글