본문 바로가기

코딩 독학41

모두의딥러닝 3장 선형회귀 에러 Error : can only concatenate list (not 'int') to list list는 list끼리만 결합할 수 있다. 이렇게 하면 해결된다. predict(x) 함수는 fake_a_b[0]*x + fake_a_b[1] 로 숫자 * 리스트 형태를 가진다. 그래서 predict(x)를 바로 실행하면 오류가 뜬다. 뒤에서 x[i] 형태로 for loop를 돌면서 x 내부의 특정원소를 지정해 연산해야함. 두번째, 왜 mse()에서 인자를 np.array로 바꿔야 오류가 안뜰까? 어차피 array로 안 바꿔도 둘다 리스트인데...? numpy array와 python list의 차이 : numpy array 는 같은 위치의 원소끼리 사칙연산이 되고, python list는 list끼리 더해지.. 2020. 9. 29.
인덱스활용 DataFrame객체.reindex( 새로운 인덱스 배열 ) : 기존의 df객체에 새로운 행인덱스를 가진 행을 추가한다. : reindex 는 원래 객체에 없는 행인덱스를 추가하면 데이터값이 NaN으로 입력된다. 즉 원래 df에는 0, 1, 2인덱스를 가진 행만 있는데, r0~r5라는 새로운 행인덱스를 가진 행을 넣어주니 NaN만 반환되었다. : 처음에 r0~r2 인덱싱을 해주고 reindex를 r0~r5로 하면, r0~r2 행은 원래의 데이터값이 나온다. 그리고 r3, r4행의 NaN값은 fill_value = 특정값 으로 채워준다. : 원래의 행인덱스 2 자리에 'r2'가 들어가니 원래의 2번행은 사라지고 NaN값을 갖는 'r2'행이 들어왔다. DataFrame객체.sort_index (ascendi.. 2020. 9. 28.
자료형(기본) : 숫자형, 문자열, 불린, 리스트, 튜플, 딕셔너리 type(변수) 로 변수(객체)의 data type을 확인할 수 있다. 1. Numeric (숫자형) - 정수 : int - 실수 : float 2. String (문자열) - 작은따옴표 or 큰따옴표 안에 넣는다. 3. Boolean (불린) : 비교나 논리 연산자에서 많이 사용 - True / False로 나타남 4. List (리스트) : 모든 자료형을 모아서 저장 - [val1, val2, ...] 5. Tuple (튜플) : 리스트와 비슷한데 저장한 값들을 변경할 수 없다. - (val1, val2, ...) 6. Dictionary (딕셔너리) : 값의 쌍으로 이루어져 있다. - {key1 : val1, key2 : val2, ...} 자료형 변환하기 float(), int(), str(), .. 2020. 9. 23.
인프런_파이썬 머신러닌 완전정복_2장 복습 삽질 내가 보려고 만든 삽질모음. 완전 초보이므로 정말 기본적인 에러들이 많음. 1. KFold 교차검증 에러 1) unhashable type : 'numpy.ndarray' iloc[] : 판다스메소드로 데이터프레임 행단위 기준 행 데이터 읽기 -> 적용 : 데이터프레임명['컬럼명'].iloc[행인덱스] 에러 : iloc() 튜플괄호로 지정함.. 2) 사이킷런의 stratifiedkfold의 split 메소드에서 y지정 안함 for train_index, test_index in skf.split(X, y) 데이터 결괏값인 y (레이블)을 꼭 넣어주자. 필요시 다른 데이터를 넣어도 됨. 회귀에는 kfold 교차검증, 분류에는 stratified kfold 교차검증을 많이 사용한다. 2. 데이터전처리 1) .. 2020. 9. 21.
2장복습 1. 교차검증 사이킷런 model selection 모듈 1. kfold = KFold(n_splits= n) -> kfold.split(X) : 데이터셋을 n개의 폴드로 나누고 학습/검증셋을 돌려가며 교차검증 2. skf = StratifiedKFold(n_splits=n) -> skf.split(X,y) : kfold와 같지만, 레이블을 학습/검증셋에 균일하게 배분 -> for문 사용해서 학습/데이터세트 분리하고 estimator를 fit하고 predict하여 accuracy구하기 3. cross_val_score(estimator, X, y, scoring=None, cv=None) : 폴드세트나누기, 학습/예측/평가까지 한꺼번에! 4. GridSearchCV(dtree, param_grid, sc.. 2020. 9. 21.