본문 바로가기

분류 전체보기53

인덱스활용 DataFrame객체.reindex( 새로운 인덱스 배열 ) : 기존의 df객체에 새로운 행인덱스를 가진 행을 추가한다. : reindex 는 원래 객체에 없는 행인덱스를 추가하면 데이터값이 NaN으로 입력된다. 즉 원래 df에는 0, 1, 2인덱스를 가진 행만 있는데, r0~r5라는 새로운 행인덱스를 가진 행을 넣어주니 NaN만 반환되었다. : 처음에 r0~r2 인덱싱을 해주고 reindex를 r0~r5로 하면, r0~r2 행은 원래의 데이터값이 나온다. 그리고 r3, r4행의 NaN값은 fill_value = 특정값 으로 채워준다. : 원래의 행인덱스 2 자리에 'r2'가 들어가니 원래의 2번행은 사라지고 NaN값을 갖는 'r2'행이 들어왔다. DataFrame객체.sort_index (ascendi.. 2020. 9. 28.
자료형(기본) : 숫자형, 문자열, 불린, 리스트, 튜플, 딕셔너리 type(변수) 로 변수(객체)의 data type을 확인할 수 있다. 1. Numeric (숫자형) - 정수 : int - 실수 : float 2. String (문자열) - 작은따옴표 or 큰따옴표 안에 넣는다. 3. Boolean (불린) : 비교나 논리 연산자에서 많이 사용 - True / False로 나타남 4. List (리스트) : 모든 자료형을 모아서 저장 - [val1, val2, ...] 5. Tuple (튜플) : 리스트와 비슷한데 저장한 값들을 변경할 수 없다. - (val1, val2, ...) 6. Dictionary (딕셔너리) : 값의 쌍으로 이루어져 있다. - {key1 : val1, key2 : val2, ...} 자료형 변환하기 float(), int(), str(), .. 2020. 9. 23.
인프런_파이썬 머신러닌 완전정복_2장 복습 삽질 내가 보려고 만든 삽질모음. 완전 초보이므로 정말 기본적인 에러들이 많음. 1. KFold 교차검증 에러 1) unhashable type : 'numpy.ndarray' iloc[] : 판다스메소드로 데이터프레임 행단위 기준 행 데이터 읽기 -> 적용 : 데이터프레임명['컬럼명'].iloc[행인덱스] 에러 : iloc() 튜플괄호로 지정함.. 2) 사이킷런의 stratifiedkfold의 split 메소드에서 y지정 안함 for train_index, test_index in skf.split(X, y) 데이터 결괏값인 y (레이블)을 꼭 넣어주자. 필요시 다른 데이터를 넣어도 됨. 회귀에는 kfold 교차검증, 분류에는 stratified kfold 교차검증을 많이 사용한다. 2. 데이터전처리 1) .. 2020. 9. 21.
2장복습 1. 교차검증 사이킷런 model selection 모듈 1. kfold = KFold(n_splits= n) -> kfold.split(X) : 데이터셋을 n개의 폴드로 나누고 학습/검증셋을 돌려가며 교차검증 2. skf = StratifiedKFold(n_splits=n) -> skf.split(X,y) : kfold와 같지만, 레이블을 학습/검증셋에 균일하게 배분 -> for문 사용해서 학습/데이터세트 분리하고 estimator를 fit하고 predict하여 accuracy구하기 3. cross_val_score(estimator, X, y, scoring=None, cv=None) : 폴드세트나누기, 학습/예측/평가까지 한꺼번에! 4. GridSearchCV(dtree, param_grid, sc.. 2020. 9. 21.
<투자자의 인문학 서재>_서준식 지음 / 정리 (1) 내가 보고 싶어서 하는 정리 ⁼̴̤̆◡̶͂⁼̴̤̆ 예전에는 경제가 발전한다는게 뭔지도 이해가 잘 안 됐고 왜 돈이 순환해야 경제가 발전한다는지도 주식같은것에서 어떻게 없던 돈이, 수익이 '창출'되는지도 이해가 안 됐었다. 그 이익은 누가 가져다 준 거지 도대체?!? 이 책을 읽으면서 저자의 말과 같이 경제는, 투자는 인문학이라는 생각이 든다. 경제는 단순한 숫자놀이가 아니라 정말로 복합적인 학문이었다... 국부론 , 자본론 , 일반이론 : 국부는 자신의 이익을 위한 개인의 이기심으로 발생한다. 물건 생산 비용과 판매가격, 그물건의 사용가치인 효용을 봤을 때 드는 비용보다 팔리는 가격이 클때 생산자는 물건 생산욕구가 팍팍 생김. 파는 가격보다 물건가치인 효용이 클수록 소비자도 물건을 더 잘 사게 됨. 결국.. 2020. 3. 13.