판다스, 파이썬, 사이킷런

Untitled

Untitled

함수 하나만 해도 인자(parameter)가 무지 많다.

중요한 것들은,,

sep, names, usecols, header 정도

names는 칼럼 이름을 지어준다.


사이킷런에서 GridSearchCV라는 게 있다.

이는 최적의 하이퍼 파라미터를 찾는 데에 사용된다.

params ={
'max_depth' : [6,7,10,12,16,20,24]
}
grid_cv = GridSearchCV(dt_clf, param_grid=params, scoring='accuracy',cv=5,verbose=1)

DecisionTreeClassifier인 dt_clf에 여러 개의 params 깊이를 가져가면서 최적이 뭔지 알아보고 있는 중.

scoring은 어떤 정확도 지표를 사용할지 묻는 것이고

cv는 교차 검증 횟수

verbose는 안내 문자? 정도


DecisionTreeClassifier에서 fit()은 X,y 트레이닝 셋 만드는 메소드입니다.