판다스, 파이썬, 사이킷런


함수 하나만 해도 인자(parameter)가 무지 많다.
중요한 것들은,,
sep, names, usecols, header 정도
names는 칼럼 이름을 지어준다.
사이킷런에서 GridSearchCV라는 게 있다.
이는 최적의 하이퍼 파라미터를 찾는 데에 사용된다.
params ={
'max_depth' : [6,7,10,12,16,20,24]
}
grid_cv = GridSearchCV(dt_clf, param_grid=params, scoring='accuracy',cv=5,verbose=1)
DecisionTreeClassifier인 dt_clf에 여러 개의 params 깊이를 가져가면서 최적이 뭔지 알아보고 있는 중.
scoring은 어떤 정확도 지표를 사용할지 묻는 것이고
cv는 교차 검증 횟수
verbose는 안내 문자? 정도
DecisionTreeClassifier에서 fit()은 X,y 트레이닝 셋 만드는 메소드입니다.