ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • KT 에이블스쿨 AIVLE school 4기 머신러닝, 미프 3차
    KT 에이블스쿨 2023. 11. 26. 18:44

     

     

    에이블스쿨 DX컨설턴트 반에서는 한달가량 데이터 다루기, 수집, 분석을 배우고 나서 머신러닝, 딥러닝 수업에 들어갑니다!

     

    머신러닝ML이란 인간의 학습방법을 모방하는 인공지능의 한 분야입니다

    지도, 비지도, 준지도, 강화학습으로 나눠지고

    AIVLE DX반에서는 인공지능 개발자가 되는게 목표가 아니라 컨설팅 제안을 하기 위해 기술도 배우는 거다 보니 지도학습, 비지도 학습만 간단히 배우게 돼요~

     

     

    우선적으로 배우는 지도학습에서는 분류, 회귀 학습방법에 배우는데

    문제 유형을 파악한 후 알고리즘, 평가 방법을 선택해서 관련 함수를 사용해서 모델링을 했습니다~

    분류문제 : 범줏값 예측 회귀문제 : 연속적인 숫자 예측
    DecisionTreeClassifier
    KNeighborsClassifier
    LogisticRegression
    RandomForestClassifier
    XGBClassifier
    LinearRegression
    KNeighborsRegression
    DecisionTreeRegressor
    RandomForestRegressor
    XGBRegressor
    accuracy_score
    recall_score
    precision_score
    classification_report
    confusion_matrix
    mean_absolute_error
    mean_squared_error
    root_mean_squared_error
    mean_absolute_percentage_error
    r2_score

     


     

    모델을 만들고 학습, 평가하기 위한 데이터는 sklearn(사이킷런)을 이용해서 분리를 해줍니다

     

     

    < 모델링 코드 구조 >

    1) 사용할 알고리즘과 평가를 위한 함수 불러오기

     2) 모델 선언

    3) fit(x_train, y_train) 형태로 모델 학습

    4) 모델.predict(x_test) 예측

    5) 실제값과 예측값 을 통한 성능 평가

     

     

    모델을 학습, 평가용 데이터로 나누기 전에는 전처리가 필요해요!

    필요 없는 변수가 들어가 있는 열을 제거, 결측치제거를 해줍니다

     


     

    회귀 성능 평가인

    MSE, RMSE, MAE, MAPE는 작을수록, R2 Score는 클수록 좋고

    예측한 값과 실제 값 사이의 오차를 줄이는게 관건

     

    분류 성능 평가는 정확도를 높이는게 관건

    accuracy(정확도) : 1과 0을 정확히 예측한 비율

    precision(정밀도) : 1이라 예측한 것 중 정말 1인 비율

    recall(재현율) : 실제 1인 것을 1이라고 예측한 비율

    f1-score : precision과 recall의 조화평균

     


     

    실습을 하면서 다양한 알고리즘을 사용해서 모델을 만들고 성능을 평가하는 작업을 가졌습니다

     

    처음에는 모델링 자체가 낯설었지만 다양한 함수들을 통해 모델링을 연습하다 보면 익숙해지더라구요~

    개별 실습이 많아서 이론으로만 듣고 끝내지 않고 스스로의 것으로 체득할 수 있게 해주셔서 좋았습니다!

    함수들을 사용할 때는 정확도를 높일 수 있게 적절한 파라미터를 찾는게 중요해요

    ex) KNeighbors의 K값, DecisionTree의 max_depth 등

     


     

    미니 프로젝트 3차에서는

    데이터에서 추출한 feature값들을 중요도에 맞게 정렬한 다음 시각화도 하고 

     

    다양한 모델을 사용해서 가장 최적의 정확도를 보이는 모델을 찾아내기도 했어요

     

     

    또 배운 머신러닝을 이용해서 군집별 특성을 정의하고 조원들끼리 실습한 걸 데이터를 모아서 마케팅 방안도 도출해냈습니다

     

    미니프로젝트를 할 때마다 느끼지만 본 수업을 들을 때 그냥 듣고 흘리는게 아니라 수업 후 시간을 이용해서 복습도 해보고 들은 내용을 자기걸로 만든 다음에 응용도 해보는게 도움이 많이 되는 것 같아요

    또 코딩보다는 마케팅 방안을 생각해내는게 항상 저한테는 어려웠는데 조원들과 토의하면서 다양한 시각도 생각해볼 수 있고 많이 배우는 것 같습니다🥰

Designed by Tistory.