1. mustroom.csv.zip 파일 업로드하기

[데이터 셋] → 데이터셋 업로드하기 선택

버섯 군집 분류 데이터 다운로드 - https://www.kaggle.com/datasets/uciml/mushroom-classification )

→ CSV파일을 zip 파일로 압축하여 업로드 → 데이터셋 이름과 설명 추가

스크린샷 2022-08-03 오후 3.21.16.png

스크린샷 2022-08-04 오후 2.55.39.png

  1. 전처리 하기

    [데이터 셋] → mushrooms 데이터셋 선택

    → 우측 상단 ‘전처리 하기' 선택 (도움말 참고)

    스크린샷 2022-08-04 오후 1.46.35.png

    1. 범주형 변수 변환

    스크린샷 2022-08-04 오후 3.07.56.png

    이 데이터에서 변수들은 모두 문자형이다. 그렇기때문에 이러한 변수들을 입력 변수로 선택하기 위해서는 범주형 변수 변환을 해주어야 한다. 변수의 종류가 다양하고, 각각의 변수 항목들의 개수도 상당하기 때문에 Label encoding을 하는 것이 효율적일 수 있다.

    전처리 완료 후 우측 상단에 ‘학습 데이터로 내보내기’ 선택

    1. 학습 하기

      스크린샷 2022-08-04 오후 3.12.49.png

    입력 변수 : class_LabelENcoder, cap-shape_LabelEncoder, cap-surface_LabelEncoder, cap-color_LabelEncoder, bruises_LabelEncoder, odor_LabelEncoder, gill-attachment_LabelEncoder, gill-spacing_LabelEncoder, gill-size_LabelEncoder, gill-color_LabelEncoder 등 모든 정수형 변수

    식별자 변수 : X

    스크린샷 2022-08-04 오후 3.12.26.png

    원하는 모델을 선택한 후 학습을 시작할 수 있습니다.

    1. 결과 비교