[데이터 셋] → 데이터셋 업로드하기 선택
버섯 군집 분류 데이터 다운로드 - https://www.kaggle.com/datasets/uciml/mushroom-classification )
→ CSV파일을 zip 파일로 압축하여 업로드 → 데이터셋 이름과 설명 추가
전처리 하기
[데이터 셋] → mushrooms 데이터셋 선택
→ 우측 상단 ‘전처리 하기' 선택 (도움말 참고)
이 데이터에서 변수들은 모두 문자형이다. 그렇기때문에 이러한 변수들을 입력 변수로 선택하기 위해서는 범주형 변수 변환을 해주어야 한다. 변수의 종류가 다양하고, 각각의 변수 항목들의 개수도 상당하기 때문에 Label encoding을 하는 것이 효율적일 수 있다.
전처리 완료 후 우측 상단에 ‘학습 데이터로 내보내기’ 선택
학습 하기
입력 변수 : class_LabelENcoder, cap-shape_LabelEncoder, cap-surface_LabelEncoder, cap-color_LabelEncoder, bruises_LabelEncoder, odor_LabelEncoder, gill-attachment_LabelEncoder, gill-spacing_LabelEncoder, gill-size_LabelEncoder, gill-color_LabelEncoder 등 모든 정수형 변수
식별자 변수 : X
원하는 모델을 선택한 후 학습을 시작할 수 있습니다.