일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 미국주식
- 코스피
- MQTT
- ConnectedHomeIP
- Espressif
- 파이썬
- 오블완
- Python
- 공모주
- 애플
- 나스닥
- 티스토리챌린지
- Bestin
- 국내주식
- esp32
- 퀄컴
- 배당
- 홈네트워크
- Apple
- 매터
- 월패드
- raspberry pi
- 현대통신
- RS-485
- matter
- homebridge
- Home Assistant
- 힐스테이트 광교산
- 해외주식
- 엔비디아
- Today
- Total
목록제2유형 (4)
YOGYUI
공부 정리하면서 쓰다보니 어느새 예시 문제 하나가지고 4번째 글을 쓰게 됐다 (개꿀...?) 앞서 문제가 발생했던거 별다른 해결책은 떠오르지 않아서 그냥 훈련용 데이터에 주구매속성 및 주구매지점의 모든 도메인의 레코드가 적어도 1개 이상씩 포함되도록 시드값을 변경했다 시험장에서 시간이 충분하다면 레코드를 옮기는 작업을 하면 될텐데, R-Studio 환경도 아니니 이래저래 힘들것 같다 (아마 시험 당일에는 train-validation 홀드아웃도 진행못할 가능성이 높다) set.seed(1234) X_train
7. 의사 결정 나무 제공되는 패키지 중에 rpart가 있으니 의사결정나무도 준비해가자 (분류 결과를 제일 직관적으로 확인 가능한 모델) library(rpart) library(rpart.plot) model_tree
4. 데이터 전처리 훈련용 데이터와 테스트 데이터의 범주형 속성의 레벨이 동일한지 확인해보자 levels(X_train$주구매상품) > [1] "가공식품" "가구" "건강식품" "골프" "구두" "기타" "남성 캐주얼" "남성 트랜디" "남성정장" "농산물" "대형가전" "디자이너" "란제리/내의" [14] "명품" "모피/피혁" "보석" "생활잡화" "섬유잡화" "셔츠" "소형가전" "수산품" "스포츠" "시티웨어" "식기" "아동" "악기" [27] "액세서리" "육류" "일용잡화" "젓갈/반찬" "주류" "주방가전" "주방용품" "차/커피" "축산가공" "침구/수예" "캐주얼" "커리어" "통신/컴퓨터" [40] "트래디셔널" "피혁잡화" "화장품" levels(X_test$주구매상품) > [1] ..
빅데이터분석기사 실기시험(06/19)이 일주일 앞으로 다가왔다 예시문제의 제2유형을 내 나름대로 풀어보면서 관련 코드를 정리해보자는 생각이 들었다 (원래는 귀찮아서 포스팅 안하려고 했는데 ㅎㅎ... 게시글 수도 올릴겸, 방문자 수도 올릴겸... 겸사겸사) 현업에서는 특별한 경우가 아니면 대부분 파이썬 (아니면 C++, Java)으로 업무를 진행하는데, 구글링이나 쿡북 없이 모든 코드를 작성할 정도로 머리가 비상하지는 않아서 (ㅠㅠ) 시험은 그냥 R로 치르기로 결심했다 (R도 평소에 조금씩 써야겠다...) 시험이 오픈북이 아니다보니 필요한 함수들을 외워가야 되는데 R은 함수명, 사용법이 대개 심플해서 마음편히 준비해갈 수 있다 각설하고, 제2유형 '모형 구축 및 평가' 예시문제의 데이터는 백화점 고객의 1..