YOGYUI

제2회 빅데이터분석기사 실기시험 유의사항 본문

Study/자격증

제2회 빅데이터분석기사 실기시험 유의사항

요겨 2021. 6. 14. 21:51
반응형

오늘 오전에 실기시험 관련해서 문자메시지가 날아왔다 (공지사항 확인)

원문은 링크에서 확인 가능

공지사항은 저번주 금요일에 올라왔구먼...

 

중요한 내용만 짚어보자

1. 일시 및 장소

일시: 2021년 6월 19일(토) 10:00 ~ 13:00 (180분)

입실시간: 08:50 ~ 09:30, 10:00 이후 입실 불가 (09:30까지 입실 권장)

10:30부터 화장실 이용 가능, 11:30부터 퇴실 가능

신분증 지참 필수

2. 응시환경

클라우드를 이용한 환경으로 시험 진행

시험은 오픈북이 아니며, 응시환경 및 제공되는 응시안내 자료 외 접속 불가

제공언어: R(3.6), Python(3.6)

시험 중 책상 위에는 신분증과 수험표만 허용

3. 제한사항

라인별 실행, 그래프 기능, 단축키, 자동완성 기능 미제공

- 자동완성 안되니 필요한 함수명은 꼭 외워가자 (손이 저절로 타이핑하도록)

- plot 안되니 시각화 코드는 준비할 필요 없다

- 라인별 실행이 안되니 한줄한줄 꼼꼼하게 작성하고, summary, str, length, nrow 등 요약 함수를 활용해 중간 결과물을 꼼꼼하게 확인해야 한다

 

실기 응시환경 내에서 help 함수 이용 가능

- 그나마 다행!

 

코드 실행 시간은 1분으로 제한

- 부스팅이나 뉴럴넷같이 시간이 많이 소모되는 분석 모델은 배제하도록 하자

- lm/glm, random Forest, decision Tree 정도는 함수 사용법을 완벽히 익혀가자

- MASS::stepAIC 변수선택도 변수가 많으면 오래걸리니 사용하기 힘들 가능성이 있다

 

패키지는 추가 설치할 수 없으며, 제공된 패키지만 이용 가능

R패키지.txt
0.01MB
파이썬패키지.txt
0.00MB

- 사용 가능한 패키지가 어떤 게 설치되어있는지 반드시 확인하도록 하자

 

단답형: 답안 작성 후 "제출" 버튼 클릭, 답안은 영문, 한글 모두 가능

작업형 제1유형: 마지막 라인에 print(변수명) 명령어로 출력하는 코드를 제출

작업형 제2유형: 수험번호.csv 파일을 생성하는 코드를 작성하여 실행한 후 제출

  ※ 중복제출 가능, 마지막 제출 답안이 채점 대상

  ※ 임의의 값을 대입하여 출력하는 경우 0점 처리

  ※ csv 파일의 평가지표에 따라 구간별 점수 획득 (예시: 지표가 0.5 ~ 0.6일 경우 10점 등)

 

- 평가지표에 따라 점수를 획득하되, 랜덤으로 정답을 제출하면 0점이라는 말은 코드 자체도 채점 대상에 들어간다는 뜻인 것 같다 (물론 코딩을 얼마나 예쁘게하는지 같은건 대상이 아니지만)

 

- 분류문제의 경우 이항편차 혹은 ROC-AUC, 회귀문제의 경우 RMSE 등 모델의 성능을 판단할 수 있는 메트릭을 구할 수 있어야 한다 (모델 성능이 높을수록 고득점 가능)

 

- ROC, AUC를 구할때 흔하게 사용되는 ROCR 패키지가 제공되지 않는다! pROC 패키지 사용법을 익혀가도록 하자

 

- 최악의 경우 lm / glm 이나 decision tree 같은 간단한 모델 1개로도 어떻게든 답안을 제출할 수 있게 준비해야 한다 (완전 raw data로 학습된 간단한 모델 1개로 write.csv까지 정상적으로 구동되는 코드를 작성해놓고, 그 후 데이터 전처리, 파생변수 생성, 다중공선성 판단, 변수 선택 및 PCA 등 다양한 기법은 여유롭게 완성해나가도록 하자... 아마 테스트 데이터 정답률이 50%만 가까스로 넘어서도 최소 점수는 획득할 듯)

 

- 단답형이랑 제 1유형에서 막혔다고 어영부영 시간끌지 말고 모르는건 일단 제껴두고 제2유형에 2시간 30분 이상 할애한다는 생각으로 시험에 임하자

(단답형은 뭐... 필기시험을 돌이켜보면 출제범위가 엄청 광범위할 것 같다, ADP 필기 수험서 하나 도서관에서 대출해서 한번 훑어만 봐야겠다; 반타작이 목표)

 

- 홈페이지에 분류 문제를 예시로 올려놨으니, 실제 시험 문제는 회귀 문제가 될 것 같은 느낌적인 느낌이 든다 (부동산 가격 예측, 수명 예측 등)

 

- factor 자료형 다루는 법, dplyr 패키지 사용법, 상관관계 분석법, t test, chi-square test, anova 등 통계분석 등 기초적인 내용은 반드시 숙지해야 할 듯


최초로 치러지는 시험이다보니 말도 많고 탈도 많을 것 같다

오픈북이 아니다보니 작성해야 할 코드의 난이도 자체는 그렇게 높지 않다고 봐도 될 것 같다

(실제 ADP 실기에서도 제일 시간 많이 잡아먹는게 시각화 문제였다)

 

익히 예상은 했지만 '진짜' 데이터 분석 전문가를 증명하는 시험과는 거리가 많이 멀어졌다

(국가기술자격시험에서 오픈북이 허용된 적이 없지 않나??)

취준생 이력서 혹은 회사원 KPI에 한 줄 추가하기 위한 용도의 자격증이 된 것 같아 안타깝다

 

유형 가리지않고 총점 60점만 넘으면 합격이라고 한다

단답형 반타작하고 제1유형 20점 정도 받으면 제2유형에서 최소 25점은 획득해야 하니 간당간당하다

퇴근하고 쉬지말고 작업형에서 60점 넘겨버리겠다는 마인드로 준비해야 될 것 같다

 

한번 따놓으면 갱신 필요없이 평생 소지하는 자격증이니깐 한큐에 합격하는게 심신건강에 좋다

(수험료가 5만원 가까이하니... 지갑건강에도 좋다!)

 

응시생 모두 화이팅~!! 합격 기원!!

반응형
Comments