빅데이터 분석기사 자격 취득
2022년 새해 계획을 세우면서 여러 가지 목표를 잡았다.
그 중 구체적인 성과를 얻는 걸로 “기사” 자격증을 하나 따자 라고 생각했다.
2020년에 “기술사” 자격을 취득하여, “기사” 자격은 굳이 취득하지 않아도 상관없지만,
그래도 2021년처럼 아무런 노력을 하지 않는 것보다는 구체적인 목표를 갖고 실행해 나가고 싶었다.
“빅데이터분석기사”는 2020년 처음 만들어졌다.
세계적으로 데이터 수집, 분석과 활용의 중요성이 커지고,
미래사회 경쟁력을 갖기 위한 수단으로 데이터 분석이 각광받다 보니, 따로 “기사” 자격으로 만든 것 같다.
기존의 “정보처리기사”와 같은 정보, 컴퓨터영역의 국가기술자격이다.
“정보처리기사” 자격은 거의 20년 전인 2003년에 취득하였다.
당시에는 필기시험은 기본서 한번 보고, 기출문제를 외워서 쳤고,
실기는 Visual Basic으로 거품정렬 알고리즘을 만들어서, 숫자 데이터를 정렬하는 결과물을 제출했다.
정보처리기사는 2004년 일본 IT취업을 위한 일본 취업비자 발급의 필수 자격이었다.
그리고, 지금까지 IT 경력의 시발점인 자격증으로 생각하고 있다.
"정보보안기사" 자격은 2015년, 당시 5회 차 시험에서 취득하였다.
당시 현업에서 조직 정보보안 업무를 하고 있는 중이라서, 그래도 수월하게 취득하였다.
최근 정보보안기사 시험의 합격률을 보니, 꽤나 취득하기 어려운 자격이 된 것 같다.
"기술사" 자격은 2020년 취득하였다.
계속 공부는 했지만, 대학원 졸업 학기에 논문 쓴다고 어느 정도, 기대하지 않고 시험 쳤는데,
어떻게 합격하였다. 이건 나중에 따로 써야 할 부분이다.
“빅데이터분석기사”는 코로나19로 1회 차가 밀리고 해서, 올해 상반기가 4회 차 시험이었다.
3회 차 필기시험 때, 따로 시험공부를 하지 않고,
대충 데이터 분석 관련 서적만 읽고 가서 쳤다가 55점 정도로 떨어졌다.
올해는 좀 자세를 잡고 하자고 생각해서, 4월 9일 시험을 접수하고,
한 달 못남은 시점에 영진닷컴 출판사의 《2022 이기적 빅데이터 필기》 기본서를 샀다.
주말이나 시간이 날 때 틈틈이 읽어서 3독 정도 한 것 같다.
현업에서 제대로 데이터 분석 업무를 처리 하는 건 아니지만,
대학원 전공, 논문 작성 때 공부한 통계 지식과
“기술사” 자격 취득 시 익혔던 토픽들과 겹쳐서 수월하게 진행하였다.
전부 이해하는 것은 아니지만, 이런 개념 이구나 정도는 이해했다.
필기시험은 4과목, 80문항에 평균 60점 이상, 과목별 40점 미만 과락 없을 경우 합격이다.
80문항=100점 기준이라서, 1문항당 1.25점이다.
총 48문항이상 맞춰야 하고, 과목별 8문항 이상은 맞아야 했다.
4회 차 필기시험은 정확히 기억은 안 나지만,
문제 유형이 데이터 분석 50%, 수치·통계 30%, 개인정보보호·관련 법·기타 20% 정도로 출제 되었던 것 것 같다.
공부를 해서인지 3회차 보다는 수월하게 치렀다.
필기시험을 치러온 젊은 친구들이 많았다.
확실히 소수의 중·장년이 치는 “기술사”시험과는 다른 분위기였다.
나는 필기 시험 반에서 첫 번째 또는 두 번째로 나이가 많은 것 같았다.
필기 결과는 합격이었다. 점수는 60점을 살짝 넘는 정도였다.
생각보다 점수 안 나왔네... 싶었지만,
필기 합격 버스 문을 첫 번째로 활짝 열고 올라 타 든,
마지막 닫히는 문틈으로 살짝 몸만 끼어 올라타고 출발하든,
똑같이 필기 합격을 한 거니 신경 안 쓰기로 했다.
두 번 볼 필기도 아니라서, 가채점이나 오답 재확인도 안 했다.
필기 합격 후 실기 시험은 50여일의 시간이 있었다.
“빅데이터 분석기사” 실기시험은 파이썬이나 R언어로 직접 데이터 분석 처리한 결과를
제출하는 CBT(Computer Based Test)방식이다.
전에 취득했던 “기술사”와 “정보보안기사” 자격 실기시험은
그냥 면접 구술시험과 서술형 필답시험(Paper Based Test)이었던 것 비해서,
확실히 컴퓨터를 이용한 소스 작성으로 실전형 실기시험이었다.
문제는 파이썬과 R언어 둘 다 실기 시험 준비가 안 되어 있었다.
파이썬은 5일정도의 단기간 실습교육을 받아 봤고,
R언어는 대학원 전공수업에서 과제 제출을 위해서 2학기 정도 독학했었다.
실기시험은 현업처럼 복잡한 DBMS 테이블 구조에서, 복잡한 쿼리로
정형화된 데이터를 읽어 와서, 복잡한 UI단에 뿌리는 게 아니라,
3시간 안에 외부파일에서 데이터를 읽어 와서 함수로 적당히 변환 처리하여 결과를 출력하는 수준일 거라 생각했다.
여러 출제 유형을 반복 처리해보면 충분할거라 생각했다.
언어는 파이썬을 선택했다.
사실 R언어가 좀 더 많이 사용한 건 맞지만, 2019년 대학원 수업 때 과제 작성을 위해 독학한 수준이라,
3년은 지나 버려서 많이 잊어서 제로베이스나 마찬가지였다.
웹서핑을 해보니, 2022년 5월 기준으로 R언어로의 “빅데이터분석기사”실기 수험서는 별로 없고,
평도 별로 였던 것 같다.
특히 3회차 까지 , 작업형 소스의 실행 완료시간이 문제 당 60초를 넘어가면 0점 처리하는데,
그런 문제가 생긴 수험자들은 대부분 R언어를 썼다라는 인터넷 글을 보고,
대세는 파이썬이라 생각하고, 파이썬 기반의 실기 수험서를 주문했다.
인터넷나 Kaggle, 빅분기 카페에서 관련 자료를 찾아 쓸 만한 것만 추려, 내재화하는
방법은 고려하지 않았다. 인터넷 자료 수집, 정리 작업에 시간과 열정을 쓰고 싶지 않았다.
그냥, 실기 책 보고, 파이썬으로 데이터 분석 처리 방법 외우고, 응용해서 쓴자라고 심플하게 생각하였다.
다른 블로그을 참조하고 인터넷서점 인기순의 상위권에 있는
프리렉 출반사의 《2022 빅데이터 분석 기사 실기 필답형+작업형》을 선택했다.
필답형은 필기시험의 연장이고, 중요한 기술 키워드 50여 개 정도라서 쓰윽보고 지나갔다.
작업형은 파이썬 기본 사용방법과 실제 작업형 1유형 예제 풀이 6개와 2유형 3개의 소스코드와 풀이 설명이 나와 있었다.
책에는 단순 평균, 중위값, 최소값, 최대값 출력, 라벨인코딩 변환, 사분위 값 추출,
group by 처리, for문 제어, 분류(classifier)와 회귀(regressor) 학습과 예측 등 작업형 문제로 잘 설명되어 있었다.
파이썬은 처음이고 for, if문 같은 제어문 보다는
dataframe 같은 처리함수와 행렬 형식의 데이터 처리 방법에 익숙해지는데 시각이 걸렸다.
실기공부는 VisualStudio Code 프로그램에서 책에 나오는 9개 예제의 소스코드와 주석 설명 부분을
직접 입력하여 파이썬 소스(마스터 소스)로 만들었다.
그 다음 부터는 책은 펴보지 않고, 모니터에 왼쪽은 예제 마스터 소스를, 오른쪽은 빈 페이지를 띄우고 3번 정도 따라 쳤다.
그리고 그 다음 부터는 왼쪽에는 예제 마스터 소스를 오른쪽은 작업형 문제 설명만 적혀있는 페이지를 띄우고,
해당 문제의 분석절차를 소스로 스스로 작성하는 방법으로 하였다.
처음부터 세 번째 작성까지는 중간에 함수나 처리 방식이 헷갈리거나 막혀서,
왼쪽의 마스터 소스를 참조해서 봤지만, 그다음부터는 거의 외워서 작성할 수 있게 되었다.
실제 시험 전까지 9개 작업형 문제를 7회 반복 작성하였다.
작업형 처리 절차와 처리 소스를 그냥 기계적으로 작성할 수 있도록 하였다.
4회차 실기시험은 책의 소스코드를 익히 범위 내에서 적당히 활용해서 작성했고 합격했다.
결과는 합격이라서 다시 실기시험을 칠 일은 없을 것 같다.
필답형 10문항 중 5문항 정답 : 15점
작업형 1유형 3문항 중 2문항 정답 : 20점
작업형 2유형 정답 : 40점
필답형은 문제가 어렵다기보다는 문항이 짧아 어려웠다.
짧은 문제 설명이 너무 짧아 요구하는 답이 여러 개 생각나거나,
짧은 설명만으로는 답을 도출하기에는 어려웠다.
예를 들면 "??는 어떠한 처리를 하는 인터넷 서비스 기술 이다." , "??를 채우시요." 이런 식으로
문제 설명이 짧다.
작업형 1유형은 거의 다 실기 교재에 있는 수준이었던 것 같은데, 3번 문항의 특정 연도의 특정국가명을
갖는 데이터를 파악하라는 지문을 특정국가명만 파악하는 것으로 오해석해서 틀린 결과를 제출하였다.
작업형 2유형은 분류(classifier) 문제이지만, Macro-F1 score로 채점한다고 되어 있는데 기존
훈련데이터(x_train), 훈련결과데이터(y_train), 검증데이터(x_test)의 3개 CSV파일이 아닌,
훈련데이터(train), 검증(test)의 2개 CSV파일만 존재해서, 훈련데이터에서 훈련결과데이터를
분리해서 처리하도록 살짝 꼬여 있었다.
위에 실기 서적에는 Macro-F1 score 적합도 판단은 없었다.
그래서, 적합도 판단은 skip하고,
라벨인코딩하고 xgboost로 XGBClassifer로 분류했다.
30점 정도로 기대했는데, 40점이 나온 걸로 봐서, 적합도가 적정했던 것 같다.
국가자격시험은 보통 대학이나 공업고등학교에서 했던 것 같은데,
이번 시험은 어느 사설IT직업학교에서 했다. 기관 성격이나 상관없는데, 실기시험 환경이 별로 였다.
인테리어는 깔끔했지만, 소수 정예 강의를 지향하는 지,
9평 정도 되는 강의실에 3행 6열 책상이 있고, 거기에 18대의 컴퓨터가 있었다.
그 실습실에 16명 정도의 실기 시험자가 배정되었다.
너무 좁고 갑갑했다. 코로나19라서 간이 투명 칸막이는 쳐놓았지만,
좁은 컴퓨터 책상 3개가 붙어 있고, 3명이 앉아 있으니, 마치 비행기 이코노미석에 앉은 기분이었다.
시험실 PC환경도 2013년 정도 발매된 CPU(i5 3세대급)에 20인치 1600*900 해상도의 모니터였다.
거의 10년이 다되어가는 낡은 PC환경이었다.
마우스와 키보드도 손때가 찌들어 있어, 앉자마자 물티슈로 닦았다.
클라우드 환경에서 시험을 치니 PC 성능이야 그러려니 해도,
FHD보다 낮은 모니터 해상도와 지저분한 입력 장치는 절대 괜찮다는 말이 안나왔다.
그래도 실제 시험에서 입출력에 이상은 발생하지 않았다.
거의 1시간 40분만에 작업형 2유형까지 다 완성하고 나와서 상관은 없었지만,
중간의 클라우드 네트워크 문제로 답안 제출이 정상적으로 되지 않아,
공식적으로 1시간 더 시험 시간이 연장되었다고 한다.
이번에도 실기 시험 반내의 시험자 중에 내가 두 번째 정도 나이가 많아 보였다.
나머지는 20대의 대학 졸업반 정도의 나이로 보였다.
총 3달의 준비와 필기 및 실기 수험서 2권을 구매하고, 필기시험 2회, 실기시험 1회의 접수비로
"빅데이터분석기사"를 취득하였다.
“빅데이터분석기사” 자격을 어디에 활용할 수 있을 지는 잘 모르겠지만,
2022년 목표 중 1개는 성취한 것 같아서 기분이 좋다.
'0910_일상' 카테고리의 다른 글
코로나 19 후, 7월 (1) | 2023.07.17 |
---|---|
2023.2. 빠른 시간 (0) | 2023.02.07 |
요즘 뭐해? (0) | 2022.07.12 |
12월의 감상 (0) | 2021.12.06 |
펜케익 만드는 토요일 아침 (0) | 2021.08.07 |