자유/잡담

[회고] 빅데이터분석 동아리 CUAI 동아리 회고 - 상

Chipmunks 2020. 4. 5.
728x90

< 현재 카페 대문 made by YH >


올 해 휴학을 하기 전, 2019년 7월부터 11월 말까지 불태웠던 교내 빅데이터분석 동아리 운영진 회고를 하고자 한다!


18년도 직무연구회 스터디

우선 운영진 회고를 하기 전, 어떻게 동아리를 들어가고 어떤 과정이 있었는지 설명을 하는게 좋을 것 같다.

시작은 2018년이었지만 처음에는 동아리가 아니라 통계학과와 경영학과, 컴퓨터공학과로 구성된 10명 내외의 스터디 정도였다.

'인재개발원' 소속에서 지원받는 스터디로, 머신러닝도 공부하고 학교에서 식비 지원도 받는 좋은 스터디(?)였다.


처음 시작부터 함께 한 건 우연이었다.

유명한 교외 연합동아리들에 지원을 했었지만 면접에서 빈번히 떨어졌었다.

아마 통계학 배경지식이 기초통계학과 R, SQL 수업을 들은 수준이라 부족하다고 느꼈을 수도 있고, 무얼 하고 싶은건지가 명확하지 않다고 느꼈을 수도 있고, 나이가 20대 초반이라 군대를 가지 않는다고 이야기를 했지만 탈주 리스크가 없는 사람을 뽑는 것으로 결정했을 수도 있다.

그러던 중 우연히 교내 커뮤니티에서 빅데이터 스터디 모집을 발견했다.

본문에 스터디를 열심히 참여한다는 열정만 있으면 전공과 나이에 상관 없이 누구나 함께할 수 있다고 적혀 있어, 밑져야 본전(?)으로 신청했다.

모집 글을 올린 Y형과 몇 마디 이야기를 나누고 단톡방에 합류했다!

단톡방 인원 중, 교내에서 2017년 초에 했던 iOS 특강을 함께 들은 형이 계셨다.

같이 특강을 들은 H형한테 좋게 들었는지, Y형이 끝까지 스터디 함께 했으면 좋겠다고 말했었다.




첫 학기는 '파이썬 라이브러리를 활용한 머신러닝' 교재(개정 전)로 진행했고 두 번째 학기는 캐글 실습을 하고 싶은 니즈로 '머신러닝 탐구 생활' 교재로 진행했다.

각자 교재를 읽고 맡은 부분을 설명하는 형식이었다.

코드 중심으로 진행해, 이론이 부족해도 어떻게든 따라갈 순 있겠다, 라고 생각을 했다.

부족한 통계학 지식은 통계학을 전공하는 형, 누나들에게 도움을 많이 받았고

나는 실습 환경과 코드 관련 이슈에 많은 도움을 줬다.


개봉박두 동아리 1기

그 스터디가 한 학기, 두 학기 계속되고 Y 형이 판을 키워 2019년부터 본격적으로 동아리로 시작했다. 

18년도와 마찬가지로 열정만 있다면, 누구나 동아리에 들어올 수 있었다.

모집 결과 총 40~50명의 인원이 1기에 함께 했다. 이 때는 운영진이 아닌, 팀장으로 활동을 했다.

작년에 했던 스터디 형식을 여러 팀으로 동시에 진행하는 방식으로,

우리 팀은 10명~11명정도로 모두를 위한 머신러닝 시즌2 강의로 진행을 했다.


개강하고 모집을 해 늦게 시작을 했었다. 그래서 만날 수 있는 횟수가 적었다.

뒤로 갈수록 어렵게 느끼시는 분들이 많았다.

그래서 각자 설명하는 방식 위주로 하기 보다 후기를 서로 이야기하고 궁금한 점들을 나누는 방식으로 바꿨다.

다른 팀 스터디에 놀러 가봤을 때는 소수의 사람이 다른 사람들을 이끄는 방식이었다.

입문하신 분들은 많이 어렵게 느껴지다보니 대화 참여도 힘들고 '나와 맞지 않는구나' 라고 생각을 하신 것 같다.

그래서 그런지 1기에서 2기로 넘어가는 인원이 매우 적었다.


그나마 행운인건 새로운 운영진을 포함해 우리 팀에서 가장 많은 인원이 남기도 했고

8월달에 전력거래소 발전량 예측 대회를 나가 많이 부족한 상태였지만, 입상 실적을 얻어냈다.


운영진이 되다.

18년도부터 스터디를 관리하고 CUAI 1기 회장을 맡은 형이 취업 준비로 물러난다.

다른 1기 운영진인 분들도 취업 또는 대학원과 병행하기 힘들다고 판단해,

새로운 2기 운영진을 모집했다.


1학기가 끝나고 계절학기를 듣고 있는 와중에 운영진 이야기도 할겸 잠깐 모여달라고 연락이 왔었다.

현재 동아리 상황을 듣고 되도록이면 운영진을 해줄 수 있겠냐는 제안이 왔다.

1기에서 운영진을 포함해 많은 인원이 빠져나간 상황이었다.

그래도 작년 시작부터 함께 해 애정이 있었고 교내 최초 빅데이터분석 동아리로 시작을 한 만큼

전통있는 동아리가 됐으면 하는 바람이 컸었다.

2년 전 '멋쟁이 사자처럼' 5기 운영진 때도 다시 일으킨 적이 있었기에 한 번 도전해보자, 라는 생각이 있었다.

상황이 상황인 만큼 운영진을 하겠다고 의사를 전달했다.


같이 2기 운영진으로 할 사람들은 같은 팀이었던 14학번 통계학과 K형과 17학번 통계학과 P형, 17학번 컴퓨터공학과 동생 S, 그리고 16학번인 나 이렇게 네 명이었다. 17학번 통계학과 형은 수능을 다시 보시고 들어온거라 전적대에서는 13학번이었다.


K형은 나와 같은 팀이었다. 외부 데이터 분석 동아리 운영진을 맡았었고 교내 경영경제 소속의 전통있는 동아리의 회장직을 겸하셨다.

P형도 K형이 속한 데이터 분석 동아리를 같이 했었던 것 같다.

S도 나와 같은 팀이었고, 새로운 것을 많이 알고 싶은 욕구가 큰 친구였다.


운영진 첫 미팅

19년 7월 14일 오전 11시, 영등포역 H 프랜차이즈 카페에서 3시간 가량의 첫 미팅을 가졌다.

동생 S는 사정이 있어 참석을 못했고 K형과 P형, 나 셋이서 이야기를 나눴다.


간단한 자기 소개를 마치고 CUAI 1기가 어떠했는지 객관적이고 비판적으로 이야기를 나눴다.

팀별로 인원이 10명으로 많아 개개인을 관리하기가 힘들었던 점, 체계가 없어 우왕좌왕 했던 점, 친목을 다지기 힘들었던 점, 4학년 인원이 많아 대거 빠져나간다는 점, 면접을 보지 않아 이탈률이 많았다는 점 등등이 있었다.


이번 2기의 과제는 '체계' 라는 키워드로 정했다.

제로였던 CUAI 의 체계를 세워 오래 가는 동아리를 만드는 것이 목표였다.

동아리 운영에 기본적인, 리크루팅 방법모임 기획, 브랜딩, 예산 편성, 동아리 규칙을 대략적으로 짰다.


리크루팅으로 모집 포스터를 만들고 홍보하며, 서류 모집은 물론 면접까지 하기로 결정했다.

모집 대상은 CUAI 1기 모집 대상과 동일했다. 배경 지식이 없어도 지원이 가능했다.

나도 배경 지식이 없었지만 함께 할 수 있었기에, 이 점은 꼭 유지 됐으면 했다.

그러나 1기 때 본인이 예상했던 것과 다르다는 이유로 초기 이탈률이 컸었다.

이 점을 극복하기 위해 서류 모집에 통과한 사람들은 머신러닝 기초 강의를 면접까지 들어야 한다고 정했다. 머신러닝 기초 강의를 토대로 질문 몇가지를 면접 때 하기로 했다.


그렇다면 어떤 사람들을 뽑아야 하는가, 를 다 같이 의견을 나눴다.

블로그의 동아리 소개에 나와있는 대로 인재상을 다음과 같이 정리했다.

  1. 지식을 학습하고 공유하는데 거리낌 없는 사람
  2. 다양한 분야에 열려있는 사람
  3. 데이터로 세상의 문제를 해결하고자 하는 사람

다양한 전공 사람들이 활발하게 다양한 문제를 빅데이터 분석으로 해결했으면 하는 바람이었다.


< CUAI 동아리 목표 >


< CUAI 동아리 인재상 >


두 번째로 동아리 모임은 어떻게 할 거고, 어떤 행사들을 할 건지를 정했다.

1기는 공부할 강의를 던져주고 팀끼리 알아서 하는 구조였지만,

2기는 처음부터 끝까지 동아리 체계 안에서 방향을 제시해주는 구조로 변경했다.

머신러닝의 바이블로 통하는 '파이썬 머신러닝 완벽 가이드' 한 권을 마치는 걸로 결정했다.


1기 때 팀이 10명이었을 때의 단점을 극복해야 했다.

첫 째, 한 팀에 사람이 너무 많았다.

둘 째, 같은 걸 공부해도 모든 팀원이 같은 수준의 지식을 얻지는 않는다.

셋 째, 다른 팀이 어떤 것을 배우는지 공유하는 시간이 부족했고 공감이 가지 않았다.

넷 째, 다른 팀에 누가 있는지를 전혀 몰랐다.

다섯 째, 전체에 적용되는 구체적인 규칙이 없었다.

( 멋쟁이 사자처럼 때와 굉장히 유사했다. )


2기 팀은 4명~5명 정도 합격 인원을 32명으로 예상해 8팀까지 생각했다.

거기에 1기 잔여인원까지 합쳐 총 40명으로 예상했다.

4명보다 적은 3명은 피치 못한 사정으로 한 명이 빠졌을 때 나머지 팀원이 커버하기 어렵다고 생각했다. 그렇다고 6명 이상의 많은 인원은 책임감을 분산시켜 효율이 떨어질 것으로 예상했다.

네 명이 친목을 다지기도 쉽고 스터디 장소를 빌리거나 스터디할 때에도 별다른 제약이 없다.

학교 수업에서도 4명에서 6명까지 팀플을 하는 경우가 많으니, 익숙한 형태였을 것으로 생각했다. 물론 소수인 만큼 어떤 팀원을 함께 묶을 것인지도 중요한 문제였다.

( 이 문제는 리크루팅에서 설명하고자 한다. )


교재 진도를 나가는 모임을 '정기 세션'이라 정의했다.

정기 세션은 2~3시간 가량 진행하며 다음과 같이 진행한다.

첫 째, 세 팀이 정리한 내용을 발표하고 QnA를 받고 동아리원으로부터 피드백을 받고 투표를 받는다.

둘 째, 발표팀이 다음 주까지 해야 할 과제를 만들고, 다음 모임에 과제 해설까지 맡는다.

셋 째, 뒤에 남는 시간에 자신을 소개하고 자신의 이야기를 말하는 자유 세미나 시간을 가진다.


첫 번째를 구상한 이유는, 발표팀 입장에서 어떤 성취감이 없다면 동기가 빠르게 없어질 것 같았다. 투표로 다른 발표팀과 경쟁하는 느낌을 주면 더욱 재밌고 풍부한 발표가 될 것으로 예상했다.

투표를 많이 받은 팀에 한해 나중에 시상도 하면 좋을 것 같다는 의견을 나눴다.

두 번째를 구상한 이유는, 과제가 있어야 실습도 해보고 복습까지 한다는 의견이 있었다. K형이 운영했던 동아리를 벤치마킹했다.

세 번째를 구상한 이유는, 내 팀 외에 누가 있는지를 전혀 모른다면 아쉬움이 많이 남기도 하고 동아리에 애정을 갖기 힘들 것으로 생각했다.

나를 전체 동아리 사람들에게 소개하고 나를 다시 돌아보도록 하는 시간이 될 것으로 예상했다.

한창 모교의 필수 교양인 연기 수업을 듣고 있었기에, 레크레이션 쪽으로 그 수업에서 영감을 얻었다.


첫 모임은 오리엔테이션 날로 정했다. 동아리 운영 방법규칙을 소개하고, 운영진을 공식으로 소개하고, 로 만난 동아리원끼리 친해지는 시간을 가진다.

각 정기 세션 전까지 각자 네이버 블로그 메모 게시판을 활용해 '비공개'로 과제를 올리고 운영진이 확인한다.

훗날 '컨퍼런스'라고 정의한 '세미나'는 각 팀별로 만든 프로젝트 결과물을 발표하는 자리다. 상금도 준비하고 시상도 하자고 의견을 나눴다. 이 날에는 외부 인원도 마음껏 참여할 수 있는 것으로 정했다.

과제는 K형이 운영했던 동아리에서 영감을 받았고, 컨퍼런스는 외부 빅데이터 동아리에서 영감을 받았다.


내가 주장을 많이 했던 건 브랜딩이었다.

전통 있는 동아리가 되기 위해선 브랜딩이 꼭 필요하다고 생각했다.

유명한 동아리들은 모두 이력들을 볼 수 있는 홈페이지가 있었다.

따라서 CUAI 동아리도 블로그에 활동들을 정리하고, 자료들을 차곡차곡 쌓기를 원했다.

사람들께 보여줄 블로그는 네이버 블로그를 채택했다.

자료 및 동아리 내부 커뮤니티는 처음에 노션으로 선택했지만, 무료 버전의 용량이 턱없이 모자랐고 유료로 전환하기엔 부담이 컸다. 그래서 네이버 카페로 방향을 돌렸다.

내가 주장을 한 만큼, 네이버 블로그와 네이버 카페는 모두 내가 관리하기로 했다.


네이버 블로그는 외부 사람들이 보는 만큼 활동 위주로 게시글을 올리고자 했다.

네이버 카페는 여러 자료들을 저장하고 공지사항을 올리고 여러 정보들을 공유하는 역할로 정했다.


< CUAI 블로그 모습 >


< CUAI 네이버 카페 모습 >


그 다음에 가장 중요한 예산 편성을 이야기 했다.

'인재개발원' 으로부터 받은 지원금과 1기의 남은 예산, 2기로부터 걷을 회비를 총합해 약 백만원 가량으로 예상했다.

한 행사날 뒷풀이 비용을 인 당 만원씩 지원하고 세미나 상금도 준비하고 마지막 시상식 상금도 준비했다. 아직 대략적이라 변경될 요소가 많았지만 필요한 큰 틀을 완성시켰다.

현재 예산에서 플러스로 벌금비까지 관리할 생각이었다.

벌금비를 걷는다면 해당 기수에게 다시 어떤 형태로든 돌려줘야 했다.

벌금비로 뒷풀이 지원을 더 한다든지, 상금 지원을 더 한다든지 할 생각이었다.


벌금비를 걷는다 가정하면 동아리 규칙이 구체적으로 있어야 한다.

쓰리-아웃 제도를 채택해 회비 환불 없이 탈퇴된다.

결석과 과제 미제출 시 5천원 이하의 벌금으로 정했다.

이 때 까지만 해도 벌금비가 그리 많이 쌓일 줄은 몰랐다...


리크루팅, 함께 항해할 크루를 찾아보자

운영진 첫 미팅에서 리크루팅을 어떻게 할 것인지 이야기를 나눴다.

그러나 다들 일정이 바빠 시간을 많이 투자할 수 없는 상황이었다.

K형은 해외에 2주씩 두 번 가야하는 상황이었고 P형은 회사에 재직중이었고 바쁜 시즌이었다.

S는 기억은 잘 안나지만 아마 뭔가 하고 있었던 것 같다. ( 그래서 첫 미팅도 빠졌었다. )

K형이 잠깐 한국에 있는 기간에 다 같이 서류를 검토하는 것으로 일정을 잡았다.


당시 나도 전력거래소 대회 준비와 매쉬업 팀 세미나 준비, 매쉬업 프로젝트로 한창 매일 사람들과 회의하고 코딩하던 때였다.

그러나 시간을 유동적으로 조절할 수 있었고 틈틈이 시간 투자를 할 수 있을 것으로 생각했다.

멋쟁이 사자처럼 때도 지원서 양식을 내가 작성했었는데,

그만큼 지원서 양식을 설계하는 것을 좋아했고 면접 진행도 경험이 많았다.

적은 시간 안에 효율적으로 리크루팅을 진행할 수 있는 사람은 나밖에 없었다.

그래서 처음부터 끝까지 리크루팅은 내 주도 하에 진행을 했었다.


제일 급한건 홍보 포스터였다. K형이 곧 출국날이었기에 빠르게 포스터를 작업하고 홍보 준비까지 마칠 필요가 있었다.

그래서 포스터를 새로 만들기 보다는 1기 때 사용했던 포스터 양식을 사용하기로 결정했다.

1기 때 운영진으로 활동했던 D 누나에게 포스터 PPT 파일을 전달 받았다.

K형이 먼저 2기에 맞는 내용으로 수정하고 나는 폰트나 배치 요소등을 다듬었다.

그렇게 해서 모두가 OK 한 포스터가 탄생했다.


< CUAI 2기 포스터 >


나는 지원서로 지원자의 숨겨진 모든 역량과 잠재성을 알고 싶었다.

글로 한 사람의 모든 것을 표현하기는 힘들지만, 한 사람의 진정성을 이끌어낼 수 있도록

양식을 설계하는 것은 순전히 운영진의 역량이라 생각한다.

또, 다른 동아리나 기업 자기소개서 문항처럼 딱딱하게 지원서를 만들기는 싫었다.


문항을 다양하게 구성하고 자유롭게 써줄 것을 당부했다.

분량 제한도 없었고 문항도 간단하고 대화하는 듯한 느낌으로 구성했다.

멋쟁이 사자처럼 때도 지원자의 숨겨진 창의성을 알아내기 위해 문항을 구성하고 의도적으로 분량 제한을 없앴다.


< CUAI 2기 지원서 도입 >


< 분량 제한이 없는 지원 항목 >


지원서의 첫 페이지는 지원자의 인적 사항을 기입한다.

두 번째 페이지는 학교에서 어떤 과목을 수강했는지, 관련 경험을 어필할 수 있도록 구성했다.

인공지능과 데이터 분석에 연관된 수학, 통계학, 경제학, 공학, 컴퓨터 공학, 프로그래밍 과목들을 조사했다. 각 분야 아래에 따로 숙련도나 어필할 수 있는 경험을 기입할 수 있도록 구성했다.

세 번째 페이지는 자기 소개와 데이터 분석 경험, CUAI에서 얻어가고 싶은 점, 진로를 물어보는 항목으로 구성했다.


CUAI는 다양한 사람들이 모여 다양한 사회 문제를 데이터 분석으로 해결하는 모임이다.

지원자 한 명 한 명 마다 어떤 학술적인 배경에 있는지 파악할 필요가 있었다.

학과 이름만으로 그 사람의 지식 유무를 판단하는 것은 좋지 않다.

자신의 학과와 상관 없는 전공 과목들을 들을 수도 있고,

전공자 만큼은 아니지만 관련 경험이 있을 수도 있기 때문이다.

그래서 어떤 수업을 들었는지와 함께 숙련도나 경험을 쓸 수 있는 칸을 만들었다.

후에 검토할 때도 이 칸으로 더욱 정확하게 지원자의 역량을 확인할 수 있었다.


두 번째 페이지는 또한 아예 무관한 학과인 사람들에게 데이터 분석은 어떤 분야들이 합쳐져 있는지 알게 해준다.

그리고 자기에게 부족한 지식이 무엇인지, 앞으로 어떻게 보충해야 하는지 길을 알려줄 수도 있다고 생각했다.


< 수학 과목 항목 >


세 번째 페이지는 자기소개 항목이 들어간다.

여타 평범한 지원서처럼, 포괄적으로 지원 동기와 성공 경험들을 묻는 것은

지원자들에게 혼란을 줄 수 있고 검토하는 입장에서도 원하는 답을 얻지 못할 확률이 컸다.

더욱 구체적이고 지원자분의 모든 것을 쏟아내게 해주는 문항으로 구성했다.


무수한 사람들을 빠른 시간 안에 걸러야 하는 기업의 입장에서는 효율적일지 모르지만,

우리는 그것보다는 지원자 수가 확실히 적을 것으로 예상했다.

그렇기에 한 명, 한 명의 모든 역량과 잠재성을 확인할 필요가 있었다.


추상적으로 문항으로 검토자가 원하는, 자신만의 스토리를 펼쳐야 하는 방식이 아니라

간단한 대화체 문장으로 우리가 원하는 스토리를 제시했다.

구체적으로 파고드는 문항은 선택 문항으로 설정했다.

데이터 분석이라는 분야를 얼마나 생각해 봤는지, CUAI에서 뭘 얻고 싶은지, 본인의 진로는 무엇이고 CUAI와 어떻게 연결하는지, 의 순서로 문항을 구성했다.

배경 지식이 있는 사람은 본인의 데이터 분석 경험을 얼마든지 이야기할 수 있었고,

배경 지식이 없는 사람은 왜 빅데이터, 데이터 분석 분야를 고민하게 됐고 어떻게 우리 동아리까지 오게 됐는지, 꿈꾸는 진로는 무엇인지를 이야기할 수 있었다.


< 자기소개서 항목들 >


하나의 스토리를 제시하는 방식은 남들보다 동기가 부족한 사람들을 쉽게 파악할 수 있었다.

분량은 자유라 짧게 써도 상관은 없었지만, 그들 중 결정타가 부족하고 동기가 떨어지는 사람은 눈에 확 띄었다. 그리고 일련의 논리적 틀을 제시한거라 지원자분이 CUAI에 지원하는 과정에서 어떤 논리적 결함이 있는지 쉽게 알 수 있었다. 이는 면접 질문을 준비할 때 굉장히 편했었다.

개성 넘치는 이야기가 많아 재밌게 검토할 수 있었고 많이 배울 수 있었다.


이렇게 포스터 작업과 지원서 양식 작성을 마치고 7월 20일쯔음부터 본격적으로 홍보하기 시작했다. 8월 10일쯔음까지 서류 모집을 진행했다. 한 숨 돌릴 수 있었다. 지원서가 작성되었다는 메일 알림이 오면 바로 확인을 했었고, 틈틈이 서류 평가를 정리했다.


K형도 한국에 잠깐 돌아오고 다 같이 카페에 모여 서류를 검토했다. 모이기 전까지 구글 시트로 각자 빨강, 노랑, 초록으로 의견과 함께 정리했다. 빨강은 탈락, 노랑은 애매, 초록은 합격이라는 의미다.


모두 빨강이라면, 안타깝지만 넘겼다. 다만 한 명이 초록이 있다면 그렇게 생각한 이유를 물어봤다. 이전에 생각해보지 못한 관점이 있을 수도 있기 때문이다. 그럼에도 과반수를 넘기지 못한다면 탈락으로 기록했다.


노랑색은 다시 봐도 노랑색이다. 당장 논의해도 끝없이 논의할 것으로 예상해 합격권인 사람들을 먼저 정하기로 했다. 아직 면접도 진행하지 않았기에 대다수가 초록이라면 서류는 통과했다.


이후에 노랑색인 분들을 따로 논의했다. 글로 판단하기에 너무 애매한 요소가 많았다.

그래서 웬만하면 면접까지 가보기로 결정해 서류 합격을 드렸다.


서류 합격자 공지를 하고 면접 전까지 파이썬 머신러닝 기초 강의를 보고 와달라고 전달했다.

어떤 강의를 줄 지 다 같이 첫 미팅 때 고민을 했었다.

edwith 사이트가 먼저 언급이 되었지만 그 당시 파이썬 강의는 있었으나 데이터 분석, 머신러닝과 관련한 강의가 있다고 하기에는 애매했었다.

인프런 사이트에서 파이썬 머신러닝 기초를 다루는 강의를 찾았다.

그 강의를 필수를 듣고 오기로 하고, edwith 사이트의 파이썬 강의와 numpy, pandas 강의는 선택으로 기초가 부족한 사람들만 듣고 와달라고 전달했다.


K형은 다시 해외로 2주간 떠나고 대망의 면접날이 다가왔다.


인재개발원에서 빌린 작은 세미나실을 면접 장소로 잡았다.

조그만 방 한 가운데에 큰 탁자가 있었다.

불필요한 의자는 구석으로 정리하고 짐을 놔두는 공간으로 정했다.

큰 테이블을 기준으로 운영진과 지원자가 마주 봐서 거리가 가까웠다.

그래서 편안하고 부드러운 분위기로 면접을 진행할 수 있었던 것 같다.

면접 시간을 되도록이면 지원자분들과 합의해 오전으로 땡겨놨기도 하고, 30~40여명 정도를 이틀 면접 보는거라 그렇게 큰 부담은 없었다.


면접 진행은 공통 질문과 개별 질문으로 단계를 두었다.

공통 질문은 항목은 다음과 같았다.

  1. 지원 동기를 포함한 짧은 자기 소개
  2. 두 기수 내에 계획된 일정이 있는지 ( 아르바이트, 인턴, 다른 동아리 계획 )
  3. 머신러닝 강의 문제
  4. 학교 수업 외에 팀프로젝트를 해본 경험과 어떤 역할을 맡았는지 ( 꼭 데이터 분석 관련 경험이 아니어도 됨 )
  5. 혼자서 문제를 발견하고 해결해 본 경험이 있는지 ( 꼭 데이터 분석 관련 경험이 아니어도 됨 )
  6. CUAI 동아리 내에서 소모임을 만든다면 어떤 소모임을 만들고 싶은지
  7. CUAI 동아리에 어떻게 기여할 수 있는지 자신의 장점과 연결하기
  8. 팀끼리 일주일마다 스터디를 하고 발표까지 해야 하는데, 일 주일의 팀 프로세스를 어떻게 계획할지

3번 질문에서 머신러닝 문제를 각자 세 문제정도 냈다.
머신러닝 강의를 직접 듣고 문제로 낼 만한 것들을 추려 난이도별로 정리했었다.
KNN 기법은 어떤 알고리즘으로 동작하는지, Pandas 라이브러리의 info() 함수에서 어떤 요소들을 보여주는지와 같은 난이도 '하' 에 속하는 문제부터, Random forest 가 어떻게 동작하고 왜 좋은지와 같은 난이도 '중' 문제, Gradient descent 알고리즘에서 찾아야 할 파라미터가 두 개일때는 어떤 방법으로 최적의 파라미터를 찾는지와 같은 '상' 문제까지 있었다.

입문자는 하~중 난이도 질문을 했고 통계학 전공자는 바로 중 난이도 질문으로 넘어갔다.
통계학 전공자는 이미 수업에서 다뤄본 적이 있는 주제이기 때문이다.
기계 학습과 데이터 분석에 지식이 있으셨던 분들도 대체로 상 난이도까지 대답을 잘 해주셨다.

머신러닝 강의 자체는 대체로 5분 내외의 강의지만 꼼꼼하게 정리해서 듣지 않으면 답을 할 수 없도록 구상했다. 배경 지식이 없는 사람들에겐 3주 가량의 본인의 성실성으로 자기를 어필할 수 있는 기회가 됐다. 준비할 수 있는 기간이 길었던 만큼 '하' 난이도에서 하나도 대답을 못한 분들은 마이너스 요인으로 크게 작용했다. 배경 지식이 있는 사람들에게도 다시 한 번 개념을 정리해보는 시간이 되었다.


머신러닝 강의 질문은 다 대답할 수 있느냐, 없느냐의 관점은 아니었다.

본인이 생각했던 공부가 맞는지 스스로 확인해보는게 목적이었다.

난이도 '중' 이상 문제의 대답을 못해도 다른 역량이 돋보여 합격한 사람들도 꽤 있다.

CUAI 1기에서 입문자들의 초기 이탈률이 컸던 주된 이유가, 공부하는 내용이 자기가 생각하던 것과 다르기 때문이었다.


당시에 내가 운영진이 아니라서, 그분들이 생각했던 내용이 무엇이었는지는 파악을 못했지만 추측을 해봤다. 이탈했던 사람들은 주로 공학쪽 사람들이거나 수학과 거리가 먼 전공 사람들이었다. 데이터 분석과 기계 학습 영역은 수학과의 연관성이 크다, 는 특징으로 추측해 보건데,

순수하게 '코딩'의 영역으로 생각해 괴리감을 많이 느낀게 아닐까 싶었다.

CUAI 2기나 3기의 지원서들을 봐도 프로그래밍, 코딩의 연장선으로 바라보는 분들이 꽤 많았다.

이런 오해를 바로 잡기 위해 사전 과제 강의를 이론을 설명하는 강의를 선택했다.


4번에서 주목한 점은 학교 수업 '' 이다. 주어진 커리큘럼만을 따르는게 아니라 주도적으로 행동하는 사람인지 알고 싶었다.

학교 수업을 넘어 동아리 또는 공모전, 대외 활동, 스터디 활동으로 팀 프로젝트까지 이어 나가 봤는지, 어떤 역할을 맡았는지 궁금했다. CUAI 동아리가 바로 이런 활동이기 때문이다.

CUAI 활동이 기존의 학교 수업을 넘은 활동을 하고, 능동적으로 팀 프로젝트를 기획해야 하고, 팀 활동과 데이터 분석을 위해 주도적으로 행동할 필요가 있기에 관련 경험이 있는지 알고 싶었다.


다들 보통 4번 질문을 듣고 많이 당황하셨던 것 같다. 관련 경험이 없으신 분들의 비중이 많았다. 그냥 학교 수업 팀프로젝트를 이야기 하거나, 본인이 했던 봉사 활동을 이야기했다. 데이터 분석 경험이 아닐 때에는 어떤 역할을 맡았는지가 더욱 중요했다. 이야기를 듣고 모호하다면 한 두 개의 추가 질문으로 리더 역할을 맡았는지, 팔로워 역할을 맡았는지, 본인의 역할에 얼마나 충실했는지를 판단했다.


5번 질문의 목적은 혼자서 문제를 발견하고 이를 해결해 본 경험이 있는지 묻는 목적이었다. 데이터 분석 프로젝트의 시작은 의문이다. 의문으로 시작해 낱낱이 분석하여 합리적인 솔루션을 도출해야 한다. 의문이 없다면 앞으로 나아갈 방향을 찾기가 어렵다. 비판적으로 생각하고 분석력과 실행력까지 갖추고 있는지 묻는 질문이었다.


보통은 과제 또는 코딩 하다가 막혔을 때 구글링으로 찾은 경험을 이야기 했다. 아니면 팀플에서 발생했던 사소한 의사소통 문제를 이야기 했다. 내가 생각했던 것은 일상 생활에서 불편한 점을 찾고 스스로의 힘으로 해결해보고자 노력했던 경험이었다. 어쩌면 지원자분들의 CUAI 이미지가 '코딩하는 동아리' 라고 뇌리에 박힌걸 수도 있다. 그래도 기수마다 몇몇분들은 내가 원하는 답변을 그대로 해 주셨다. 그 분들에게는 면접이 끝나고 높은 점수를 줬던 것 같다. 또는 부정적이라면 다시 한 번 생각해 달라고까지 이야기 했던 것 같다. 그래서 웬만하면 합격했다.


6번 질문은 가벼운 질문 같지만, CUAI에서 얻고 싶은 점이 무엇인지 알아내는 질문이었다. 긴장을 풀기도 하는 질문이지만, 이 질문의 대답으로 최종 합불을 결정했던 경우도 몇 있었다. 어떤 분들은 파이썬 기초 스터디, 캐글 스터디, 시각화 스터디, 금융 스터디 등 원하는 학술 지식을 말했다. 어떤 분들은 맛집 탐방, 영화 소모임, 헬스 소모임 등 취미를 동반한 친목을 원했다. CUAI 동아리는 팀으로 활동하기도 하고 전체적인 친목을 위해 밸런스가 중요했다. 최대한 팀적으로, 동아리적으로 맞는 사람들을 뽑을 수 밖에 없다. 학술적인 성향과 친목적인 성향의 밸런스도 중요했고, 같은 관심사를 갖고 있는 사람끼리 팀을 맺는 것도 중요했다.


처음 생각했을 때는 단순히 소모임 활동에 열려있는지, 소모임 활동을 주체적으로 진행할 능력이 있는지 알아보려고 했다. 그런데 사람들의 대답이 '소모임 이름' 그 자체에 집중하다보니 어느 순간 함정이 있는 심리 테스트가 되어 버렸다. ㅋㅋㅋ


개별 질문은 운영진이 자유롭게 궁금한 점들을 차례대로 물어보는 형식이었다.

나는 지원서에서 충분히 알 수 있는 내용들은 굳이 질문하지 않았다.

보통 동기가 불명확한 지원 문항을 보충해달라고 하거나 구체적인 결론 또는 결과를 말해달라고 질문을 했던 것 같다. 훗날 CUAI에 함께하게 된 분들이 공통적으로 내 질문이 가장 기억에 남고 날카로웠다고 말했다.


면접은 한 번에 당일 불참자가 없는 한 3명이 봤다.

한 타임은 30분이었다. 공통 질문부터 개별 질문까지 꽤 시간이 촉박했다.

( 고생해준 운영진과 지원자분들께 박수..! )

몇 분 오바된 경우도 없지 않았다.

뒷 타임이 비었다면 더 대화를 해 한 시간까지 봤었다.

사실 동아리에 맞는 사람인가는 공통 질문으로도 충분히 파악이 가능했고

개별 질문은 그냥 문항 보충으로 더욱 어필을 부탁하거나 사실을 검증하는 것에 가까웠다.


면접이 끝난 당일 날 회의를 거쳐 24명의 합격자들을 확정했다.

그렇게 한달 보름간의 리크루팅 과정이 끝났다.

그 다음 날에 있을 2학기 개강과 이틀 뒤에 있을 CUAI OT를 설레하며 잠자리에 들었던 것 같다.


CUAI 2기 오리엔테이션

다음 포스팅으로 가기 : [회고] 빅데이터분석 동아리 CUAI 동아리 회고 - 하

댓글