8주간 Kaggle의 “Google QUEST Q&A labeling” 데이터 EDA를 현직 데이터 사이언티스트의 피드백을 받으며 진행 후 최종 발표
역할
질문의 제목이 길수록, 질문의 내용이 길수록, 내용에 ’?’가 많을수록 양질의 질문이라는 평가를 받았을 확률이 높다고 가정한 후 EDA 진행
기술 스택
Jupyter notebook, Kaggle dataset
👩🏻💻 Capstone Design 산학 협력 프로젝트 2019.03 ~ 2019.06
소프트웨어융합대학 소속 학생들의 SW 역량 모니터링 시스템(SAM) 개발. 단과대 측의 정보(학점, 수강과목, 입학년도 등)를 기반으로 하여 회원 정보를 구성하고 학생들에게 받은 추가 정보(자격증, 경력 사항, 주력 언어)를 추가하여 각 사용자(학생, 교수, 사업단)들에게 필요한 정보 및 기능을 개발
역할
팀장
DB 설계 및 구축, 데이터 전처리 후 export, 서버 구축, Backend-Front 통합 및 테스팅
세션을 통한 로그인 기능 개발, 유저별 랜딩 페이지 접속 구현
기술 스택
Springboot, MySQL, JPA, Git, Tomcat, Maven
Springboot를 주도하고 전반을 관리했던 첫 번째 프로젝트. 통합 테스팅 효율에 관해 고찰해볼 수 있었으며 여러가지 기술을 필요에 따라 공부하며 접목했음.
👩🏻💻 신용카드 부정 사용 감지 ML 프로젝트 Credit card fraud detection 2019.03 ~ 2019.06
신용카드 부정 사용 감지 데이터 셋을 활용하여 익명의 속성들 중 가장 연관이 높은 속성들로 모델 생성
역할
데이터가 미국 결제시스템에 기반하여 미국 결제 시스템에 대한 사전 조사 진행
데이터 전처리(이미 정규화되어있는 속성을 제외한 Time과 Amount에 대한 스케일링, PCA, T-SEN 등)
모델/이론(Random Forest, KNN, SVM) 적용하여 학습 후 적절하다고 판단한 K-fold Cross validation을 통해 가장 정확성이 높은 모델 도출
기술 스택
Jupyter notebook
👩🏻💻 2018 DA 설계공모대전 2018.04 ~ 2018.09
과학기술정보통신부가 주최한 DA 설계공모대전에 학생부 개인으로 참가하여 데이터베이스 강의에서 배운 것을 토대로 적용해보고 학습하고자 함
역할
“정보시스템의 데이터를 새로 개발되거나 도입한 정보시스템으로 옮기는(이행하는) 사업”을 하는 회사의 DB 설계
주어진 문제를 분석하여 요구사항분석서, 데이터표준정의서를 작성하고, 최적의 논리 데이터 모델 작성
기술 스택
DA#, StarUML
수상작의 결과와 내 결과를 비교/분석하여 보완할 점 또는 잘한 점을 찾아내며 대회가 끝난 이후에도 학습
👩🏻💻 한이음 프로젝트 2017.04 ~ 2017.11
과학기술정보통신부가 주관하는 한이음 멘토링에 참가하여 현업에 종사하시는 멘토님과 함께 8개월 간의 프로젝트 진행. 반복된 일상을 돕는 스마트 개인 비서 어플리케이션 “Hi Master” 개발
역할
요구 사항 정의 및 기능 설계
DB 설계 및 구축
서버 구축 및 프론트엔드와의 통합,테스팅
기술 스택
Springboot, MySQL, Maven, Tomcat, Android Studio
첫 교외 프로젝트이자 첫 장기 프로젝트. Springboot 개발환경을 처음으로 사용하며 학교 강의에서 들었던 이론들을 연결지으며 적용할 수 있는 기회였음
이후 완성품으로 한이음 공모전에 입선하여 일산 킨텍스에서 개최된 2017 한이음 엑스포에서 부스를 열어 관람객에게 Hi Master를 소개할 수 있었음