본문 바로가기

활동/SK네트웍스 Family AI 캠프 2기

SK네트웍스 Family AI 캠프 2기 : 4th week (6월 1주차)

벌써 4주차가 되었네요! 생각보다 시간이 정말 빨리 흐르는 것 같습니다...!!

이번 주간에는 단위 프로젝트도 하고, 시험도 봐서 더 정신 없이 활동했던 기억이 나네요.

 

냉방병 때문에 끙끙 앓았음에도 불구하고, 이번 주간 할 일을 다 끝낸 제 자신이 정말 기특해요!!

(이런 건 셀프 둥가둥가 해줘야 함...^^)

 

다음 주에는 저도 다른 분처럼 털 후드집업을 가져가야겠어요ㅋㅋㅋㅋㅋㅋㅋ

그게 생존템이었다는 걸 이제서야 알았읍니다.... 

수많은 사람들이 모인 곳에서 적정 냉방 온도를 찾는다는 건 너무 어려운 일인 것 같아요.

그래도 더운 것보다는 훨씬 나아서 행복합니다!!

 

 

● 성취

이번 주의 가장 큰 성취...!

새로운 환경 속에서 팀플을 경험해 볼 수 있었습니다!

 

그동안 교내 및 회사에서 전공생 위주로 팀플을 경험했기에, 비전공자들과 함께 이틀이라는 시간 내에 기획/개발/문서화/발표를 모두 해내야 한다는 것에 대해 살짝 압박감이 느껴졌어요.

 

이건 아무리 실력 있는 개발자라도 불안할 수밖에 없는 게... 사실 이틀이라는 시간은 개발에만 전념하기에도 벅차거든요.

개발 부문만 해도 언제 어디서 이슈가 터질지 모르는데 말이죠...

 

[ 포지션 분배 ]

짧은 시일 내에 기획과 발표까지 해야 한다는 소리를 듣고 전략을 잘 짜야겠다는 생각이 우선적으로 들었습니다.

시작하기에 앞서 우선 인적 자원부터 파악하는 게 필요하다는 생각했어요.

제가 속했던 팀은 2명의 전공자(진유, 문영), 3명의 비전공자(재원 오빠, 동건 오빠, 재민)로 인적 자원으로 구성되었습니다.

 

프로젝트를 끌고 가기 위해서는 전공자의 시각이 반드시 필요하다고 판단하여, 2명의 전공자가 PL(진유)과 PM(접니다...^^)을 각각 담당하게 되었습니다.

 

[ 기획 ]

이번 프로젝트의 주제는 '데이터 수집 및 DB 저장 기술을 바탕으로 삼은 자동차 업계 인사이트 도출'이었습니다.

따라서 해당 프로젝트를 수월하게 진행하기 위해서는 자동차 업계 도메인 지식이 반드시 필요한 상황이었습니다.

 

주제를 정할 때는 팀 내에서 도메인 지식이 가장 풍부했던 재원 오빠와 재민이가 큰 도움이 되었습니다.

확정 주제가 나온 이후로 모든 팀원들이 모여서 사용 데이터를 함께 정했어요.

크롤링/스크레이핑/DB라는 세부 기술 주제를 잘 살릴 수 있도록, 다양한 포맷의 데이터를 선택했습니다.

저희 팀은 csv 공공데이터와 크롤링이 가능한 몇몇 웹 페이지 등을 선정했습니다.

 

[ 개발 ]

이틀이라는 짧은 시간만 주어졌기에 개발 파트는 코드 경험이 풍부한 진유와 제가 주로 담당했습니다. 

제가 데이터 크롤링/스크레이핑을 하는 동안, 진유가 후반부(DB 설계 및 streamlit 시각화) 코드 베이스를 만들었습니다.

 

저희 팀이 선택한 웹 페이지의 경우, 원하는 태그 내부에 난수적 특성이 반영되었어서 트러블 슈팅에 시간을 꽤 쏟았어요. 

불규칙한 숫자 태그를 모두 잡아내기 위해 Brute-Force 방식을 사용했습니다.

다행스럽게도 각각의 난수들 사이 거리가 먼 편이 아니라서, Brute-Force 방식을 사용했음에도 불구하고 코드 동작 시간이 오래 걸리지는 않았습니다.

 

위와 같은 과정을 거쳐서 얻은 데이터는 DataFrame 형태로 만들어서 진유에게 전달했습니다.

 

[ 문서화 ]

저희 팀은 노션을 베이스로 문서를 작성했습니다.

노션 경험이 있던 재민이를 필두로 기초 문서를 만들면서 프로젝트를 진행했습니다.

기초 문서를 만들면서 진행했던 덕분에, 후반부에 문서를 빠르게 정리할 때 큰 도움이 되었습니다.

 

깃허브 Readme 파일의 경우, 동건 오빠의 도움이 가장 컸습니다.

살면서 처음 본다고 말했던 마크다운 문법을 성실하게 습득하는 동건 오빠의 모습을 보고 저도 많이 배울 수 있었어요.

결과물도 엄청 잘 나와서 다른 팀원들도 놀랐던...! (와중에 프론트 권유 받으셨던 거 웃겼고,,,,)

 

저는 개발 작업을 어느 정도 다 끝낸 후에 문서 고도화 작업에 임했습니다.

재민이가 만들었던 노션 페이지를 베이스로 프로젝트 제출 문서들을 작성했습니다.

사실 이때... 코드 리팩토링에 더 시간을 쏟을지, 문서 고도화를 할지 고민을 많이 했는데 결과적으로 문서 고도화에 투자하길 잘한 것 같다는 생각이 듭니다 ^_^

 

[ 발표 ]

발표는 PL 진유가 담당했습니다.

준비 기간이 짧았음에도 불구하고, 프로젝트 흐름을 차근차근 설명하는 모습이 인상적이었어요.

저렇게 되기까지 얼마나 많은 연습 시간이 있었을지 가늠이 안 가더라구요.

(나도 발표 연습해야지,,,,)

 

[ 프로젝트 후기 ]

모든 팀원들이 성실하게 프로젝트에 임한 덕분에 좋은 성과를 거둘 수 있었습니다!

특히 모든 팀원들이 참여했던 문서화 부분의 경우, 만점을 받아서 엄청나게 뿌듯했던 기억이 나네요ㅎㅎ

 

급박하게 코드를 작성하느라 OOP를 잘 살리지 못했다는 점이 스스로 아쉽게 느껴졌지만, 이거 역시 제 실력이 맞으니까 받아들일게요!

 

다음부터는 OOP를 직관적으로 적용할 수 있도록 실력을 더 올리겠습니다!!

직관적으로 설계를 최적화시킬 수 있는 능력을 좀 더 키워봐야겠어요.

일단 좋은 코드들부터 더 많이 읽어 볼게요...ㅎㅎ

 

아무튼 우리 팀(1차 단위 프로젝트-2팀) 모두 수고했어요~~

다들 정말 열심히 했다!!

 

 

● 학습 (제 인상에 깊었던 내용을 주로 정리했습니다.)

# 머신러닝

Task가 주어졌을 때, 데이터로 Experience를 쌓음으로써 Performance를 높일 수 있는 경우를 '머신러닝'이라고 표현합니다.

 

# 자주 쓰이는 척도의 종류

명목형, 순서형, 등가형, 비율형 이렇게 4가지가 자주 쓰입니다. '명서등비'라고 외우면 좋아요!

 

# 'Numpy 라이브러리'와 'Pandas 라이브러리'

Numpy 라이브러리는 빠른 연산을 지원하고, Pandas 라이브러리는 EDA(Exploratory Data Analysis) 지원에 특화되어 있습니다.

 

 

● 개선 (제가 취약했던 개념을 주로 정리했습니다.)

이번에 시험을 쳤을 때, 제가 가장 약했던 부분은 '컴퓨터 네트워크' 지식이었습니다.

이 부분을 보충하고자 개인적으로 독학을 진행했어요.

독학 시 참고한 책 이름은 '모두의 네트워크 (미즈구치 카츠야 저)'입니다.

 

# IP

IP는 Internet Protocol의 약자로, 다른 네트워크에 있는 목적지까지 패킷을 보내기 위해 반드시 필요한 요소입니다. 네트워크 계층에서 IP를 주요하게 다뤄요.

 

# MAC

MAC은 Medium Access Control address를 의미해요. 랜 내부에서 컴퓨터 네트워크 각각의 기기를 구분하기 위해 사용하는 주소랍니다. IP와 다르게 물리적인 주소를 의미하고, 데이터 링크 계층에서 주요하게 다뤄요.

 

 

이번 주간은 단위 프로젝트가 메인이었어서 거의 대부분을 프로젝트 내용으로 채웠네요!

다음 주도 힘내서 공부해 보겠습니다! 아자잣~~!!!

 

+) 부족한 부분이 있으면 댓글로 말씀해 주세요! 겸허한 마음으로 더 공부하겠습니다.