티스토리 뷰
오늘은 visualising korea 대표이신 백수경 님 영상을 보고 내용을 정리하면서 내 생각을 덧붙여봤다.
visualising korea는 '한국의 사회/경제/문화현상을 데이터로 분석 및 시각화하는 프로젝트'라고 하는데, 나는 아래 '코로나19와의 전쟁에서 생명 구하기: 사망에 대한 인사이트 도출'을 통해 visualising korea를 처음 알게 되었다. 데이터에 기반해 논리를 전개하는 방식과 그 구성이 아주 멋진 글이니 시각화와 인사이트 도출에 큰 관심이 없다 해도 한번쯤 읽어보시면 좋겠다.
https://dacon.io/competitions/official/235590/codeshare/949
이하는 모두 수경 님의 유튜브 채널을 보고 정리한 내용이었는데, 최근에 동영상이 비공개 처리되었더라. (정리하길 잘한 걸까? ㅠㅠ)
혹시 나중에 공개로 돌려주실 수도 있으니 원출처인 동영상의 링크는 그대로 남겨두고, 정리한 내용은 그대로 써두기로 했다.
데이터 사이언티스트/데이터 분석가 커리어를 위해서 무엇부터 준비해야 할까?
① 데이터 사이언스 업무 이해하기
데이터 수집: SQL, data crawling
데이터 분석: descriptive analysis, modeling analysis (추가로 algorithm building)
분석결과 활용: data visualisation
→ 이 skillset을 갖추는 방향으로 준비 (단, 회사의 규모나 프로젝트에 따라 달라질 수 있음)
※ 이 각각의 스킬셋이 구체적으로 무엇인지는 아래의 다른 동영상에서 설명해주신다.
② 희망 커리어의 채용공고 찾아보기
타이틀이 반드시 분석가/과학자가 아니더라도, 적어도 10개 내외의 채용공고를 찾아볼 것
→ 여러 채용 공고에 공통적으로 나타나는 스킬을 확인하기
→ 일반적인 스킬 + 해당 직무에서 필요한 스킬
→ 내가 갖고 있는 스킬과 비어 있는 스킬을 나누어 파악하기
데이터 분석이 반드시 통계분석만을 기반으로 한다고 말할 수는 없지만, 양적 분석을 반드시 필요로 하는 것은 사실
따라서 데이터 분석에 대해 전혀 모르는 입문자라면 통계학을 꼭 공부해둘 것
: 나는 작년(2021) 연초에 ADsP와 빅데이터 분석기사 필기를 꽤 수월하게 땄는데, 이런 자격증이 취업에 반드시 필요한 건 아니지만 이 두 시험에서 출제되는 통계학 지식 정도는 있어야 데이터를 분석하는 데 큰 어려움이 없을 거라고 판단해 응시했고 지금도 같은 생각이다. 참고로 문과라도 고등학교 시절에 배운 확률과 통계 내용을 기억한다면 크게 어려울 것이 없는 수준이니 너무 겁먹지 않아도 된다.
데이터 사이언티스트/데이터 분석가에게 필요한 필수 기술은?
① 데이터 수집 기술: SQL, 데이터 크롤링(bs 등)
데이터 크롤링은 기업에서 필요한 데이터가 웹상에 있을 때 그것을 끌어오려면 유용할 수 있지만, 일반적으로 많이 쓰이는 기술은 아니라고 하심. 반면 SQL은 기업 내부의 데이터를 불러오고 정리하는 데 쓰이기 때문에, 둘 중 하나를 우선적으로 학습한다면 SQL을 권한다고.
: 내 생각도 비슷하다. 특히 신입 데이터 분석가가 더 자주 하게 되는 일은 크롤링보다는 내부 데이터 추출이라는 이야기를 들어본 적이 있어서, SQL을 배워두려고 한다. (기초는 이미 했고 작년에 시험을 한 번 봤지만 너무 급하게 공부했는지 떨어졌다ㅠㅠ) 처음 계획은 그냥 SQLD를 한번 따 볼까~ 하는 생각에서 시작했지만 갈수록 SQL의 필요성을 느끼고 있어서, 올해 안에 SQLP 수준까지 준비할 것이다.
② 데이터 분석: descriptive analysis, modeling, algorithm…
크게는 기존의 통계학에 기반한 분석과 딥러닝/머신러닝에 기반한 분석으로 나누어짐
먼저 descriptive analysis를 해 본 다음에 algorithm이나 modeling에 도전해도 좋음
③ 분석 결과 활용 기술: 데이터 시각화, 분석결과의 상용화
- Data Visualisation: plotting in R/Python, dashboard making in BI tools(Tableau, PowerBI)
visualisation에 특화된 구인이 늘어나고 있음
- 분석결과의 상용화: 회사나 프로젝트의 상황에 따라 다를 수 있으나, DA가 이 분야를 전적으로 담당하게 되지는 않음. 따라서 시각화 쪽에 좀더 초점을 두고 준비하는 것이 유리
2022.03.10 작성
2022.06.09. 수정
'공부 > Data Science' 카테고리의 다른 글
<데싸노트의 실전에서 통하는 머신러닝> 북 스포일러 (0) | 2022.08.23 |
---|---|
TIL: What is 'data annotation'? (0) | 2022.06.28 |
구글 코랩에서 셀레니움을 사용하려는데 잘 되지 않아요 (0) | 2022.06.06 |
DBeaver로 PostgreSQL 연결하고 .csv 데이터 업로드하기(feat.ElephantSQL, python) (0) | 2022.06.03 |
Object Detection: YOLO(1) (0) | 2022.02.10 |
- Total
- Today
- Yesterday
- Notion2Tistory
- 개발자포트폴리오
- 이력서
- 깃허브
- 데이터과학
- todayIlearned
- 데이터분석
- 인공지능
- 자격증
- 취업준비
- github
- 데이터준전문가
- ADsP합격후기
- 빅데이터분석기사
- 코테공부
- ai부트캠프
- 자버
- 빅데이터
- googlecolab
- data annotation
- Til
- 코드스테이츠
- 커리어코칭
- 빅분기합격
- 이자포스터디
- 데이터준전문가합격후기
- Kaggle
- ADsP
- 빅분기후기
- 빅분기
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |