3rd Sprint 스프린트가 벌써 세 번째라니 믿을 수가 없다…. 정사영을 아직도 좀 이해하지 못해서 걱정했는데 수학 문제는 아주아주 쉽게 나왔다. 하긴 생각해보면 이거 수학 시험 아니죠. 그렇지만 k-means는 제대로 했는지 전혀 모르겠다. 마지막까지 코드를 직접 짰어야 하는지 한참 고민하다가 냈다. 본격적어도 DS를 시작한 것도 아니고 이제 겨우 찍어먹어 본 수준인데 따라갈 수 있을지에 대한 걱정이 크다. Sprint Review 세 번째 스프린트에 대한 리뷰를 다음과 같이 작성했다. 사실 건강 저하로 인해 학습에 어려움을 겪음 코비드19 백신 접종 후에 며칠간 부작용을 겪었다(09/27~09/30). 헬프데스크 등에 사정을 설명하고 양해를 구할 수 있었는데도 스스로의 능력을 과신해서 그렇게 하지..
13:00~16:00 ① sprint 2 모범답안과 내 답안을 비교하는 시간을 가졌다. - 문제를 잘 풀어놓고서는 답이 정확하게 표시되지 않는 방식으로 출력한 채 그대로 제출한 문항을 발견했다. - 정답이 틀린 것보다 풀이 과정이 지저분하거나 리소스를 지나치게 많이 쓰는 방식으로 코드를 짠 경우가 압도적으로 많았다. - pull request 했다고 생각했는데 아예 제출되지 않은 과제를 발견하고 뒤늦게 제출했다. (N123) ② sprint challenge 번외에 도전 - 과제로 받은 데이터를 살펴보다가 marital status라는 feature에 관심이 생겨서 카테고라이징을 진행해 보았다. 이 feature에는 일반적으로 생각하는 single/married 외의 카테고리가 있는 것을 확인할 수 있었..
2nd Sprint 대망의 두 번째 스프린트. 오늘의 스프린트는 고객 데이터를 전처리하고 t-test, chi-square 등을 적용해 보는 내용이었다. 문제를 보자마자 처음 느낀 당혹감은 지난주보다 덜했는데, 결국 이번에도 풀지 못한 문제가 있었다. 분명히 배운 통계학 개념인데 정확히 이해하지 않고 얼렁뚱땅 넘긴 게 여기서 들통난 듯 ^^; Sprint Review 두 번째 스프린트에 대한 리뷰를 다음과 같이 작성했다. 사실 1. 복습 부족으로 인한 어려움 지난 첫 스프린트 리뷰에서 이미 '작성해 본 코드인데도 잘 기억이 나지 않아서 다시 참조하며 문제를 푸느라 시간이 많이 걸렸다'고 썼는데 이 부분이 크게 개선되지 않았다. 지난번과는 달리, 여러 번 써 보았고 작동 원리도 아는데도 갑자기 생각나지 않..
여론조사 통계의 오류 https://www.joongang.co.kr/article/4492665#home 여론조사 통계의 오류 유대인 출신으로 영국에서 두 번이나 총리를 지냈던 벤저민 디즈레일리가 세상에는 세 종류의 거짓말이 있다고 말했다. 거짓말, 새빨간 거짓말, 통계다. 통계가 새빨간 거짓말보다 더 거짓인 이 www.joongang.co.kr 우리는 사람들이 의견을 ‘가지고 있다’고 말할 게 아니라 의견이 ‘형성되어 가는 과정에 있다’고 보고, 의견 형성 경로와 흐름을 파악하는 데 주목해야 한다. 의견을 측정할 수 있다고 보는 것은 어쩌면 사람들이 의견을 형성해 가는 과정을 근본적으로 왜곡할 수 있다.
정규분포와 보편성과 랜덤 행렬 https://horizon.kias.re.kr/18220/ 정규분포와 보편성과 랜덤 행렬 충분히 큰 계system의 성질은 구성요소의 구체적인 성질과 무관하다. 이를 보편성universality이라 한다. 어떤 확률변수를 사용해야 할까? 작은 입자의 움직임, 무선통신에서 나타나는 잡음, 주식 horizon.kias.re.kr 중심극한정리를 통해 서로 독립이며 동일한 분포를 가진 확률변수의 합의 성질을 이해할 수 있지만, 수학적 모형이 복잡해지면 단순히 확률변수의 합을 사용하는 것이 아니라 더 복잡한 함수를 고려해야 한다. 복잡도가 더 큰 수학적 모형의 대표적인 예가 랜덤 행렬이다. (…) 물리학 용어를 빌리자면, 랜덤 행렬은 강한 상관관계가 있는 계strongly corr..
☑️ Section 1 데이터 전처리 & EDA - 데이터 탐색, 데이터 다루기, 시각화 (210909~210915) 통계 (Statistics) - T-Test, 신뢰구간, CLT, ANOVA, 베이즈이론 (210917~210924) 선형대수 - Vector, Matrix, 차원축소(PCA, SVD), Clustering (210928~211001) ☑️ Section 2 머신러닝 회귀모델 (Linear, Multiple, Logistic Regression) (211018~211022) 머신러닝 분류모델 및 Kaggle (211025~211029) Applied Predictive Modeling (211101~211105) Section 3 개발환경과 데이터베이스 (git, docker, SQL) ..
1st Sprint 오늘은 드디어 첫 번째 스프린트가 있었다. 스프린트는 해당 주차에 배운 내용을 토대로 3시간 동안 문제를 푸는 것으로, 이제까지와는 달리 문제를 미리 볼 수 없었다(후배 기수를 위해 문제 스포일러는 금지되어 있기 때문에 이따 복습하면서 포스팅을 수정하게 되어도 상세한 코드를 올리지는 않을 것 같고, 토이 데이터로 다루는 다른 문제로 대체해서 개념을 복습하는 정도일 것 같다). 객관적으로는 쉬웠을 문제가 나에겐 난해하게 느껴져서 시간이 촉박했는데 집체학습이 아니다 보니 집중력이 떨어져서 결국 풀지 못한 문제도 있었다. Sprint Review 첫 번째 스프린트에 대한 리뷰를 다음과 같이 작성했다. 사실 1. 개념 이해 부족으로 인한 어려움 코드의 구조나 코드에서 요구하는 데이터 타입 등..
※개인적인 생각이나 감상은 ://작은 글씨로 처리했다. 오리엔테이션 일정 - 스프린트 챌린지: 매주 금요일, 3시간 동안 시험. - 섹션 챌린지: 매달 기말고사(헐) = 총 5회 - 프로젝트 1: 2주 / 2: 4주 - 마지막 주에는 job searching. // 앞으로의 일정을 설명하시던 코치님이 중세의 수도승을 언급하셨는데, 나는 이것을 '즉 다른 개인 일정보다 부트캠프를 우선으로 해 달라'는 말씀으로 이해했다. 이것은 사실 누구보다 배우는 사람 자신을 위한 제안으로, 부트캠프의 목표가 '커리어 전환'인 만큼 그 정도 각오가 없으면 목표를 달성하기 어렵기 때문이다. 물론 오늘은 첫날이니까 나는 수업 참여도 과제도 복습도 나름대로 열심히 했지만, 계속 최선을 다할 수 있으려면 학습 환경과 생활 루틴도..
- Total
- Today
- Yesterday
- Kaggle
- data annotation
- ADsP합격후기
- 이력서
- 빅데이터
- 인공지능
- 빅분기
- 코드스테이츠
- 취업준비
- ai부트캠프
- 코테공부
- 개발자포트폴리오
- 데이터준전문가
- github
- 자버
- 빅분기후기
- Notion2Tistory
- 데이터과학
- 빅데이터분석기사
- Til
- 이자포스터디
- 데이터분석
- 데이터준전문가합격후기
- 자격증
- ADsP
- todayIlearned
- 커리어코칭
- 깃허브
- 빅분기합격
- googlecolab
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |