데이터 어노테이션(data annotation)이란 데이터를 라벨링하고 분류하는 것으로, 쉽게 말해 데이터에 그 데이터를 설명하기 위한 또다른 데이터, 즉 메타 데이터를 달아주는 것이다. (즉 흔히 데이터 라벨링 작업을 한다고 말할 때의 '라벨링'도 데이터 어노테이션의 일종이다.) annotate는 '주석을 달다'는 뜻이므로, 논문이나 에세이를 쓸 때 각주나 미주를 넣어 본문에 쓴 문장의 출처나 부연 설명 등을 달아본 경험이 있다면 data annotation이 무엇을 위한 어떤 행위인지 바로 연상할 수 있을 것이다. 데이터 어노테이션의 예시 물체를 보고 자동으로 분리수거를 해주는 모델을 만들 때, 데이터 객체에 bounding box 처리를 해주는 것 환자의 종양이 양성인지 악성인지를 판별하는 모델을 ..
친구 따라 강남 간다는 말도 있는데, 이번에 친구 따라 인턴십에 참여하게 되어서 그 과정을 기록해둔다. 내가 지원한 인턴십은 BRIGHT NETWORK에서 주관하는 Internship Experience UK로, 이름에서 알 수 있듯이 영국 소재 기업이 주관하는 행사이다. 대상은 Students and graduates at any level. 꼭 영국에 소재한 대학 출신이 아니어도 참여할 수 있다고 해서 나도 지원하게 되었다. 보다시피 여러 항목이 있는데 나는 당연히 Technology 분야로 지원했다. 지원할 때 준비해야 하는 것은 영문 이력서와 간단한 지원 동기(75단어 내외). 아주 간단한 영작(인턴십 지원동기)을 해보고, 영어로 이력서를 써 본 이 경험 자체가 유익하고 재미있었다. 그리고 지원 ..
오늘은 visualising korea 대표이신 백수경 님 영상을 보고 내용을 정리하면서 내 생각을 덧붙여봤다. visualising korea는 '한국의 사회/경제/문화현상을 데이터로 분석 및 시각화하는 프로젝트'라고 하는데, 나는 아래 '코로나19와의 전쟁에서 생명 구하기: 사망에 대한 인사이트 도출'을 통해 visualising korea를 처음 알게 되었다. 데이터에 기반해 논리를 전개하는 방식과 그 구성이 아주 멋진 글이니 시각화와 인사이트 도출에 큰 관심이 없다 해도 한번쯤 읽어보시면 좋겠다. https://dacon.io/competitions/official/235590/codeshare/949 코로나19와의 전쟁에서 생명 구하기 - '사망'에 대한 insights 도출 코로나 데이터 시각..
6월 7일 화요일 이·자·포 스터디 1회차가 진행되었다. 오리엔테이션 때와 달리 조를 나누어서, 약 10명 내외의 소규모 인원이 모였다. (아이스브레이킹이 덜 되어서인지 적극적으로 피드백을 주고받는 분위기는 아니었지만, 앞으로는 그렇게 되지 않을까 생각한다.) 어쨌든 과제를 진행하면서 느낀 점을 정리해서, 각자 돌아가면서 다음 세 가지에 대해 이야기했다. (각 문항에 대한 나의 생각은 접은글로 정리해두었다.) 나에 대해 새롭게 발견한 점 나의 역량 중 가장 뛰어난 점과 앞으로 보완이 필요하다고 생각되는 역량 셀프 역량코딩을 취업에 활용할 방안 더보기 긍정적인 점 이전 직업을 할 때 사람들을 대하며 피로감을 많이 느꼈고, 소극적인 성격이라고 생각했다. 다음 직업은 절대로 서비스업을 하지 않아야겠다고 마음먹..
토이 프로젝트를 위해서 구글맵으로 크롤링을 하려는데 크게 세 가지 문제가 발생했다. 셀레니움을 사용하는 예제를 참고해봤지만 대부분 예전 글이라 수정할 수 없었다. 1. 코랩이 크롬 드라이버의 경로를 인식하지 못함. 드라이버 실행파일을 로컬에도 놔둬 보고 코랩에도 올려보았으나 해결되지 않음. 2. 창이 안 뜸. 셀레니움 다운그레이드로 1을 해결해도 3. css 식별자 탐색 메소드가 만료되었다는 메시지가 뜸. DeprecationWarning: find_element_by_* commands are deprecated. Please use find_element() instead 문제상황 크롬 드라이버의 설치 경로를 찾지 못함, 크롬 창이 열리지 않음, .find_element_by_css_selector ..
오늘은 .csv 형식으로 추출해둔 데이터를 PostgreSQL DB에 올려보는 과정을 써보고자 한다. DBeaver 설치나 ElephantSQL 가입 등등은 어려울 게 없는데, 과정을 따라가다 보니 무슨 칸에 뭘 입력해야 되는지 은근히 헷갈려서 내가 잊어버리지 않기를 바라며 작성하는 포스팅이다. 모든 과정은 무료 가입자 기준. 준비물: elephantSQL 계정, DBeaver, 파이썬 구동 환경(구글코랩 등) 먼저 ElephantSQL 홈페이지로 접속해서 프리 PostgreSQL DB를 하나 받고, Details 메뉴를 눌러보면 내가 방금 받은 DB에 대한 데이터를 볼 수 있다. 위 스크린샷을 참고해 Server에 있는 긴 주소를 DBeaver의 Host에, User and default datab..
5월 30일 월요일 19시 30분에 이.자.포. 스터디 오리엔테이션이 있었다. 집중해서 듣기 위해 스카로 호다닥 :3 결론부터 말하자면, OT부터 이전 글(https://applecider1002.tistory.com/121) 에서 했던 고민의 답을 조금 찾은 것 같다. 내가 무엇을 했는지부터 먼저 생각하자! 내가 그동안 자기소개서를 못 쓰고 있었던 이유는 '왜?'를 찾는 데 지나치게 많은 에너지를 썼기 때문이었다. 언뜻 보기에 앞에서 썼던 글의 주제랑은 충돌하는 말 같지만 그렇지만도 않다. 하고 많은 분야 중에 하필 데이터 분야를 선택한 이유를 설득력 있게 제시하는 건 중요하지만, 내 행동으로 인한 결과를 제시하고 그것을 통해 이유를 끌어내야만 거기에 설득력이 생기기 때문이다. 이렇게 실마리를 잡기까지..
5월 20일 금요일 이여진 코치님께 1:1 이력서 코칭을 받았다. 이력서 코칭은 미리 이력서를 보내고 미팅 시간을 잡은 다음 약 20~30분간 내 이력서에 대한 피드백을 들을 수 있는 유익한 기회로, 코드스테이츠 측에서 부트캠프 수료생에게 제공한다. 코칭 시각 직전까지 솔직히 꽤 쫄렸다. 왜냐면 이자포 어느 것 하나 준비가 덜 된 상태여서, 그리고 나이나 업무경험 등 바꿀 수 없는 조건이 신경 쓰여서 스트레스를 많이 받았기 때문이다. 그런데 막상 코칭을 받아 보니 코치님께선 내가 잘 써놓고도 몰랐던 부분을 짚어 주시고 부족한 점도 구체적인 보완 방향성과 함께 제시해 주셔서, 피드백을 잘 반영하면 좋은 이-자-포를 만들 수 있을 것 같다는 확신을 얻었다! 좋은 평가를 받은 것을 하나만 예로 들자면…. 이력..
- Total
- Today
- Yesterday
- data annotation
- 데이터준전문가
- Kaggle
- 코드스테이츠
- 빅데이터분석기사
- 이력서
- 자버
- 빅분기
- 코테공부
- github
- 데이터분석
- 빅분기합격
- googlecolab
- 자격증
- 빅분기후기
- 인공지능
- 개발자포트폴리오
- 데이터준전문가합격후기
- Notion2Tistory
- 이자포스터디
- Til
- ADsP합격후기
- 빅데이터
- 데이터과학
- ai부트캠프
- todayIlearned
- 깃허브
- ADsP
- 취업준비
- 커리어코칭
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |