'공부/Data Science' 카테고리의 글 목록

제목대로 yolov5를 처음! 써보았다. DS를 공부하는 사람으로서는 매우 뒤늦었지만… 늦게라도 기록해두고 싶어서 정리해 본다. 우선 전체 코드는 여기에 공유. 처음 해보는 분들께 참고가 되길 바란다. 이번에는 내가 직접 데이터세트를 만들지는 않았고, Roboflow에서 제공하는 프리 데이터 세트를 그대로 활용했다. 특히 Roboflow는 yolov5가 요구하는 형태로 데이터세트를 제공하기 때문에, 별도로 yaml 파일을 세팅하는 번거로움에서 벗어날 수 있다는 장점이 있다(다른 분들의 기록을 보니 이게 정말정말 귀찮은 과정이더라…). Roboflow에서 내가 다운로드한 데이터는 Dice Dataset으로, 따로 train, test, valid 세트가 나뉘어져 있지 않아서 수동으로 나누어야 했다. 그리고..

공부/Data Science 2023. 5. 18. 12:21

부스트코스 코칭스터디 ’인공지능 기초 다지기(AI Basic) 2023’ 지원

공부/Data Science 2022. 12. 14. 16:11

<데싸노트의 실전에서 통하는 머신러닝> 북 스포일러

※ 골든래빗 출판사로부터 책을 제공받아 작성했습니다. 책 사러가기 링크(알라딘) ※들어가기에 앞서, 이 서평에는 나 개인의 경험과 그에 기반한 주관적인 견해가 많이 들어가 있다는 점을 미리 알린다. 학원 출신 AI개발자를 도와주는 책 최근 몇 년간 정부의 지원을 받은 인공지능 부트캠프들이 우후죽순 생기고 있다. 학계나 업계에 몸담고 있는 사람이라면 이런 상황에 대해서 모두가 나름대로 할 말이 많으실 줄 안다. 다만 이번 글은 서평단에 선정되어 책을 평가하는 것이 목적이니만큼 각자 가진 의견의 차이에 대해서 논쟁하고 싶은 것은 아니고, 바로 그 ‘국비학원 출신 AI 개발자’ 당사자로서 나에게 필요했던 것들과 이 책이 나의 필요를 어떻게 채워주었는지에 대해 이야기해볼까 한다. AI뿐만 아니라 개발 관련 부트..

공부/Data Science 2022. 8. 23. 19:30

TIL: What is 'data annotation'?

데이터 어노테이션(data annotation)이란 데이터를 라벨링하고 분류하는 것으로, 쉽게 말해 데이터에 그 데이터를 설명하기 위한 또다른 데이터, 즉 메타 데이터를 달아주는 것이다. (즉 흔히 데이터 라벨링 작업을 한다고 말할 때의 '라벨링'도 데이터 어노테이션의 일종이다.) annotate는 '주석을 달다'는 뜻이므로, 논문이나 에세이를 쓸 때 각주나 미주를 넣어 본문에 쓴 문장의 출처나 부연 설명 등을 달아본 경험이 있다면 data annotation이 무엇을 위한 어떤 행위인지 바로 연상할 수 있을 것이다. 데이터 어노테이션의 예시 물체를 보고 자동으로 분리수거를 해주는 모델을 만들 때, 데이터 객체에 bounding box 처리를 해주는 것 환자의 종양이 양성인지 악성인지를 판별하는 모델을 ..

공부/Data Science 2022. 6. 28. 21:32

데이터 사이언티스트/데이터 분석가 커리어를 위해서 무엇부터 준비해야 할까? & 필수 기술!

오늘은 visualising korea 대표이신 백수경 님 영상을 보고 내용을 정리하면서 내 생각을 덧붙여봤다. visualising korea는 '한국의 사회/경제/문화현상을 데이터로 분석 및 시각화하는 프로젝트'라고 하는데, 나는 아래 '코로나19와의 전쟁에서 생명 구하기: 사망에 대한 인사이트 도출'을 통해 visualising korea를 처음 알게 되었다. 데이터에 기반해 논리를 전개하는 방식과 그 구성이 아주 멋진 글이니 시각화와 인사이트 도출에 큰 관심이 없다 해도 한번쯤 읽어보시면 좋겠다. https://dacon.io/competitions/official/235590/codeshare/949 코로나19와의 전쟁에서 생명 구하기 - '사망'에 대한 insights 도출 코로나 데이터 시각..

공부/Data Science 2022. 6. 10. 00:08

구글 코랩에서 셀레니움을 사용하려는데 잘 되지 않아요

토이 프로젝트를 위해서 구글맵으로 크롤링을 하려는데 크게 세 가지 문제가 발생했다. 셀레니움을 사용하는 예제를 참고해봤지만 대부분 예전 글이라 수정할 수 없었다. 1. 코랩이 크롬 드라이버의 경로를 인식하지 못함. 드라이버 실행파일을 로컬에도 놔둬 보고 코랩에도 올려보았으나 해결되지 않음. 2. 창이 안 뜸. 셀레니움 다운그레이드로 1을 해결해도 3. css 식별자 탐색 메소드가 만료되었다는 메시지가 뜸. DeprecationWarning: find_element_by_* commands are deprecated. Please use find_element() instead 문제상황 크롬 드라이버의 설치 경로를 찾지 못함, 크롬 창이 열리지 않음, .find_element_by_css_selector ..

공부/Data Science 2022. 6. 6. 23:57

DBeaver로 PostgreSQL 연결하고 .csv 데이터 업로드하기(feat.ElephantSQL, python)

오늘은 .csv 형식으로 추출해둔 데이터를 PostgreSQL DB에 올려보는 과정을 써보고자 한다. DBeaver 설치나 ElephantSQL 가입 등등은 어려울 게 없는데, 과정을 따라가다 보니 무슨 칸에 뭘 입력해야 되는지 은근히 헷갈려서 내가 잊어버리지 않기를 바라며 작성하는 포스팅이다. 모든 과정은 무료 가입자 기준. 준비물: elephantSQL 계정, DBeaver, 파이썬 구동 환경(구글코랩 등) 먼저 ElephantSQL 홈페이지로 접속해서 프리 PostgreSQL DB를 하나 받고, Details 메뉴를 눌러보면 내가 방금 받은 DB에 대한 데이터를 볼 수 있다. 위 스크린샷을 참고해 Server에 있는 긴 주소를 DBeaver의 Host에, User and default datab..

공부/Data Science 2022. 6. 3. 22:49

Object Detection: YOLO(1)

Object Detection - obejction과 bounding box를 탐지하는 model로, 입력변수는 image, 출력변수는 bounding box와 object class list - bounding box에 대하여 그에 대응하는 class와 해당 class의 confidence를 출력 (※applications: 분리수거 모델, 방사선 사진으로 종양 탐지, 마스크 미착용자 탐지 등…) IoU: Intersection over union ground truth와 predict result가 얼마나 겹치는지를 확인하고자 하는 지표로, 1에 가까울수록 모델의 정확도가 높음 cf. ground truth ≠ label; label은 (정확히 0/1로 알 수 있는)정답, ground truth는 어..

공부/Data Science 2022. 2. 10. 16:40

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Just keep swimming!

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30