
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 from konlpy.tag import Okt from konlpy.tag import Hannanum from collections import Counter from bs4 import BeautifulSoup import requests import re import pandas as pd import csv filename = "riss국내학술지.txt" f = open(filename, 'r', encoding='utf-8') news = f.read() okt = Okt() okt = Hannanum() noun = okt.nouns(news) count = Cou..

하려는 것 riss에서 평생교육 키워드로 학위논문/국내학술논문/연구보고서의 논문 개요를 크롤링한 뒤 csv, json 등의 외부 데이터로 저장해서 관계망을 만들고 싶다. 어디까지 됐지? 셀레니움으로 riss를 켜고, 검색어 '평생교육' 입력 후 우선 '국내학술논문'을 클릭했다. 문제가 뭐지? 마지막 페이지까지 자동으로 논문의 서지정보를 긁어오게 하려면 어떻게 해야 할지 모르겠다. 어떻게 해결해 볼까? 구글링을 열심히 했으나(ㅎ) 포기하고 교육받을 때 뉴스기사를 마지막 페이지까지 긁는 코드를 배웠던 기억이 나서 카페로 돌아왔다. (난 다른 분이 그 내용을 질문하셨을 때 설명하는 댓글도 달았는데 싹 까먹은 거다!) 근데 그걸 봐도 모르겠다. 그건 기사 링크를 다루는 거고 이건 xpath를 다루는 거라서 그런..
- Total
- Today
- Yesterday
- 데이터준전문가
- ADsP
- 빅분기
- 코테공부
- 빅분기후기
- 데이터분석
- 자격증
- 취업준비
- 개발자포트폴리오
- 빅분기합격
- 자버
- ai부트캠프
- data annotation
- 데이터과학
- 이력서
- ADsP합격후기
- 이자포스터디
- 빅데이터분석기사
- Til
- 인공지능
- 깃허브
- github
- todayIlearned
- Kaggle
- 코드스테이츠
- Notion2Tistory
- googlecolab
- 빅데이터
- 커리어코칭
- 데이터준전문가합격후기
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |