'2020 공공 빅데이터 청년인턴십: 데이터 전문교육과정/인평원에서' 카테고리의 글 목록

20201104 riss 논문 크롤링 그 후: 명사 빈도 분석

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 from konlpy.tag import Okt from konlpy.tag import Hannanum from collections import Counter from bs4 import BeautifulSoup import requests import re import pandas as pd import csv filename = "riss국내학술지.txt" f = open(filename, 'r', encoding='utf-8') news = f.read() okt = Okt() okt = Hannanum() noun = okt.nouns(news) count = Cou..

2020 공공 빅데이터 청년인턴십: 데이터 전문교육과정/인평원에서 2020. 11. 25. 09:09

20201109

지금 내 역량으로는 하기 어려웠던 것 같지만 원래 하고 싶었던 것은 새로운 교육 수요를 발굴하는 거였다. 가설을 세워서 교육 분야가 아닌 곳에서 무엇인가를 발굴해서 평생교육 수요로 끌어내는 그런.

2020 공공 빅데이터 청년인턴십: 데이터 전문교육과정/인평원에서 2020. 11. 9. 10:36

20201102 논문 크롤링: riss에서 크롤링하기

하려는 것 riss에서 평생교육 키워드로 학위논문/국내학술논문/연구보고서의 논문 개요를 크롤링한 뒤 csv, json 등의 외부 데이터로 저장해서 관계망을 만들고 싶다. 어디까지 됐지? 셀레니움으로 riss를 켜고, 검색어 '평생교육' 입력 후 우선 '국내학술논문'을 클릭했다. 문제가 뭐지? 마지막 페이지까지 자동으로 논문의 서지정보를 긁어오게 하려면 어떻게 해야 할지 모르겠다. 어떻게 해결해 볼까? 구글링을 열심히 했으나(ㅎ) 포기하고 교육받을 때 뉴스기사를 마지막 페이지까지 긁는 코드를 배웠던 기억이 나서 카페로 돌아왔다. (난 다른 분이 그 내용을 질문하셨을 때 설명하는 댓글도 달았는데 싹 까먹은 거다!) 근데 그걸 봐도 모르겠다. 그건 기사 링크를 다루는 거고 이건 xpath를 다루는 거라서 그런..

2020 공공 빅데이터 청년인턴십: 데이터 전문교육과정/인평원에서 2020. 11. 2. 13:48

이전 1 다음

이전 다음

공지사항

자기소개

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

글 보관함

Just keep swimming!

티스토리툴바