티스토리 뷰

  • 도입

21년 4월 16일 - 파이썬 텍스트마이닝 프로젝트 기획

21년 5월 6일 - 종료

입력한 검색어에 기반하여 뉴스 기사 데이터를 분석해주는 프로그램입니다.

 

  • 기획
  1. 뉴스 크롤링
    • 링크 추출
    • 기사 제목+내용 추출
  2. 분석
    • wordcloud
    • 토픽 모델링

 

  • 문제점
    • sklearn을 import 할 수 없는 문제 > cmd에서 numpy와 scipy 삭제 후 재설치
    • numpy에서 attribute를 찾을 수 없는 문제 > 버전을 1.23으로 재설치
    • 웹페이지 소스에서 class 이름이 변경되는 문제 > F12로 재확인

 

  • 결과

"파이썬" 검색어의 뉴스 제목 워드클라우드
뉴스 토픽 모델링

  • 코드

깃허브 코드 링크