Giter VIP home page Giter VIP logo

moviecrawler's Introduction

MovieCrawler

개요

사전준비사항
  • API KEY 발급
    • 영화진흥위원회 API 사용을 위한 KEY
      • 로그인
      • 사이트 내 메뉴 키발급/관리 이동
      • API KEY 추가
    • TMDB API 사용을 위한 KEY
      • 로그인
      • 회원 정보 Settings 메뉴 클릭
      • API 메뉴 클릭
      • Request an API Key 클릭 후 필요 정보 작성 및 KEY 발급

수집 Config 파일 설명
  • 샘플 config 파일은 config 폴더의 config.xml이 존재합니다.
  • <kobis>
    • <key>
      • 영화진흥위원회 API 키
    • <rootdir>
      • 수집이 진행 되는 루트 폴더
      • 해당 폴더에 history 폴더(동적수집을 위한), image 폴더(이미지수집을 위한), crawled 폴더(수집결과파일을 위한)가 생성됩니다.
    • <service>
      • <item>
        • 각각의 item 엘리먼트에 영화진흥위원회 API URL 정보를 작성합니다.
        • id 어트리뷰트 값 설명
          • boxoffice : 오늘의 박스오피스 랭킹
          • movie_list : 영화 목록
          • movie_detail : 영화 상세정보
          • people_list : 인물 목록
          • people_detail : 인물 상세정보
        • active 어트리뷰트 값 설명
          • N : 수집대상 아님
          • Y : 수집대상
          • 예를 들어 movie_list 에 active 설정이 되어 있으면 영화 목록 수집을 진행함_
      • <request>
        • <item>
          • 영화진흥위원회 API에 사용 될 파라미터(쿼리스트링)
          • id 어트리뷰트 값 설명
            • itemPerPage : 한 페이지 당 검색 되는 아이템 갯수
            • curPage : 검색 할 페이지
            • prdtStartYear : 영화 제작 시작년도
            • prdtEndYear : 영화 제작 종료년도
  • <tmdb>
    • <key>
      • TMDB API 키
    • <service>
      • <item>
        • TMDB API URL 정보를 작성합니다.
      • <image>

수집 실행
  • CrawlManager.exe -path <설정파일(config.xml) 경로>
    • 컨피그파일 경로 미 작성 시, 기본 루트페이지의 컨피그파일을 찾아서 실행합니다.

moviecrawler's People

Contributors

korcosin avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.