Giter VIP home page Giter VIP logo

netflix-twitterbot's Issues

서버 시간을 UTC로 변경한다.

  • 현재 서버 시간은 KST로 설정되어있다.
  • 서버 시간을 UTC로 변경한다.
  • 서버 시간 변경으로 인해 함께 업데이트를 해줘야 하는 부분들은 아래와 같다.
    • crontab 시간대
    • 오늘의 뮤지컬 스케줄 봇의 시간 비교 시, DB에 저장되어있는 시간과 (서버시간 + 9) 인 시간을 비교해야 한다. -> 현재 상영중인 뮤지컬 봇도 확인필요하다.
    • 기타 또 다른 변경 사항이 있을 수 있으니 점검이 필요한다.

스크린샷 2022-09-08 오후 9 13 38


스크린샷 2022-09-08 오후 9 13 54

자료 소스 공식 넷플릭스 사이트로 변경

기존에는 다음에서 제공하는 페이지를 직접 스크롤을 해왔다.
하지만 공개되는 콘텐츠가 영화로 한정되어있어 많은 정보를 가져올 수 없었다.

알고보니 넷플릭스에서 자체적으로 사용하는 상영예정 페이지가 있었고, 특정 인증 없이 json으로 가져올 수 있어, 변경한다.

이점

  • json 형태라 크롤링보다 손쉽다.
  • 다음에서 제공하는 소스보다 더 다양한 정보 (영화 외에도 드라마, 시리즈 등)을 얻을 수 있다.

대상 페이지: https://about.netflix.com/ko/new-to-watch
대상 json: https://about.netflix.com/api/data/releases?language=ko&country=KR

지금 상영중이 아닌 뮤지컬 빼기

이미 폐막을 한 뮤지컬들이 함께 나오고 있다
단순 랭킹을 보여주기 때문인 것 같음.
오늘 날짜를 받아와서 폐막날이 오늘보다 이전인 것들은 제외하는 코드를 추가해야 한다.

오늘의 뮤지컬 스케줄 봇 해킹당했다.

2022-09-05 오전에 오늘의 뮤지컬 스케줄 봇을 확인해보니 해킹을 당해 이상한 트윗이 10개 정도 올라가고 있었다.

예상하는 해킹 경로

  1. 오늘의 뮤지컬 스케줄 봇의 트위터 계정을 해킹
  2. 오늘의 뮤지컬 스케줄 봇이 올라가 있는 서버를 해킹

스크린샷 2022-09-05 오후 11 02 48

20210324 ERROR and TODO

error

  • path가 crawl/img 로 들어가 있는데 그게 아니라 img가 밖으로 나와야 한다.
  • duplicate status 충복트윗을 어떻게 해야 하나 생각해야 한다. --> 앞에 숫자를 쓰거나 해야겠음. 아니면 중복이어도 트윗되게
  • 패스도 지금 어떤 부분은 windows 기준으로 써있다.

TODO

  • 이미지 저장이 되면 commit 작업도 해야 한다. 안그럼 repo에 남지를 않는다. (그럼 커밋하고 트위터 올리기를 해야하나??)
  • tweetpy 이미지 올리기 해보기 --> 근데 얘가 날짜마다 만들어주는데 그럼 media_id가 달라서 중복 안 걸릴 것 같기도 함
  • 파일 이름에 공백이나 특수 문자 들어가면 바꿔줘야 함 --> 아 근데 그럼 또 이미지랑 타이틀을 뭘로 맵핑하냐 --> dict 이 아니라 list 로 관리해야하나 싶음 list(dict('title', 'date'))

git basic access token deprecated

git 에 접근하는 basic access token 방식이 deprecated 가 되어서 크롤링으로 다 읽어와도 쌓여진 이미지가 커밋이 안된다.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.