Giter VIP home page Giter VIP logo

analyze-poverty's Introduction

analyze-poverty

概要

Code for Japanの #proj-poverty でデータ分析するためのリポジトリです

データ

分析データ情報源

ライセンス

  • このリポジトリのライセンスは WTFPL です
  • data/ ディレクトリ以下のデータに関しては、各データ取得元のライセンスに準じます

プロジェクトへの参加・協力方法

GitHubアカウントを作り、このリポジトリをForkする

  • 何をするにしてもGitHubアカウントを作る必要があります
  • GitHubアカウントを作ると以下ができます
    • Issueを立てる
    • このリポジトリをForkしてPull requestを送る

データ分析のアイデアを提案する

  • データ分析のアイデアを求めています。GitHubのIssueとして追加してください!

データ収集に協力する

  • 分析に活用するためのデータの情報源を求めています。以下の方法で協力してください!
    • このリポジトリをForkする
    • data/ 以下に、データの情報源のドメイン名のディレクトリを作り、直接データを置く
    • data/ 以下に、APIのドメイン名でMarkdownファイルを作る
    • このリポジトリにPull requestを送る

データ分析に協力する

  • 様々な視点からのデータの分析を求めています。以下の方法で協力してください!
    • Issuesに、自分が実行できそうなデータ分析のアイデアがないか探す
    • なければIssueを立てて自分自身をアサインする
    • このリポジトリをForkする
    • プロジェクトのトップに、自分の名前のディレクトリを作る
      • .ipynb のファイルを作る
        • ファイル名は日本語でも問題ありません
    • このリポジトリにPull requestを送る

analyze-poverty's People

Contributors

aiko-hirano avatar koichiro-shiratori avatar nakaharaousei avatar ririumu avatar sho-ksme avatar takano32 avatar tmotegi avatar yuiseki avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

analyze-poverty's Issues

各自治体ごとの貧困関連ニュースの頻出語・特徴語を分析する

なぜこのデータ分析をやるのか

  • crisis.yuiseki.net では貧困関連ニュースを収集してAPIを提供している
  • また、ニュース記事本文から市区町村レベルで位置情報を推定して保存している
  • 各自治体ごとのニュース記事の頻出語を分析することで、自治体ごとの傾向がわかるのではないか
  • 特定のキーワードが極端に多い自治体では異常な事態が起きている可能性が考えられる

類似の分析事例

  • おそらく存在しない

必要なデータとその入手方法、入手可能性

  • crisis.yuiseki.net のAPIでデータを取得可能

データの分析方法の案

  • 全ニュース記事を取得し、タイトルと本文を形態素解析して、キーワードの出現回数をカウントする
  • 各自治体ごとのニュース記事を取得し、タイトルと本文を形態素解析して、キーワードの出現回数をカウントする
    • 単純に最も頻繁に出現するキーワードが頻出語
    • 全ニュース記事のキーワード出現回数と比較してその地域だけ出現回数が多いキーワードが特徴語

データの可視化方法の案

  • 自治体ごとの表にする
  • 地図上でキーワードをオーバーレイして可視化する

低所得世帯数に対して新型コロナウイルスに関する生活福祉資金貸付制度の申請が少ない自治体を可視化する

なぜこのデータ分析をやるのか

  • 低所得世帯数に対して新型コロナウイルスに関する生活福祉資金貸付制度の申請が少ない自治体に住んでいる人は、
    • 何らかの事情があって生活福祉資金貸付制度に申し込めない可能性がある
    • 調査したり申請を支援したり別の制度を用意する必要がある

類似の分析事例

  • 貸付件数を調査した事例はあったが、低所得世帯数と比較した事例はなさそうだった

必要なデータとその入手方法、入手可能性

データの分析方法の案

  • 潜在生活福祉資金貸付制度貸付世帯 = 低所得世帯 - 生活福祉資金貸付制度貸付件数

データの可視化方法の案

  • 地図上で潜在生活福祉資金貸付制度貸付世帯が多いほど濃くなるように各自治体を塗り分ける

ビッグイシューの販売場所をデータ分析で扱えるようにしたい

ビッグイシューの販売場所は以下のURLで公開されている。
https://www.bigissue.jp/buy/
HTMLなので、スクレイピングしてCSVなどに落とし込む必要がある。

考慮すべき参考情報

  • 原則的には一つの販売場所につき1人の販売者
    • まれに、1人の販売者が複数の販売場所を掛け持ちしているところもある
  • 2週間ほど仕入れがない場合は消される
  • 大阪・東京にはビッグイシューの正規スタッフがいて事務所を構えている
    • それ以外の地域は、その地域に根付いているホームレス支援団体に雑誌を卸している
      • その支援団体のキャパシティによっても販売数は変わる

非正規雇用者の数に対してハローワークの正社員求人数が少ない自治体を可視化する

なぜこのデータ分析をやるのか

  • 非正規雇用者の数に対してハローワークの正社員求人数が少ない自治体は、
    • 正規雇用になることが難しい
  • その自治体において非正規雇用者を正社員登用することに対して助成金を出すなどの制度が必要なのではないか

類似の分析事例

必要なデータとその入手方法、入手可能性

データの分析方法の案

  • 正規雇用求人率 = 正社員求人数 / 非正規雇用者数

データの可視化方法の案

  • 正規雇用求人率の高い自治体ほど濃くなるように地図上で塗り分ける

各自治体で、所得が生活保護水準の世帯数と、実際の生活保護世帯数を割合で可視化する

なぜこのデータ分析をやるのか

  • 生活保護水準の世帯数が多いのに実際の生活保護世帯が少ない自治体は、生活保護の申請を拒んでいる可能性が高い
  • その自治体において生活保護の申請がしづらい状況になっていないのか調査をするべき

類似の分析事例

必要なデータとその入手方法

  • 各自治体の生活保護世帯数のデータが必要
  • 各自治体の低所得世帯数のデータが必要

データの分析方法

  • 潜在生活保護世帯数 = 低所得世帯数 - 生活保護世帯数

データの可視化方法

  • 地図上で潜在生活保護世帯数が多いほど濃くなるように各自治体を塗り分ける

ひとり親世帯数に対しての予算の割合が相対的に少ない自治体を可視化する

なぜこのデータ分析をやるのか

  • ひとり親世帯数に対しての予算の割合が相対的に少ない自治体は、ひとり親世帯にとって住みにくいと考えられる
  • ひとり親世帯が住みやすい自治体がわかる
  • ひとり親世帯数に対しての予算が少ない自治体に対して、予算を増やすべきだというメッセージになる

類似の分析事例

必要なデータとその入手方法、入手可能性

  • 各自治体のひとり親世帯数
  • 各自治体のひとり親世帯対策予算総額

データの分析方法の案

  • ひとり親世帯あたり予算 = ひとり親世帯対策予算総額 / 各自治体のひとり親世帯数

データの可視化方法の案

  • 地図上でひとり親世帯あたり予算が多いほど濃くなるように各自治体を塗り分ける

コロナの影響、経済指標とホームレスや生活保護や生活福祉資金貸付制度の相関の時系列分析と予測

なぜこのデータ分析をやるのか

  • 各種生活困窮者や経済支援制度利用者が増えているのか減っているのかを可視化する
    • 将来増えていくのか減っていくのかの予測もする
  • 新型コロナウイルスの影響がどれくらいあったのかを分析、可視化する
  • 支援にどれだけの効果があったのかを推測する

類似の分析事例

必要なデータとその入手方法、入手可能性

  • 経済指標は世界銀行のものが扱いやすい
    • 他、国勢調査などのデータも使えるかも
    • GDP、平均年収、金利、物価あたりの指標が使えるか
    • 日経平均株価も一応使える
  • ホームレスや生活保護や生活福祉資金貸付制度のデータはすでに収集済み

データの分析方法の案

  • データをいじりながら考える
  • 季節変動がある可能性があるので注意が必要

データの可視化方法の案

  • Prophetやplotlyを使う

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.