これは"Video Summarization using Deep Semantic Features" in ACCV'16 [arXiv]を書き直したものになります。
実装元のリンク,備忘録
git clone https://github.com/590shun/vsum_dsf.git
このコードでは以下のM. Gygli et al. [1]を参考にしています。 環境構築は次のように行います。
cd vsum_dsf
git clone https://github.com/gyglim/gm_submodular.git
cd gm_submodular
python setup.py install --user
[1] Gygli, Grabner & Van Gool. Video Summarization by Learning Submodular Mixtures of Objectives. CVPR 2015.
この実験で使うデータ(SumMeデータセット)は data.zipとして保管。 データセットについては(こちら)を参照。
cd data/summe
wget https://data.vision.ee.ethz.ch/cvl/SumMe/SumMe.zip
unzip SumMe.zip
python script/summarize.py
python script/evaluate.py results/summe/smt_feat