Giter VIP home page Giter VIP logo

Comments (7)

k-yoshimi avatar k-yoshimi commented on August 21, 2024

@takeokato719
ご報告ありがとうございます。
今の症状だけだと解析できませんので、以下の情報を提供していただけるでしょうか?

使用しているDSQSSのバージョン
実行に使用した入力ファイルとその出力

from dsqss.

Takuto36 avatar Takuto36 commented on August 21, 2024

プログラムを回した者です。

DSQSSのバージョンは2.0.3です。
添付したmake_jobscript.pyを実行しジョブを生成してスパコンに投げました。
(指定したパーティションのみ”パーティション名”に変えています。)
L=38の場合は8分程度で添付したアウトプットファイルが出力されたのですが
L=40の場合は3日と16時間回しても計算が終わらなかった為、途中でジョブを切りました。

実行に使用したファイルはインデントを含めたコードの貼り方が分からなかった為、
以下のグーグルドライブにあげさせていただきました。
よろしくお願いいたします。

https://drive.google.com/drive/folders/13NCWWvsxyJHwLBkvDfeYVmeWspw32RTB?usp=sharing

from dsqss.

Takuto36 avatar Takuto36 commented on August 21, 2024

追加で1点補足です。
計算機による問題かを把握する為に
前回送らせていただいたプログラムをベースに
①クラスター計算機
②スーパーコンピューター
の2つで8並列にして計算プログラムを投げてみたところ
L=40では、①②のどちらでも計算はエラー無しで終了するのですが
(①は38秒、②は5分12秒で計算が終了。)
アウトプットファイルは出力されませんでした。
①②共にDSQSSのバージョンは2.0.3です。
お手数をおかけしますが、よろしくお願いいたします。

from dsqss.

takeokato719 avatar takeokato719 commented on August 21, 2024

今ohtakaで確認したところ、L=40では以下のようなエラーメッセージがでてますね。

>>> The program is being run with MPI mode.( N_PROC = 8 ) 


+++++++++ input data +++++++++
RUNTYPE = 0

NSET    = 10
NTHERM  = 10000
NMCS    = 1000
SEED    = 12132400
NVERMAX = 10000
NSEGMAX = 10000

BETA    = 5
NTAU    = 256
ALGFILE = algorithm.xml
LATFILE = lattice_L40.xml
WVFILE = 
DISPFILE = 
OUTFILE = res_seed0_M1_L40_T0.2_nset10_nthermal10000_ndecor1000_nmcs1000.dat
CFOUTFILE  = cf.dat
SFOUTFILE  = sf.dat
CKOUTFILE  = ck.dat
SIMULATIONTIME   = 0
+++++++++ input data +++++++++
Determining hyperparameter NCYC : 9
Start main calculation.
Pool> ERROR. Attempt to extract from an empty pool.
Pool> ERROR. Attempt to extract from an empty pool.
Pool> ERROR. Attempt to extract from an empty pool.
Pool> ERROR. Attempt to extract from an empty pool.
Pool> ERROR. Attempt to extract from an empty pool.
Pool> ERROR. Attempt to extract from an empty pool.
.....

from dsqss.

yomichi avatar yomichi commented on August 21, 2024

対応遅れてすみません。
最後のログにあるエラーメッセージですが、 vertex などのオブジェクトとしてあらかじめ確保してあるものを使い切ってしまっているようです。
MPI 並列したときに計算が終わらないのは、これによっていくつかのプロセスが終了してしまっていて、最後にモンテカルロ平均のために merge するところですでに消えてしまった待ち人を待っているために思えます。

というわけで、
parameter の nvermaxnsegmax を増やしてみてください。

(ちょくちょく引っかかる人がいるので faq への追加というのも含めていい加減なにか考えます)

from dsqss.

k-yoshimi avatar k-yoshimi commented on August 21, 2024

@takeokato719 @Takuto36
これは上の回答で解決したのでしょうか?解決したようでしたら、closeをお願いします。

from dsqss.

takeokato719 avatar takeokato719 commented on August 21, 2024

解決していますので、closeします。

from dsqss.

Related Issues (17)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.