1.特征工程收益较高,但是没找到magic feature
2.stacking确实有效
3.算力有限没能多跑一些seed
4.模型调参做的不好
5.伪标签的正确使用还在尝试,本次比赛可能使用姿势不对. ==> https://www.kaggle.com/c/tabular-playground-series-apr-2021/discussion/231738 kaggle这个tips里说到的 check the training metric only by real ground truth labels. 很合理,但是没看到具体实现,感觉上简单样本带权+custom metric似乎不足够?如果任何朋友有兴趣或者知道具体的实现方法,求教!!