Comments (10)
@pomeloking01 是有可能会出现这种情况。我的理解是基于条件随机场的参数计算输出结果时,因为需要计算整个序列的联合概率,求得最优标记序列,神经网络输出的轻微扰动有可能会导致这一结果出现一定的变化。
from bertner.
@pomeloking01 是有可能会出现这种情况。我的理解是基于条件随机场的参数计算输出结果时,因为需要计算整个序列的联合概率,求得最优标记序列,神经网络输出的轻微扰动有可能会导致这一结果出现一定的变化。
我也遇到一样的问题,但是打印每层输出发现,bert_embedding每次输出都不一样,想不明白是哪里的问题,作者可以帮忙看看么?
from bertner.
@pomeloking01 是有可能会出现这种情况。我的理解是基于条件随机场的参数计算输出结果时,因为需要计算整个序列的联合概率,求得最优标记序列,神经网络输出的轻微扰动有可能会导致这一结果出现一定的变化。
我也遇到一样的问题,但是打印每层输出发现,bert_embedding每次输出都不一样,想不明白是哪里的问题,作者可以帮忙看看么?
当你预测时,应该把bert_embedding的is_training改为False,否则的话预测的时候会dropout。导致预测的结果有差异。
from bertner.
作者,您好,请问一下您的进行实验的配置是怎样的?用到的服务器的性能是怎样的,我用自己的电脑是直接内存爆炸的,可以请教一下吗?
from bertner.
@FancyZhang96 没有GPU吗?那你把BatchSize设置为1,看你的内存能不能带得动,这样还不行的话,你得想办法弄台设备。
from bertner.
from bertner.
@FancyZhang96 没有GPU吗?那你把BatchSize设置为1,看你的内存能不能带得动,这样还不行的话,你得想办法弄台设备。
您好,我基于自己的数据进行实验,引入Bert之后效果没有原来的BiLSTM-CRF效果好,请问能指教一下原因吗?
from bertner.
@FancyZhang96 你给的信息太少了,没法分析。
from bertner.
@FancyZhang96 你给的信息太少了,没法分析。
我之前用了自己的数据集在您提到的BiLSTM-CRF中训练F值达到了91%,参数都没有改,然后将数据集放在了这个引入BERT中模型中,也是参照您的参数,没有改动,F值只有88%。
from bertner.
@FancyZhang96 是领域数据吗?你如果有问题,请另开一个issue,避免与本issue主题无关的讨论影响别人,本issue close了
from bertner.
Related Issues (20)
- 如何 将生成的ckpt文件转换为pb文件
- 项目引用格式 HOT 1
- ModuleNotFoundError: No module named 'tensorflow.contrib' HOT 1
- What is the use of the .dev file in data? HOT 3
- ner_predict.utf8预测结果的问题 HOT 2
- ValueError: Couldn't find 'checkpoint' file or checkpoints in given directory chinese_L-12_H-768_A-12/bert_model.ckpt HOT 1
- 代码复现第4步(训练)遇到问题 HOT 3
- 训练结果相关问题
- GPU没有被使用
- 如何加入早停机制呢,放钩子? HOT 1
- config_file HOT 1
- lstm_outputs = self.biLSTM_layer(lstm_inputs, self.lstm_dim, self.lengths)为什么 lstm_outputs的维度是(?,?,786)这里的问号为什么不是实数呢?) HOT 4
- 用其他数据集跑,因为数据集标签不同,报错“ KeyError: 'B-Project' ”,请问如何解决? HOT 2
- 请问data里的bio是怎么生成的,如何进行bio标注
- 没有日志 HOT 1
- 有关iteration step epoch的问题 HOT 1
- 有关评估指标的问题 HOT 5
- 请教一下 HOT 1
- 请教一下 precision recall为零的原因
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from bertner.