Comments (4)
ありがとうございます。表記がわかりにくく申し訳ありません。添字よりも「w」が用いられているか「s」が使われているかで区別した方がわかりやすいかと思います。
- w_i : 文章中の i 番目の単語を表す。i の取り得る範囲は1≦i≦n
- w_j : 文章中の j 番目の単語を表すが、ここでは C_i の要素として登場するので、j は (i-c, i-c+1, ..., i-1, i+1, ..., i+c) のいずれか。
- s_j : 語彙中の j 番目の単語を表す。この場合は j の取り得る範囲は1≦j≦N
これで答えになっているでしょうか?
from bert-book.
どうもありがとうございます。確かに分ける方が明確になりますね。今後の書き方の参考にさせていただければと思います。
from bert-book.
早速ご回答頂きありがとうございます。
以下の2点については全く違和感ありません。
・w_i:文章中のi番目の単語を表す。iの取り得る範囲は1≦i≦n
・s_j:語彙中のj番目の単語を表す。jの取りうる範囲は1≦j≦N
次の点のみ、少し違和感があります。
・w_j:文章中のj番目の単語を表すが、ここではC_iの要素として登場するので、jは(i-c,i-c+1,…,i-1,i+1,…,i+c)のいずれか。
これだと、"j"という添字が「文章中の順番」と「語彙中の順番」を表す場合があるという事になると思います。
「文章中の順番=文章で何番目に登場したか」と「語彙中の順番=語彙に対してどんな数字が割り当てられたか」を表す数字は全く別物なので、添字を使い分けた方が良い(もしくは別の添字を使う等)ということはありませんか?
私がこだわっているだけでこういうものなのかもしれませんが…
以上、ご確認よろしくお願い致します。
from bert-book.
ご対応頂きありがとうございました。
from bert-book.
Related Issues (20)
- p.92 タイポ HOT 1
- [改善]P34 の $K^T$ と P37 の $E^T$ のフォントを変更するか、注釈がほしい HOT 1
- タイポ HOT 1
- ソースコードのライセンスについて HOT 2
- torchmetricsのバージョンアップに関連する動作不良 HOT 2
- 【第二章】コサイン類似度について(p.17) HOT 2
- 【第二章】再帰型ニューラルネットワークについて(p.22) HOT 1
- typo p.118/p.128
- 【第6章】Pytorch Lightningの関数定義について(p.82〜83) HOT 2
- 再現性の担保(Chapter6)に関して HOT 2
- 【第8章】encode_plus_untagged関数のtorch.Tensor変換について HOT 7
- 【第8章】encode_plus_untagged関数の分割箇所について HOT 2
- pytorch_lightningのimport時のエラーについて HOT 3
- #5-8 2つ以上の[MASK]を含む文章のときに起きている問題 HOT 2
- [第9章] 誤字訂正のやり方について HOT 1
- 第8章 BERTjapaneseTokenizer以外を使う場合について
- p.58 HOT 1
- 第7章のマルチラベル分類のBERTモデルについて HOT 1
- 6章 BERTによる文章分類 について HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from bert-book.