Huggingface's Bertの2番目の出力の意味は何ですか？

debugcn 投稿 Dev

user2182857

huggingfaceの実装でベースBERTモデルのバニラ構成を使用すると、長さ2のタプルが得られます。

import torch

import transformers
from transformers import AutoModel,AutoTokenizer

bert_name="bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(bert_name)
BERT = AutoModel.from_pretrained(bert_name)

e=tokenizer.encode('I am hoping for the best', add_special_tokens=True)

q=BERT(torch.tensor([e]))

print (len(q)) #Output: 2

最初の要素は、私が受け取ることを期待しているものです。つまり、各入力トークンの768次元の埋め込みです。

print (e) #Output : [101, 1045, 2572, 5327, 2005, 1996, 2190, 102] 
print (q[0].shape) #Output : torch.Size([1, 8, 768])

しかし、タプルの2番目の要素は何ですか？

print (q[1].shape) # torch.Size([1, 768])

各トークンのエンコーディングと同じサイズです。しかし、それは何ですか？

エンコードされたテキスト全体を分類するための表現である[CLS]トークンのコピーでしょうか。

確認しよう。

a= q[0][:,0,:]
b=q[1]

print (torch.eq(a,b)) #Output : Tensor([[False, False, False, .... False]])

いいえ！

（何らかの理由で）最後のトークンの埋め込みのコピーはどうですか？

c= q[0][:,-1,:]
b=q[1]

print (torch.eq(a,c)) #Output : Tensor([[False, False, False, .... False]])

だから、そうではありません。

ドキュメントでは、を変更するとconfigタプル要素（非表示状態など）が増える可能性があると説明していますが、デフォルト構成で出力されるこの「不可思議な」タプル要素の説明は見つかりませんでした。

それは何であり、その使用法は何ですか？

溶ける

この場合の出力は、（last_hidden_state、pooler_output）のタプルです。返品の内容に関するドキュメントはこちらにあります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Pythonの％（）sの意味は何ですか？

分類Dev

HuggingFaceのtokenizer.encodeとtokenizer.encode_plusの違いは何ですか

分類Dev

--limit 5 / sの意味は何ですか？

分類Dev

Outputting attention for bert-base-uncased with huggingface/transformers (torch)

分類Dev

JavaScriptでの（/ ^ \ s + | \ s + $ / gm）の意味は何ですか？

分類Dev

OPCノードパスでの「ns = 2; s =」の意味は何ですか？

分類Dev

HuggingFaceのBertTokenizerFast.from_pretrained（ 'bert-base-uncased'）でmax_length、padding、およびtruncation引数はどのように機能しますか？

分類Dev

Bert（huggingface）分類子を使用したtf.kerasモデルの保存の問題

分類Dev

分類タスクにhuggingfaceのpytorch-transformersGPT-2を使用する

分類Dev

HuggingFace Transformers GPT-2で過去をどのように使用しますか？

分類Dev

`git ls-files -s`の出力のさまざまなフィールドの意味は何ですか？

分類Dev

正規表現での％s +％の意味は何ですか？

分類Dev

HuggingFace Transformersライブラリで事前トレーニングされたBERTモデルの中間レイヤーの出力を取得するにはどうすればよいですか？

分類Dev

'ss -s'の出力はどういう意味ですか？

分類Dev

'ss -s'の出力はどういう意味ですか？

分類Dev

HuggingFaceのペガサスをonnx形式に変換する方法

分類Dev

日本のトークナイザーのHuggingFace

分類Dev

カール「-s」と「-m」の意味は何ですか

分類Dev

enp＃s＃f＃の意味は何ですか？

分類Dev

フロートの出力の「％！s」とは何ですか？

分類Dev

'ls'出力のsrwxr-xr-xの 's'はどういう意味ですか？

分類Dev

「iplinkshow」出力の2番目の「状態」は何ですか

分類Dev

はじめに：Huggingfaceモデルカード

分類Dev

Huggingface gpt2言語モデルコードのどこで困惑が計算されますか？

分類Dev

bert-baseに注意を向ける-huggingface / transforms（torch）でケースなし

分類Dev

なぜeth＃ではなくenp＃s＃なのですか？enp＃s＃の意味は何ですか？

分類Dev

bignumber.jsの `c`、` e`、および `s`の意味は何ですか？

分類Dev

配列dtypeの垂直バーの意味は何ですか（ '| S58'）

分類Dev

'ls -n'の出力の2番目の列はどういう意味ですか？

Related 関連記事

記事