Tensorflow:Model.fit()InvalidArgumentError:索引[28,13] = -2147483648不在[0,1193514)

Shasha
Train on 28624 samples
Epoch 1/10
   32/28624 [..............................] - ETA: 15:20

InvalidArgumentError                      Traceback (most recent call last)
<ipython-input-25-4679097c6578> in <module>
----> 1 model.fit(X_train_indices, Y_train_OH, epochs = 10, batch_size = 32)**

InvalidArgumentError:  indices[15,2] = -2147483648 is not in [0, 1193514)
     [[node model_1/embedding_1/embedding_lookup (defined at <ipython-input-25-4679097c6578>:1) ]] [Op:__inference_distributed_function_6120]

Errors may have originated from an input operation.
Input Source operations connected to node model_1/embedding_1/embedding_lookup:
 model_1/embedding_1/embedding_lookup/4992 (defined at C:\Users\shash\Anaconda3\envs\sentiment_analysis\lib\contextlib.py:81)

Function call stack:
distributed_function

系统信息

  • 我是否编写了自定义代码(与使用TensorFlow中提供的股票示例脚本相对):是
  • 操作系统平台和发行版(例如,Linux Ubuntu 16.04):Windows 10
  • 从(源或二进制)安装的TensorFlow:Conda
  • TensorFlow版本(使用下面的命令):2.1.0
  • Python版本:3.6.10
  • CUDA / cuDNN版本:不适用
  • GPU模型和内存:已禁用(在没有GPU的情况下对TensorFlow进行硬编码)

->嵌入层

def pretrained_embedding_layer(word_to_vec_map, word_to_index):
   

    vocab_len = len(word_to_index) + 1            #1193514      
    emb_matrix = np.zeros((vocab_len,embedding_dim))
    for word, idx in word_to_index.items():
        emb_matrix[idx, :] = word_to_vec_map[word]

    # Definning a pre-trained Embedding layer
    embedding_layer = layers.Embedding(
                        vocab_len,
                        embedding_dim,
                        trainable = False
                        )

    # Build the embedding layer, it is required before setting the weights of the embedding layer. 
    embedding_layer.build((None,))
    
    # Set the weights of the embedding layer to the embedding matrix. Your layer is now pretrained.
    embedding_layer.set_weights([emb_matrix])
    
    return embedding_layer

->型号

def sentiment_model(input_shape, word_to_vec_map, word_to_index):


    sentence_indices =layers.Input(shape=input_shape, dtype='float32')
    
    # Create the embedding layer pretrained with GloVe Vectors
    embedding_layer = pretrained_embedding_layer(word_to_vec_map, word_to_index)
    
    # Propagate sentence_indices through your embedding layer
    # (See additional hints in the instructions).
    embeddings = embedding_layer(sentence_indices)   

    x = layers.LSTM(128)(embeddings)
    x = layers.Dropout(0.5)(x)
    predictions = layers.Dense(2, activation="sigmoid", name="predictions")(x)
    
    # Create Model instance which converts sentence_indices into X.
    model = keras.Model(inputs=sentence_indices,outputs=predictions)   
    return model
def sentences_to_indices(X, word_to_index, max_len):

    X_indices = np.zeros((m,max_len))
    
    # Assign indices to words
    for i,sentence in enumerate(X):        
        sentence_words = sentence.lower().split()
        for j,word in enumerate(sentence_words):
            X_indices[i, j] = word_to_index[word]
    return X_indices
def get_word_embedding_dictionary():
""" creates word_to_vector, word_to_index and index_to_word dictionaries """
with open(embeding_path, 'r', encoding='utf-8') as f:
    words = set()
    word_to_vec_map = {}
    
    # Extracting word and its vectors
    for line in f:
        line_list = line.split()
        
        # Ignoring unresolvable words
        if len(line_list)!=embedding_dim+1:
            continue
        curr_word = line_list[0]
        words.add(curr_word)
        word_to_vec_map[curr_word] = np.array(line_list[1:], dtype=np.float64)
    
    word_to_index = {}
    index_to_word = {}
    for i,w in enumerate(sorted(words)):
        word_to_index[w] = i
        index_to_word[i] = w
return word_to_index, index_to_word, word_to_vec_map
X_train_indices = sentences_to_indices(X_train, word_to_index, max_features)
Y_train_OH = to_categorical(Y_train)
model.fit(X_train_indices, Y_train_OH, epochs = 10, batch_size = 32)
Shasha

问题是当单词被其相应的索引替换时。如果在词汇/ word_to_index词典中找不到该单词,则将其存储为nan

词汇表是词嵌入中存在的所有词(我使用过GloVe twitter嵌入)。

修改功能:

def sentences_to_indices(X, word_to_index, max_len):

X_indices = np.zeros((m,max_len))

# Assign indices to words
for i,sentence in enumerate(X):        
    sentence_words = sentence.lower().split()
    for j,word in enumerate(sentence_words):
        X_indices[i, j] = word_to_index.get(word,0)  #improvement
return X_indices

不过,我不确定单词嵌入中不存在的单词是否应存储为零。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

0x80000000 == 2147483648在C#中但不在VB.NET中

来自分类Dev

JavaScript bitwsie操作0 ^ 2147483648产生-2147483648

来自分类Dev

TensorFlow中的索引矩阵

来自分类Dev

Tensorflow-model.fit中的值错误-如何修复

来自分类Dev

当调用tf.keras.model.fit时,Tensorflow 2.0不会迭代整个数据集

来自分类Dev

InvalidArgumentError:indexs [120,0] = 3080不在[0,32)中[[{{node embedding_6 / embedding_lookup}}]]

来自分类Dev

使用Tensorflow saved_model,获取ValueError:无法为形状为((,,)'的Tensor'Placeholder_1084:0'输入形状()的值

来自分类Dev

RLLib-Tensorflow-InvalidArgumentError:接收到的标签值N超出有效范围[0,N)

来自分类Dev

tensorflow.python.framework.errors_impl.InvalidArgumentError:预期的大小[0]在[0,512]中,但得到891 [Op:Slice]

来自分类Dev

Tensorflow 2.0:如何从MapDataset(从TFRecord读取后)转换为可以输入到model.fit的某些结构

来自分类Dev

TensorFlow的model.fit()函数中的batchSize是多少?

来自分类Dev

如何在Kaggle Notebook中的GPU上运行Tensorflow的Keras model.fit()函数?

来自分类Dev

Python Tensorflow-多次运行model.fit而不重新初始化模型

来自分类Dev

Tensorflow(Keras API)`model.fit`方法返回“无法将类型<class'tuple'>的对象转换为Tensor”错误

来自分类Dev

Tensorflow InvalidArgumentError:找到2个根本错误。index [28,0] = 11292不在[0,11272)

来自分类Dev

Tensorflow`model.fit()`打印输出

来自分类Dev

Tensorflow model.fit()可再现性

来自分类Dev

TensorFlow GradCAM-model.fit()-ValueError:形状(None,1)和(None,2)不兼容

来自分类Dev

Tensorflow中带有model.fit的InvalidArgumentError

来自分类Dev

如何将自定义数据生成器输入到model.fit中,该生成器生成X,y和一个附加数组到tensorflow.keras模型中?

来自分类Dev

tensorflow中的model.evaluate()如何工作?

来自分类Dev

Tensorflow错误:InvalidArgumentError:不同数量的组件类型。

来自分类Dev

TensorFlow中的索引矩阵

来自分类Dev

Tensorflow:占位符的InvalidArgumentError

来自分类Dev

Tensorflow:带有MNIST的InvalidArgumentError,[55000]与[10000]

来自分类Dev

tensorflow 中 softmax 上的 InvalidArgumentError

来自分类Dev

Tensorflow 索引

来自分类Dev

索引 = 2 不在 [0, 1)

来自分类Dev

使用 model.fit() InvalidArgumentError 训练自定义 tf.keras.model

Related 相关文章

  1. 1

    0x80000000 == 2147483648在C#中但不在VB.NET中

  2. 2

    JavaScript bitwsie操作0 ^ 2147483648产生-2147483648

  3. 3

    TensorFlow中的索引矩阵

  4. 4

    Tensorflow-model.fit中的值错误-如何修复

  5. 5

    当调用tf.keras.model.fit时,Tensorflow 2.0不会迭代整个数据集

  6. 6

    InvalidArgumentError:indexs [120,0] = 3080不在[0,32)中[[{{node embedding_6 / embedding_lookup}}]]

  7. 7

    使用Tensorflow saved_model,获取ValueError:无法为形状为((,,)'的Tensor'Placeholder_1084:0'输入形状()的值

  8. 8

    RLLib-Tensorflow-InvalidArgumentError:接收到的标签值N超出有效范围[0,N)

  9. 9

    tensorflow.python.framework.errors_impl.InvalidArgumentError:预期的大小[0]在[0,512]中,但得到891 [Op:Slice]

  10. 10

    Tensorflow 2.0:如何从MapDataset(从TFRecord读取后)转换为可以输入到model.fit的某些结构

  11. 11

    TensorFlow的model.fit()函数中的batchSize是多少?

  12. 12

    如何在Kaggle Notebook中的GPU上运行Tensorflow的Keras model.fit()函数?

  13. 13

    Python Tensorflow-多次运行model.fit而不重新初始化模型

  14. 14

    Tensorflow(Keras API)`model.fit`方法返回“无法将类型<class'tuple'>的对象转换为Tensor”错误

  15. 15

    Tensorflow InvalidArgumentError:找到2个根本错误。index [28,0] = 11292不在[0,11272)

  16. 16

    Tensorflow`model.fit()`打印输出

  17. 17

    Tensorflow model.fit()可再现性

  18. 18

    TensorFlow GradCAM-model.fit()-ValueError:形状(None,1)和(None,2)不兼容

  19. 19

    Tensorflow中带有model.fit的InvalidArgumentError

  20. 20

    如何将自定义数据生成器输入到model.fit中,该生成器生成X,y和一个附加数组到tensorflow.keras模型中?

  21. 21

    tensorflow中的model.evaluate()如何工作?

  22. 22

    Tensorflow错误:InvalidArgumentError:不同数量的组件类型。

  23. 23

    TensorFlow中的索引矩阵

  24. 24

    Tensorflow:占位符的InvalidArgumentError

  25. 25

    Tensorflow:带有MNIST的InvalidArgumentError,[55000]与[10000]

  26. 26

    tensorflow 中 softmax 上的 InvalidArgumentError

  27. 27

    Tensorflow 索引

  28. 28

    索引 = 2 不在 [0, 1)

  29. 29

    使用 model.fit() InvalidArgumentError 训练自定义 tf.keras.model

热门标签

归档