Python，TF-IDF中的常规矩阵计算

SUNDONG 发表于 Dev

顺东

在生成TF-IDF模块时，我只是面对矩阵向量计算。

A % b = C

[[1,2], [3,4]] % [1/2, 1/3] = [[1/2, 2/3], [3/2, 4/3]]

这A是一个文档中单词的术语频率计数的Document x Words位置的矩阵。和载体被预先计算用于每个单词的IDF值，例如是1/7，如果单词是在7个不同的文件中使用。A_ijijbb_jj

人们如何称这种按列乘法？是否有现有的库支持此操作？（Python）

由于大尺寸和稀疏的，我一直在使用csr_matrix中scipy节省矩阵。
我试图将它们更改为np.array并执行A*b操作，但是几分钟后仍未完成。

中山

使用NumPy。

这是逐元素乘法：

import numpy as np
A = np.array([[1, 2], [3, 4]])
b = np.array([1/2, 1/3])
print(A * b)

输出：

[[ 0.5         0.66666667]
 [ 1.5         1.33333333]]

如果是csr_matrix：

from scipy.sparse import csr_matrix
x1 = csr_matrix([[1, 2], [3, 4]])
x2 = csr_matrix([1/2, 1/3])
print(x1.multiply(x2).todense())

输出：

[[ 0.5         0.66666667]
 [ 1.5         1.33333333]]

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-23

我来说两句

0条评论

登录后参与评论

上一篇：如何在Cake 3.2中的POST请求中传递隐藏信息的数组？

来自分类Dev

在TF-IDF矩阵上计算SVD

来自分类Dev

使用sklearn为python中的变量n-gram计算TF-IDF

来自分类Dev

R和手计算中的不同tf-idf值

来自分类Dev

如何使TF-IDF矩阵密集？

来自分类Dev

在Python的Twitter数据框上使用放缩和Tf-Idf计算时出错

来自分类Dev

tf-idf 文档术语矩阵和 LDA：R 中的错误消息

来自分类Dev

如何计算查询的TF-IDF？

来自分类Dev

TF-IDF分数计算示例

来自分类Dev

如何计算查询的TF-IDF？

来自分类Dev

计算字符串和TF-IDF中字母的频率

来自分类Dev

R：将COO格式矩阵转换为常规矩阵格式

来自分类Dev

Greemlin中的TF-IDF算法

来自分类Dev

在python中以矩阵形式计算评级

来自分类Dev

Python中尺度矩阵（协方差矩阵）的高效计算

来自分类Dev

如何为要分类的单个新文档计算TF * IDF？

来自分类Dev

scikit-learn TfidfVectorizer如何计算TF-IDF

来自分类Dev

如何为字典列表计算tf-idf？

来自分类Dev

如何为要分类的单个新文档计算TF * IDF？

来自分类Dev

两个语料的TF-Idf计算

来自分类Dev

TF IDF分数“错误”

来自分类Dev

如何在 tf.python_io.tf_record_iterator 中为纪元设置一个数字

来自分类Dev

如何从sklearn中的TF * IDF值获取字数

来自分类Dev

从TF-IDF到Spark，Pyspark中的LDA群集

来自分类Dev

将Tf-idf用作CNN模型中的功能

来自分类Dev

在TF-IDF中结合Unigram和Bigram

来自分类Dev

使用TF-IDF在K均值中绘制质心

来自分类Dev

CSV文件中字符串的TF-IDF

来自分类Dev

什么是 tf-idf 中的文档和语料库？

来自分类Dev

scikit-learn中TF-IDF向量的分组特征

Related 相关文章

文章