向CountVectorizer矩阵添加其他功能

提姆

我陷入一个问题,我必须在scikit Learn的CountVectorizer函数创建的令牌计数列表中添加其他功能(平均字长)。说我有以下代码:

#list of tweets
texts = [(list of tweets)]

#list of average word length of every tweet
average_lengths = word_length(tweets)

#tokenizer
count_vect = CountVectorizer(analyzer = 'word', ngram_range = (1,1))
x_counts = count_vect.fit_transform(texts)

每个实例的格式应为(令牌,平均字长)。我最初的想法是使用zip函数将两个列表简单地串联起来:

x = zip(x_counts, average_lengths)

但是当我尝试拟合模型时出现错误:

ValueError: setting an array element with a sequence.   

有人知道如何解决这个问题吗?

安德烈

你可以写自己喜欢的变压器在这个文章,给你每鸣叫和使用的平均字长FeatureUnion

vectorizer = FeatureUnion([
        ('cv', CountVectorizer(analyzer = 'word', ngram_range = (1,1))),
        ('av_len', AverageLenVectizer(...))
    ])

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

向功能添加其他参数

来自分类Dev

根据保持矩阵名称顺序的其他矩阵的长度向数据矩阵添加零

来自分类Dev

webpack不会从其他文件向对象添加原型功能

来自分类Dev

无法通过其他功能向Java中的JTextArea添加文本

来自分类Dev

为什么使用System.Linq会向其他库添加功能

来自分类Dev

向Liferay添加其他语言属性

来自分类Dev

向其他属性添加过渡

来自分类Dev

如何向TeX添加其他语言

来自分类Dev

向foreach循环添加其他参数

来自分类Dev

向图表添加其他数据点

来自分类Dev

向ActiveRecord对象添加其他数据

来自分类Dev

向AngularJS添加其他货币格式

来自分类Dev

向Neptune DB添加其他属性

来自分类Dev

向图表添加其他数据点

来自分类Dev

向Liferay添加其他语言属性

来自分类Dev

向foreach循环添加其他参数

来自分类Dev

向网址添加其他参数

来自分类Dev

向CSS背景添加其他图像

来自分类Dev

向文件添加其他读写权限

来自分类Dev

向Trac插件添加其他文件

来自分类Dev

在Theano(CNN)中添加其他功能

来自分类Dev

在其他功能中添加Google转换功能

来自分类Dev

向列表添加矩阵

来自分类Dev

向列表添加矩阵

来自分类Dev

向JPA实体添加其他方法

来自分类Dev

向Jenkins Workflow类路径添加其他库

来自分类Dev

向MySQL查询添加其他条件导致空响应

来自分类Dev

从youtube向yt.player对象添加其他参数

来自分类Dev

jQuery向新Option添加其他数据