我有一个带有关键字列的数据框。关键字列中还有2-7个关键字,以逗号分隔。例如:
URL Keywords
www.example.com "Keyword 1 , Keyword 2 , Keyword 3"
www.example2.com "Keyword 2, Keyword 4, Keyword 5"
.
.
.
我想要生成组合但只有两个的输出。我实际上需要“ TO”和“ FROM”的值进行可视化。我希望以这种方式输出
URL Keyword Combination
www.example.com Keyword 1, Keyword 2
www.example.com Keyword 1, Keyword 3
www.example.com Keyword 2, Keyword 1
www.example.com Keyword 2, Keyword 3
.
.
.
.
我认为ITERTOOLS是有可能的,但是我不确定如何实现这一目标。
尝试itertools.permutation
,itertools.chain
和df.explode
(对于熊猫> = 0.25.0):
>>> lst = [[','.join(p) for p in permutations(val.split(','),2)] for val in df['Keywords']]
>>> df['Keywords'] = lst
>>> df.explode('Keywords')
URL Keywords
0 www.example.com Keyword 1 , Keyword 2
0 www.example.com Keyword 1 , Keyword 3
0 www.example.com Keyword 2 ,Keyword 1
0 www.example.com Keyword 2 , Keyword 3
0 www.example.com Keyword 3,Keyword 1
0 www.example.com Keyword 3, Keyword 2
1 www.example2.com Keyword 2, Keyword 4
1 www.example2.com Keyword 2, Keyword 5
1 www.example2.com Keyword 4,Keyword 2
1 www.example2.com Keyword 4, Keyword 5
1 www.example2.com Keyword 5,Keyword 2
1 www.example2.com Keyword 5, Keyword 4
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句