Python熊猫对字母数字进行排序

debugcn 发表于 Dev

乔戈斯

我试图在python中对txt文件进行排序，其中包含有关电影的一些信息（取自https://datasets.imdbws.com/）。我一直在研究的小样本是：

titleId ordering    title   region  language    types   attributes  isOriginalTitle
tt1037178   1   Women's Studies US  \N  \N  \N  0
tt10371782  1   Episodio #1.67  IT  it  \N  \N  0
tt10371782  2   एपिसोड #1.67    IN  hi  \N  \N  0
tt10371782  3   エピソード #1.67 JP  ja  \N  \N  0
tt10371790  4   एपिसोड #1.70    IN  hi  \N  \N  0
tt10371790  5   エピソード #1.70 JP  ja  \N  \N  0
tt10371790  6   Épisode #1.70   FR  fr  \N  \N  0
tt10371790  7   Folge #1.70 DE  de  \N  \N  0
tt1037179   1   Wood Simps  US  \N  \N  \N  0

我正在使用以下代码进行排序：

import pandas
df = pandas.read_csv('title.akas_test_input.txt', sep='\t', low_memory=False)
a=df.sort_values("titleId", ascending=True)
a.to_csv("title.akas_test_output.txt", sep='\t', index=None)

输出为：

titleId ordering    title   region  language    types   attributes  isOriginalTitle
tt1037178   1   Women's Studies US  \N  \N  \N  0
tt10371782  1   Episodio #1.67  IT  it  \N  \N  0
tt10371782  2   एपिसोड #1.67    IN  hi  \N  \N  0
tt10371782  3   エピソード #1.67 JP  ja  \N  \N  0
tt1037179   1   Wood Simps  US  \N  \N  \N  0
tt10371790  4   एपिसोड #1.70    IN  hi  \N  \N  0
tt10371790  5   エピソード #1.70 JP  ja  \N  \N  0
tt10371790  6   Épisode #1.70   FR  fr  \N  \N  0
tt10371790  7   Folge #1.70 DE  de  \N  \N  0

而我的预期输出将是这样的：

titleId ordering    title   region  language    types   attributes  isOriginalTitle
tt1037178   1   Women's Studies US  \N  \N  \N  0
tt1037179   1   Wood Simps  US  \N  \N  \N  0
tt10371782  1   Episodio #1.67  IT  it  \N  \N  0
tt10371782  2   एपिसोड #1.67    IN  hi  \N  \N  0
tt10371782  3   エピソード #1.67 JP  ja  \N  \N  0
tt10371790  4   एपिसोड #1.70    IN  hi  \N  \N  0
tt10371790  5   エピソード #1.70 JP  ja  \N  \N  0
tt10371790  6   Épisode #1.70   FR  fr  \N  \N  0
tt10371790  7   Folge #1.70 DE  de  \N  \N  0

我究竟做错了什么？

NRJ

问题是您的列具有字符串类型。对该类型的列进行排序将返回词典顺序。为了您的目的，我将首先提取带有数字的部分，然后再对其进行排序。例如：

df['titleId_number']=df['titleId'].apply(lambda x: int(x.split('tt')[1]))
df.sort_values('titleId_number')

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何对字母数字大熊猫索引的降序进行排序。

来自分类Dev

用字母和数字在python中对表格进行排序

来自分类Dev

python：如何对字母和数字列表进行排序

来自分类Dev

熊猫按包含数字和字母的列对数据框进行排序

来自分类Dev

Python尝试对列表进行数字排序后按字母顺序对列表进行排序

来自分类Dev

用数字和字母对列表进行排序

来自分类Dev

使用jQuery进行字母数字排序

来自分类Dev

在 SQL Server 中对字母数字进行排序

来自分类Dev

如何进行字母数字排序

来自分类Dev

在python中排序-如何对包含字母数字值的列表进行排序？

来自分类Dev

如何按字母顺序对字母数字列表进行排序

来自分类Dev

如何根据数字对字母数字列表进行排序

来自分类Dev

如何在shell中按数字对字母数字进行排序

来自分类Dev

在python中的字母后对字符串列表和位置数字进行排序

来自分类Dev

用字母数字对Python中混合数据类型的嵌套列表进行排序

来自分类Dev

对具有字母数字值的字符串数组进行排序（Python3）

来自分类Dev

SQl Server：首先对字母数字进行排序，然后再对数字进行排序

来自分类Dev

通过字母数字列对PySide.QtGui.QTreeWidget进行排序

来自分类Dev

如何对字母数字字符串进行排序

来自分类Dev

在iOS中对包含字母数字单词的数组进行排序

来自分类Dev

字母数字在JavaScript中对数组进行排序

来自分类Dev

Excel用字母前缀对数字进行排序

来自分类Dev

使用Java脚本对字母数字数组进行排序

来自分类Dev

如何使用javascript对字母数字列表进行排序

来自分类Dev

用php和preg_match进行字母数字排序

来自分类Dev

在Perl中对混合文本行（字母数字）进行排序

来自分类Dev

用字母和数字对varchar进行排序-PostgreSQL

来自分类Dev

按字母数字顺序对 javascript 数组进行排序

来自分类Dev

按字母和数字顺序对 .Getfiles 进行排序

Related 相关文章

文章