検索

検索

列の値が複数のデータフレームに存在するかどうかを確認します

debugcn 投稿 Dev

2

シュバムR

私は4つのExcelファイルを持っています-'a1.xlsx '、' a2.xlsx '、' a3.xlsx '、' a4.xlsx 'ファイルの形式は同じです

たとえば、a1.xlsxは次のようになります。

id    code    name
1      100    abc
2      200    zxc
...    ...    ...

pandasデータフレームでこのファイルを読み取り、同じ値のcode列が複数のExcelファイルに存在するかどうかを確認する必要があります。

このようなもの。

にcode=100存在し'a1.xlsx','a3.xlsx'、にcode=200のみ存在する場合'a1.xlsx'

最終的なデータフレームは次のようになります。

code    filename
100   a1.xlsx,a3.xlsx
200   a1.xlsx
...   ....
and so on

ディレクトリにすべてのファイルがあり、ループを介してそれらを反復しようとしました

import pandas as pd
import os
x = next(os.walk('path/to/files/'))[2]  #list all files in directory
os.chdir('path/to/files/')

for i in range (0,len(x)):
    df = pd.read_excel(x[i])

どうやって進める？リードはありますか？

ジェズリール

使用する：

import glob 

#get all filenames 
files = glob.glob('path/to/files/*.xlsx')
#list comprehension with assign new column for filenames
dfs = [pd.read_excel(fp).assign(filename=os.path.basename(fp).split('.')[0]) for fp in files]
#one big df from list of dfs
df = pd.concat(dfs, ignore_index=True)
#join all same codes
df1 = df.groupby('code')['filename'].apply(', '.join).reset_index()

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

0

コメントを追加

0

サインイン

関連記事

分類Dev

別のデータフレームに複数の行が存在するかどうかを確認します

分類Dev

あるデータフレームの値（複数の列）が別のデータフレームの値（複数の列）に存在するかどうかを確認します

分類Dev

データフレームに正の値が存在するかどうかを確認します

分類Dev

値がrデータフレームの値の配列にあるかどうかを確認します

分類Dev

Spark（scala）データフレーム-列の文字列が別のデータフレームの列に存在するかどうかを確認します

分類Dev

pandasデータフレーム列の値が別の列に存在するかどうかを確認します。isinメソッドが機能しない

分類Dev

データフレーム内の値が条件付きの別のデータフレームに存在するかどうかを確認します

分類Dev

あるデータフレームの値が別のデータフレームに存在するかどうかを確認します

分類Dev

データフレームの各行について、重複する値が存在するかどうかを確認します

分類Dev

データフレーム列の値がRのリストに存在するかどうかを確認します

分類Dev

Rデータフレームの値が一致するかどうか複数の列を確認します

分類Dev

pandasデータフレームの列値がシリーズに存在するかどうかを確認します

分類Dev

文字列値が別のデータフレームに存在しないかどうかを確認するにはどうすればよいですか？

分類Dev

複数の部分文字列がパンダのデータフレームにあるかどうかを確認します

分類Dev

pandasデータフレームは、列に別の列に存在する文字列が含まれているかどうかを確認します

分類Dev

1つのデータフレームの名前が他のデータフレームのPythonに存在するかどうかを確認します

分類Dev

列の値が複数のテーブルに存在するかどうかを確認します

分類Dev

列のペアがデータフレームの行にあるかどうかを確認します

分類Dev

1 つのデータフレーム行のすべての値が別のデータフレームに存在するかどうかを確認する

分類Dev

データフレーム内の特定の行グループに値が存在するかどうかを確認します

分類Dev

正確な文字列がパンダのデータフレームに存在するかどうかを確認します

分類Dev

あるデータフレームが別のデータフレームに存在するかどうかを確認します

分類Dev

データフレーム列のすべての値が同じかどうかを確認します

分類Dev

文字列がパンダのデータフレームにあるかどうかを確認します

分類Dev

データフレームの値が別のフレームに存在するかどうかを確認し、重複を考慮して特定の方法で値を設定します

分類Dev

パンダ-特定の条件に基づいて、データフレームに値が存在するかどうかを確認します

分類Dev

Python：データフレームのいずれかの列に対して行に同じ値が複数あるかどうかを確認し、ある場合は、繰り返される値をnullに置き換えます

分類Dev

あるデータフレームの値がRの別のデータフレームにあるかどうかを確認します

分類Dev

各IDおよび各行のデータフレームの列にIDが存在するかどうかを確認します

Related 関連記事

記事

ホットタグ

アーカイブ