非構造化Excelファイルを構造化ファイルに変換しようとしています。私のヘッダーは2行(1と2)にパンしますヘッダーのSKU、数量、販売
A B C D
1 Qty Sales
2 SKU
3 2345 Nail Varnish 2 $15
4 2346 Eye liner 3 $18
データフレームに変換された後の希望の出力は次のようになります
SKU Description Qty Sales
0 2345 Nail Varnish 2 $15
1 2346 Eye liner 3 $18
read_excel
関数のヘッダーとして複数の行を渡してみました
df = pd.read_excel('D:\Sales.xlsx',header=[1,2])
しかし、出力を次のように取得しています
Unnamed:0_level_0 Unnamed:1_level_0 Qty Sales
SKU SKU Unnamed:2_level_1 Unnamed:3_level_1
0 2345 Nail Varnish 2 $15
1 2346 Eyeliner 3 $18
ヘッダーSKU
は2番目の列にも適用されています。これをトラブルシューティングする方法をガイドしてください。
事前に列名を知っている場合は、次のことができます。
df = pd.read_excel('D:\Sales.xlsx', header=None, names=['SKU','Description','Qty','Sales'], skiprows=2)
説明
header=None
Excelファイルからデフォルトのヘッダーを取得しませんnames
列名をデータフレームに順番に割り当てますskiprows
Excelから最初の2行をスキップします。この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加