次のようなデータフレームがあります。
'0' '1' '2'
0 5 4 0
1 3 0 0
2 1 0 2
列の名前(「0」、「1」、「2」、...)がユーザーIDを表し、インデックスが映画IDを表し、各エントリがユーザーによってその映画に与えられた評価を示します。
前のデータフレームに基づいて、次のような新しいデータフレームを作成したいと思います。
user_id movie_id rating
0 0 0 5
1 0 1 3
2 0 2 1
3 1 0 4
4 1 1 0
5 1 2 0
6 2 0 0
7 2 1 0
8 2 2 2
私はパンダに不慣れで、すべてのエントリを繰り返さずにこれを行う方法を考えていました。
stack()
、で簡単に取得できますreset_index()
。
df = df.stack().reset_index()
df.columns = ['user_id','movie_id','rating']
print(df)
user_id movie_id rating
0 0 0 5
1 0 1 4
2 0 2 0
3 1 0 3
4 1 1 0
5 1 2 0
6 2 0 1
7 2 1 0
8 2 2 2
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加