pandasデータフレームに関数を適用して、他の列/セルに応じて列/セルのリストをスキャンします

debugcn 投稿 Dev

トーマス

pandasデータフレームから行をスキャンしているときに問題が発生しました。私は修正（列があります、データフレーム内のいくつかの入力データを持っているTime、IDとframes）。今、私はそれからいくつかの結果を得ようとしています。タイムスタンプごとに1つ以上のLINIDを取得し、LIN IDごとに、文字列として8データバイトのLINフレームを1つ取得します。このデータ文字列は、一部のセンサーからの生の値を表します。

次に、各行をスキャンしてLIN IDとそれに対応するLINフレームを見つけ、生のセンサー値を計算して、この値pandasを新しい列としてデータフレームに格納します。私の問題は、各行にIDのリストとLINフレームのリストが表示されることです。私の質問は、セル内のこれらのリストから正しい値を取得するにはどうすればよいですか？それは可能applyですか、それとももっと簡単な方法がありますか？

私はこのフォーラムに不慣れでpython初心者なので、それを十分に説明したことを願っています。誰かが次のソースコードを見て、正しい方法を教えてもらえますか？

期待される出力の写真は次のとおりです：https：//imgur.com/JhLJQZW

from binascii import unhexlify

import numpy as np
import pandas as pd
import sys


def getVal(data, btn):
    '''
    Calculate 2-byte hex data to float value LSB first
    '''
    try:
        mydata = bytearray(unhexlify(data))
        b = (btn - 1) * 2

        # swap byteorder
        val = (mydata[b + 1] << 8) + mydata[b]

    except:
        val = np.nan

    return val


if __name__ == '__main__':

    # I get data in this form
    # 'Time':    one set of data every 7ms
    # 'ID':      list of LIN Ids at each timestamp
    # 'frames' : list of frames at each timestamp

    #=======================================================================
    # This has the correct input data, but did not works
    #=======================================================================
    df1 = pd.DataFrame(data={'Time': [0, 0.007, 0.014, 0.021, 0.028, 0.035, 0.042, 0.049, 0.056, 0.063],
                        'ID': [['11', '12', '14'], ['12'], ['13'], ['14'], [], [], ['11'], ['12'], ['13'], ['14']],
                        'frames': [['25186617A819AB19', 'B31A031A5F1ADF1A', 'AD18D517DD150000'], ['07D06617a719ab19'], ['0BB86617a719ab19'], ['0FA06617a719ab19'], [], [], ['33186617a719ab19'], ['33186617a719ab19'], ['33186617a719ab19'], ['33186617a719ab19']]})

    # build names Btn_0_raw up to Btn_15_raw as column names
    names = ["Btn_{}_raw".format(x) for x in range(16)]

    # LIN IDs to search for
    linIDs = ['11', '12', '13', '14']

    # show values to check they are correct
#     print names
#     print df1["Time"].head()
#     print df1.iloc[:]
#     print df1["frames"].head()
#              

    error = False

    # #loop over 16 buttons
    for btn in range(16):  

        # show that all variables are correct; 
        # use constant hex data for each button group of 4 button; 
        # values are (100,200,300,400) (0x0064,0x00c8,0x012c,0x0190)
        print "{0}:{1}, ID({2}), bytePos({3}), demo value:{4}".format(btn, names[btn], linIDs[btn / 4], (btn % 4) + 1, getVal('6400C8002c019001', (btn % 4) + 1)) 

        try:
            df1[names[btn]] = df1['frames'].where(linIDs[btn / 4] in df1['ID'], np.nan).apply(lambda x: getVal(x, (btn % 4) + 1))
        except ValueError as e:
            print " Value error :", e
            error = True

    if not error:
        df1.to_excel('test-1.xls')



    #===========================================================================
    # An example that works, but unfortunately this input data are incorrect
    #===========================================================================
    df2 = pd.DataFrame(data={'Time': [0, 0.007, 0.014, 0.021, 0.028, 0.035, 0.042, 0.049, 0.056, 0.063],
                            'ID': ['11', '12', '13', '14', np.nan, np.nan, '11', '12', '13', '14'],
                            'frames': ['6400C8002c019001', '6500C9002d019101', '6600CA002e019201', '6700CB002F019301', '', '', '6400C8002c019001', '6500C9002d019101', '6600CA002e019201', '6700CB002F019301']
                            })

    error = False

    # loop over 16 buttons
    for btn in range(16):  

        # show that all variables are correct; 
        print "{0}:{1}, ID({2}), bytePos({3}), demo value:{4}".format(btn, names[btn], linIDs[btn / 4], (btn % 4) + 1, getVal('6400C8002c019001', (btn % 4) + 1)) 

        try:
            df2[names[btn]] = df2['frames'].where(df2['ID'] == linIDs[btn / 4] , np.nan).apply(lambda x: getVal(x, (btn % 4) + 1))
            print df2[names[btn]]
        except ValueError as e:
            print " Value error :", e
            error = True

    if not error:
        df2.to_excel("test-2.xls")

black_fm

データをボタンに対応する列に分割する方法を示します。入力データを変更して、画面にうまく収まるようにしました。

import pandas as pd

names = ["B_{}".format(x) for x in range(16)]
df1 = pd.DataFrame(data={'Time': [0, 0.007, 0.014, 0.021, 0.028, 0.035, 0.042, 0.049, 0.056, 0.063],
                    'ID': [['11', '12', '14'], ['12'], ['13'], ['14'], [], [], ['11'], ['12'], ['13'], ['14']],
                    'frames': [['2518', 'B31A', 'AD18'], ['07D0'], ['0BB8'], ['0FA0'], [], [], ['3318'], ['3318'], ['3318'], ['3318']]})

df_new = pd.DataFrame(df1, columns=['Time'] + names)
for index, row in df1.iterrows():
    # copying whatever data you already have in the old dataframe
    df_new.loc[index] = row
    # for every button ID set value in corresponding column
    for ID, value in zip(row['ID'], row['frames']):
        df_new.loc[index, names[int(ID)]] = value

df1

             ID   Time              frames
0  [11, 12, 14]  0.000  [2518, B31A, AD18]
1          [12]  0.007              [07D0]
2          [13]  0.014              [0BB8]
3          [14]  0.021              [0FA0]
4            []  0.028                  []
5            []  0.035                  []
6          [11]  0.042              [3318]
7          [12]  0.049              [3318]
8          [13]  0.056              [3318]
9          [14]  0.063              [3318]

df_new（空でない列のみを表示）

    Time  B_11  B_12  B_14  B_13
0  0.000  2518  B31A  AD18   NaN
1  0.007   NaN  07D0   NaN   NaN
2  0.014   NaN   NaN   NaN  0BB8
3  0.021   NaN   NaN  0FA0   NaN
4  0.028   NaN   NaN   NaN   NaN
5  0.035   NaN   NaN   NaN   NaN
6  0.042  3318   NaN   NaN   NaN
7  0.049   NaN  3318   NaN   NaN
8  0.056   NaN   NaN   NaN  3318
9  0.063   NaN   NaN  3318   NaN

ではdf_new.loc[index, names[int(ID)]] = valueステップあなたは適用することができますgetValしvalue、これは、私は信じて、あなたが必要な結果を生成します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-1

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

pandasデータフレームに関数を適用して、他の列/セルに応じて列/セルのリストをスキャンします

pandasデータフレームに関数を適用して、他の列/セルに応じて列/セルのリストをスキャンします

他の列の値に基づいて、列のデータフレーム行のサブセットに関数を適用します

リスト内のすべてのデータフレームの特定の列に関数を適用してから、列に値を割り当てます

インデックスと列に基づいてデータフレーム内のすべてのセルに関数を適用する

データフレームのリストの列に関数を適用し、結果を追加します

データフレームの列に関数を適用します（列はリストです）

データフレームの列に関数を適用します（列はリストです）

データフレームのリストの特定の列に関数を適用します

リスト内のデータフレームの列にいくつかの関数を適用します

データフレームをフラット化し、列の値をリストに結合して、個々のセルにデータを入力します

データフレームのリストを使用して列名に関数を適用します

optim（）を使用して、データフレームのリストに関数を適用します

ループ内の列のリストに関数を適用し、データフレームを出力します

同じ行の他の列の値に基づいてデータフレーム列要素に関数を適用しますか？

ベクトル出力を持つ関数をデータフレームのリストに適用します

pandasデータフレームの特定のセルについて、リストの要素を削除します

他の列の値に応じてデータフレームの列の値を変更します（値はリストから取得されます）

データフレームのリスト内の対応する要素に関数を適用します

一致関数を適用して、名前付きデータフレームのリストに列を追加します

データフレーム列に関数を適用して、他のいくつかの列を取得しますPandas Python

グループ化されたセットに関数を適用し、列を既存のデータフレームにバインドする方法

パンダのデータフレームのすべての列に関数を適用します

インデックスと列の値を入力として、パンダのデータフレームに要素ごとの関数を適用します

2つの列に応じてデータフレームを分割し、サブグループにいくつかの操作を適用します

pandasデータフレームの各列に関数を適用します

データフレームのすべてのセルに関数を適用して新しいデータフレームを作成する

mutate（）を使用して、他の列の任意のセットの関数として列をデータフレームに追加します

ループ関数を使用して、データフレームをデータフレームのリストにフィルタリングします

ループから関数を計算して、データフレームのリストに適用します

文字列のリストを使用してRのデータフレーム変数にアクセスする