2つのdfのインデックスが異なる場合の値の割り当て

debugcn 投稿 Dev

thomas.mac

私はこのように見える2つのdfを持っています：

Symbol Sector      Sub-industry    Company     Weight      SectorSymbol
Ticker           
MMM    Industrials  Conglomerates   MCompany    0.602676   XLI
ABT    Health Care  Equipment       Abbott Lab  0.401900   XLV
ABBV   Health Care  Pharmaceuticals AbbVie Inc  0.550174   XLV
ACN    Info Tech    Consulting      Accenture   0.370650   XLK
ATVI   Info Tech    Entertainment   Activision  0.192788   XLK

そして

                MMM     ABT     ABBV    ACN    ATVI
Date
2017-01-03      1.4     2.3     4.5     2.1    .7
2017-01-04      .8      3.1     5.2     1.8    1.2
2017-01-05      2.4     2.1     5.5     1.6    1.4

最初のdfで定義した「セクターシンボル」値を2番目のdf（MMM、ABT、ABBVなど）のティッカーに適用しようとしています。これにより、2番目のdfはシンボルMMMをXLIの一部として認識します。 XLVとしてのABTなど。

df1 = pd.DataFrame(
    {'Sector': ['Industrials'] + ['Health Care']*2 + ['Info Tech']*2,
     'Sub-industry': ['Conglomerates', 'Equipment', 'Pharmaceuticals', 'Consulting', 'Entertainment'],
     'Company': ['MCompany', 'Abbott Lab', 'AbbVie Inc', 'Accenture', 'Activision'],
     'Weight': [.602676, .4019, .550174, .37065, .192788],
     'SectorSymbol': ['XLI', 'XLV', 'XLV', 'XLK', 'XLK']},
    index=pd.Index(['MMM', 'ABT', 'ABBV', 'ACN', 'ATVI'], name='Symbol Ticker')
    )[['Sector', 'Sub-industry', 'Company', 'Weight', 'SectorSymbol']]

df2 = pd.DataFrame({'MMM': [1.4, .8, 2.4], 
                    'ABT': [2.3, 3.1, 2.1], 
                    'ABBV': [4.5, 5.2, 5.5], 
                    'ACN': [2.1, 1.8, 1.6], 
                    'ATVI': [.7, 1.2, 1.4]},
                  index=pd.Index(['2017-01-03', '2017-01-04', '2017-01-05'], name='Date')
                  )[['MMM', 'ABT', 'ABBV', 'ACN', 'ATVI']]

期待される出力には、ティッカーに割り当てられた数値が含まれます。プログラムは、そのティッカーを「XLI、XLV、XLK」の一部として認識するため、df2でMMMの値を検索すると、プログラムに表示されます。過剰な動き＃とその家族（XLI）

アレクサンダー

1）シンボルをセクターシンボルにマッピングする辞書を作成します。

2）リスト内包表記を使用して、関連するシンボルのすべてのセクターシンボルの順序付けられたマッピングを取得します。get辞書で使用して、マップされていない証券を許可します（以下のコメントを参照）。

3）groupbyセクター記号に使用し、平均を取ります。

d = df1['SectorSymbol'].to_dict()
sector_symbols = [d.get(symbol) for symbol in df2]
>>> df2.groupby(sector_symbols, axis=1).mean()
            XLI  XLK   XLV
Date                      
2017-01-03  1.4  1.4  3.40
2017-01-04  0.8  1.5  4.15
2017-01-05  2.4  1.5  3.80

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

2つのdfのインデックスが異なる場合の値の割り当て

2つのdfのインデックスが異なる場合の値の割り当て

インデックス値が別のdfのインデックスに近い場合、dfからデータを抽出する方法はありますか？

2つのスレッドを使用してC / C ++で異なる配列インデックスを操作する場合、同期が必要ですか？

Goの2つの値の割り当てが発生する場合と、1つの値の割り当てが発生する場合とでは、どのセマンティックルールが決定するのですか？

Goの構文またはセマンティックルールは、マップのキーアクセスが1値割り当てまたは2値割り当てにつながる場合を決定しますか？

頂点属性のインデックスが異なる場合の戦略

インデックスが見つからない場合のインデックスの値の検索

KeyError： '[]インデックスにない'インデックスの割り当てによってパンダの列の名前を変更する場合

2D配列の値の割り当てが機能しない-インデックスの交換

異なるインデックスを持つ一意の値に基づいて、1番目のデータフレームから2番目のデータフレームに値を更新することにより、各行を繰り返します。それ以外の場合は、新しいIDを追加して割り当てます。

インデックスの合計が何らかの値になるすべてのエントリに割り当てる

2つのインターフェイスの戻り値の型が競合している場合、なぜ1つのメソッドがデフォルトになるのですか？

1つの配列のみが参照されている場合、2つの異なるnumpy配列に同じ値が割り当てられます

PHP-配列内の2つの異なるインデックスに同じ行を割り当てるMySQLクエリ

v-forのインデックスが2の値と異なる場合は、行スパンを2にします。

インデックスレベルの数が異なる2つのMultiIndexDataFrameを結合する

改善方法：2つの合計整数の配列が与えられた場合、2つの数値のインデックスを返します...角度を使用して

2つの異なる配列からの特定のインデックスで2つの配列値を組み合わせる方法

フレックス方向の列ですが、デスクトップの順序が異なる2つの子が隣り合っています

インデックスは異なるが値が同じ2つの整数を減算する

PHP Simple HTML DOMは2つの異なるセルクラス（インライン）を取得しますが、1つは空の場合があります

あるシリーズを別のシリーズに割り当てたり、インデックスが交差しない場所でマージしたり、興味深いインデックスのシリーズの 1 つの値を保持したりするにはどうすればよいですか

インデックスの後に1つの値を持つリストを割り当てる

Javascriptマトリックスの割り当ては、塗りつぶしの場合とループを使用してマトリックスを作成する場合とで動作が異なります。どうして？

パンダ：日時インデックスの日付が異なる場合、ある列の値を別の列に追加する

Haskellは異なるインデックスの2つのリストの要素を組み合わせます

2つのボタンの値が異なる関数の場合

JavaScript-戻り値への配列インデックスの割り当てが機能しない

MySQLは2つの異なるインデックスに対して高速にクエリを実行しますが、1つのクエリに結合すると低速になります。どうして？

範囲から作成された2つのリストを異なるステップで組み合わせ、特定の数のインデックスに対して値を繰り返します