タプルのリスト内の一意のタプルの発生率を計算する

ハッサン・バイグ

求人広告のDjangoWebサイトプロジェクトの場合、(user_id, ad_id)ペアで構成されたタプルのリストがあります。これは、クリッカーのuser_id、および関連するを示しad_idます。

例えば:

gross_clicks = [(1, 13),(1, 12), (1, 13), (2, 45), (2, 13), (1, 15), ...(n, m)]

このリストの要素は決して一意ではありません。同じユーザーによるものか、同じ広告上にあるかに関係なく、クリックごとにこのリストにプッシュされます。

これで、次のようにして、すべての固有のクリックを取得できます。

unique_clicks = []
import operator
gross_click_ids = map(operator.itemgetter(0), gross_clicks)
return len(set(gross_click_ids))

しかし、広告ごと一意のクリックを取得するにはどうすればよいですか?つまり、同じユーザーが2つの異なる広告をクリックした場合、2回の個別のクリックとしてカウントされます。

パフォーマンスも重要です-それは大きなデータセットです-したがって、説明的な例とともに、最も効率的なソリューションを好むでしょう。

Martijn Pieters

ユニークなタプルを取るだけです:

unique_clicks = set(gross_clicks)

これにより、広告ごとのユニークユーザーインプレッションのセットが得られます。

サンプル入力では、(1, 13)は2回表示されますが、セットでは1回だけ表示されます。

>>> gross_clicks = [(1, 13), (1, 12), (1, 13), (2, 45), (2, 13), (1, 15)]
>>> set(gross_clicks)
{(1, 12), (1, 13), (1, 15), (2, 45), (2, 13)}

入力としてタプルの大規模なリストが与えられた場合、セットを使用して一意の要素を追跡することは、可能な限り効率的です(特定のタプルがすでにセットに含まれているかどうかのテストは、O(1)一定時間操作です)。

ただし、このデータがデータベースからのものである場合は、代わりに一意のペアを提供するように依頼する方が効率的です。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

タプルのリスト内の要素をPythonで一意にする効率的な方法は何ですか?

分類Dev

リストの列内の一意の文字列ごとに一意の番号をマップするための最も計算効率の高い方法

分類Dev

Python-タプル-タプルのリスト内の一意の要素を取得します

分類Dev

ネストされたリスト内の一意のタプルを数える

分類Dev

Scala:タプルのリストから一意の値を見つける

分類Dev

R:Rのデータセット内の一意の個人ごとに、過去の特定の期間内の発生数を計算します

分類Dev

セット内の一意の順列を効率的に計算する

分類Dev

タプルのリストから一意の要素を取得する際の問題

分類Dev

Pythonのタプルのリストから一意の組み合わせを保持する

分類Dev

タイムスタンプ条件に基づいて配列内の一意のオブジェクトをフィルタリングする

分類Dev

タプルの最初の値によるタプルの一意のリスト

分類Dev

タプル内の順序に関係なく、タプルの一意のリストを検索します

分類Dev

パンダ:グループ内の一意の値をフィルタリングする

分類Dev

すべての一意のタプルを選択するSQLクエリ

分類Dev

インターフェイスで計算されたプロパティ名は、タイプがリテラルタイプまたは「一意のシンボル」タイプである式を参照する必要があります

分類Dev

2タプルのタプルで一意の文字列を印刷する

分類Dev

mySQLがグループ内の一意の値のリストを取得する

分類Dev

タプルのリストから一意のリストを見つける

分類Dev

一意のグループの組み合わせで発生をカウントする

分類Dev

タプルのリストの一意の組み合わせ

分類Dev

ループ内で匿名メソッドを使用して一意のデリゲートをインスタンス化する方法(C#)?

分類Dev

データフレーム内のすべての一意のヒストグラムを作成するためのForループ

分類Dev

ネストされたフィールドのすべての一意の値の周波数カウンターを計算する

分類Dev

グループ内のすべての一意の集計を返す

分類Dev

Rのリスト内の要素の一意のペアをループします

分類Dev

Pythonセットから一意のタプルを取得する

分類Dev

列内の一意の発生をカウントし、結果を日付でグループ化する必要があります

分類Dev

文字列のセットの最短の一意のプレフィックスを計算する方法は?

分類Dev

forループを使用してmatplotlibのサブプロットに一意のタイトルを追加する

Related 関連記事

  1. 1

    タプルのリスト内の要素をPythonで一意にする効率的な方法は何ですか?

  2. 2

    リストの列内の一意の文字列ごとに一意の番号をマップするための最も計算効率の高い方法

  3. 3

    Python-タプル-タプルのリスト内の一意の要素を取得します

  4. 4

    ネストされたリスト内の一意のタプルを数える

  5. 5

    Scala:タプルのリストから一意の値を見つける

  6. 6

    R:Rのデータセット内の一意の個人ごとに、過去の特定の期間内の発生数を計算します

  7. 7

    セット内の一意の順列を効率的に計算する

  8. 8

    タプルのリストから一意の要素を取得する際の問題

  9. 9

    Pythonのタプルのリストから一意の組み合わせを保持する

  10. 10

    タイムスタンプ条件に基づいて配列内の一意のオブジェクトをフィルタリングする

  11. 11

    タプルの最初の値によるタプルの一意のリスト

  12. 12

    タプル内の順序に関係なく、タプルの一意のリストを検索します

  13. 13

    パンダ:グループ内の一意の値をフィルタリングする

  14. 14

    すべての一意のタプルを選択するSQLクエリ

  15. 15

    インターフェイスで計算されたプロパティ名は、タイプがリテラルタイプまたは「一意のシンボル」タイプである式を参照する必要があります

  16. 16

    2タプルのタプルで一意の文字列を印刷する

  17. 17

    mySQLがグループ内の一意の値のリストを取得する

  18. 18

    タプルのリストから一意のリストを見つける

  19. 19

    一意のグループの組み合わせで発生をカウントする

  20. 20

    タプルのリストの一意の組み合わせ

  21. 21

    ループ内で匿名メソッドを使用して一意のデリゲートをインスタンス化する方法(C#)?

  22. 22

    データフレーム内のすべての一意のヒストグラムを作成するためのForループ

  23. 23

    ネストされたフィールドのすべての一意の値の周波数カウンターを計算する

  24. 24

    グループ内のすべての一意の集計を返す

  25. 25

    Rのリスト内の要素の一意のペアをループします

  26. 26

    Pythonセットから一意のタプルを取得する

  27. 27

    列内の一意の発生をカウントし、結果を日付でグループ化する必要があります

  28. 28

    文字列のセットの最短の一意のプレフィックスを計算する方法は?

  29. 29

    forループを使用してmatplotlibのサブプロットに一意のタイトルを追加する

ホットタグ

アーカイブ