numpyを使用してデータセットを比例サブセットに分割します

Demaunt

このような機能があるのだろうか:

my_fun(my_list, *arg)
  • ここで、argはリストまたは比率です。
  • * argのすべての要素は、0から1までの浮動小数点値です。
  • arg要素の合計は<= 1でなければなりません

例えば:

my_list = ['a','b','c','d','f',1, 2, 3, 4, 5]
fun_i_am_looking_for (my_list, 0.4, 0.4, 0.1)
result = [['a', 2, 5, 'd'], ['c', 1, 4, 3], ['f']]

ご覧のとおり、合計argは0.9です。したがって、からの1つの要素my_listは結果に表示されません。

私はあることを知っています:

numpy.random.permutate(dataframe.index)

しかし、それはコレクションをランダム化するだけですが、比率またはパーセントとして定義された長さの小さなリストを取得したいと思います。サブリストを均等にしたくありません。そのような関数が存在しない場合、私は自分で作成し、すぐに使える解決策を探します。

マイクミュラー

すぐに解決できる解決策はないようですが、これはうまくいくでしょう:

import numpy as np

def split_by_ratio(arr, *ratios):
    arr = np.random.permutation(arr)
    ind = np.add.accumulate(np.array(ratios) * len(arr)).astype(int)
    return [x.tolist() for x in np.split(arr, ind)][:len(ratios)]

今:

>>> my_list = ['a','b','c','d','f',1, 2, 3, 4, 5]
>>> split_by_ratio(my_list, 0.4, 0.4, 0.1)
[['f', '5', '3', 'a'], ['d', 'b', 'c', '2'], ['4']]

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Lists.partitionまたはIterable.partitionを使用して、セットをサブセットに分割します

分類Dev

runifを使用してデータセットをトレーニングセットとテストセットに分割します

分類Dev

データセットをtrainに分割し、tensorflowを使用してテストします

分類Dev

Tidyverseメソッドを使用してデータセットを複数のテーブルに分割する

分類Dev

プロローグを使用してセットをn個のサブセットに分割する

分類Dev

Rを使用してデータフレームのサブセットをプロットしますか?

分類Dev

データを分割してトレインセットとテストセットを作成します-forループ-変数を行ごとにサブセットに挿入します

分類Dev

追加のトレイン列を使用してデータセットを2つの部分に分割します

分類Dev

パンダのデータフレームを相互に排他的なサブセットに分割します

分類Dev

データセットを60%、20%、20%に分割します

分類Dev

numpy配列からデータのサブセットを抽出します

分類Dev

リストをサブセット化し、各サブセットで関数を実行して、結果をデータフレームに配置します

分類Dev

データセットを複数の小さなデータセットに分割し、Rを使用してcsvファイルに書き込みます

分類Dev

$の論理ベクトルを使用してデータフレームをサブセット化します

分類Dev

リセットボタンを使用してテーブルのデータをリセットします

分類Dev

2つの変数を使用してデータをサブセット化し、要約します

分類Dev

コンパレータを使用してセットのサブセットを取得します

分類Dev

コンパレータを使用してセットのサブセットを取得します

分類Dev

numpyを使用して2次元インデックスのサブセットを取得します

分類Dev

numpyデータセットをnetCDFに変換します

分類Dev

貼り付けと!is.naを使用してデータフレームをサブセット化します

分類Dev

値の間隔を使用してデータフレームをサブセット化します

分類Dev

ggplot2を使用して、データをサブセット化し、折れ線グラフに2つの変数をプロットします。

分類Dev

lapplyを使用して、単一のデータフレームをRのデータフレームのリストにサブセット化します

分類Dev

文字列として渡された条件を使用してデータフレームをサブセット化します(データフレームを動的にサブセット化します)

分類Dev

データセットをデータフレームのネストされたリストに分割し、TidyrとPurrrを使用して拡散します

分類Dev

他のデータセットの2列の文字列を使用してビッグデータセットをサブセット化する

分類Dev

Rの列名への変数参照を使用して、データのサブセットをプルします

分類Dev

データのサブセットに対して機能を実行する

Related 関連記事

  1. 1

    Lists.partitionまたはIterable.partitionを使用して、セットをサブセットに分割します

  2. 2

    runifを使用してデータセットをトレーニングセットとテストセットに分割します

  3. 3

    データセットをtrainに分割し、tensorflowを使用してテストします

  4. 4

    Tidyverseメソッドを使用してデータセットを複数のテーブルに分割する

  5. 5

    プロローグを使用してセットをn個のサブセットに分割する

  6. 6

    Rを使用してデータフレームのサブセットをプロットしますか?

  7. 7

    データを分割してトレインセットとテストセットを作成します-forループ-変数を行ごとにサブセットに挿入します

  8. 8

    追加のトレイン列を使用してデータセットを2つの部分に分割します

  9. 9

    パンダのデータフレームを相互に排他的なサブセットに分割します

  10. 10

    データセットを60%、20%、20%に分割します

  11. 11

    numpy配列からデータのサブセットを抽出します

  12. 12

    リストをサブセット化し、各サブセットで関数を実行して、結果をデータフレームに配置します

  13. 13

    データセットを複数の小さなデータセットに分割し、Rを使用してcsvファイルに書き込みます

  14. 14

    $の論理ベクトルを使用してデータフレームをサブセット化します

  15. 15

    リセットボタンを使用してテーブルのデータをリセットします

  16. 16

    2つの変数を使用してデータをサブセット化し、要約します

  17. 17

    コンパレータを使用してセットのサブセットを取得します

  18. 18

    コンパレータを使用してセットのサブセットを取得します

  19. 19

    numpyを使用して2次元インデックスのサブセットを取得します

  20. 20

    numpyデータセットをnetCDFに変換します

  21. 21

    貼り付けと!is.naを使用してデータフレームをサブセット化します

  22. 22

    値の間隔を使用してデータフレームをサブセット化します

  23. 23

    ggplot2を使用して、データをサブセット化し、折れ線グラフに2つの変数をプロットします。

  24. 24

    lapplyを使用して、単一のデータフレームをRのデータフレームのリストにサブセット化します

  25. 25

    文字列として渡された条件を使用してデータフレームをサブセット化します(データフレームを動的にサブセット化します)

  26. 26

    データセットをデータフレームのネストされたリストに分割し、TidyrとPurrrを使用して拡散します

  27. 27

    他のデータセットの2列の文字列を使用してビッグデータセットをサブセット化する

  28. 28

    Rの列名への変数参照を使用して、データのサブセットをプルします

  29. 29

    データのサブセットに対して機能を実行する

ホットタグ

アーカイブ