データをグループ化した後、データフレームで空の文字列を検索中にエラーが発生しました

shafeeq rahaman

私はタイタニックデータセットで遊んでいて、最近学んだ基本を適用していて、以下のエラーに直面しました。以下のシナリオを見つけてください。

titanic <- fread("titanic3.csv")

次に、特定の列の空の文字列をチェックしようとしました

titanic[embarked==""]

この列に空の文字列があるとして3行を取得します。

次に、年齢に欠測値(NA)があることがわかったので、平均を取り、欠測した年齢の値を性別に置き換えました。

titanic <- titanic %>% group_by(sex) %>% mutate(age=if_else(is.na(age), mean(age, na.rm = TRUE), age))

この後、View(titanic)で、データフレームの「boat」列にも空の文字列があることに気付きました。

したがって、「embarked」列の最初のクエリと同様に、次のクエリを使用して「boat」列の空の文字列を見つけようとしました。これにより、NAに置き換えることができますが、次のようなエラーメッセージが表示されます。

titanic[boat=='']
Error in `[.data.frame`(titanic, boat == "") : object 'boat' not found

タイタニックデータフレームの「age」列を平均年齢値で更新した後にのみ、このエラーメッセージが表示されることに気付きました。しかし、データフレームを更新する前にこれと同じコードを実行すると、このエラーメッセージは表示されません。

なぜこのエラーや間違いが発生するのか理解できません。

スタインロー

whichステートメントを試してください:

library(tidyverse)
titanic <- fread("titanic3.csv")

titanic <- titanic %>% group_by(sex) %>% mutate(age=if_else(is.na(age), mean(age, na.rm = TRUE), age))

titanic[which(titanic$boat == ''),]

出力:

# A tibble: 823 x 14
# Groups:   sex [2]
   pclass survived                                            name    sex      age sibsp parch   ticket     fare   cabin embarked  boat  body
    <int>    <int>                                           <chr>  <chr>    <dbl> <int> <int>    <chr>    <dbl>   <chr>    <chr> <chr> <chr>
 1      1        0                    Allison, Miss. Helen Loraine female  2.00000     1     2   113781 151.5500 C22 C26        S            
 2      1        0            Allison, Mr. Hudson Joshua Creighton   male 30.00000     1     2   113781 151.5500 C22 C26        S         135
 3      1        0 Allison, Mrs. Hudson J C (Bessie Waldo Daniels) female 25.00000     1     2   113781 151.5500 C22 C26        S            
 4      1        0                          Andrews, Mr. Thomas Jr   male 39.00000     0     0   112050   0.0000     A36        S            
 5      1        0                         Artagaveytia, Mr. Ramon   male 71.00000     0     0 PC 17609  49.5042                C          22
 6      1        0                          Astor, Col. John Jacob   male 47.00000     1     0 PC 17757 227.5250 C62 C64        C         124
 7      1        0                             Baumann, Mr. John D   male 30.58523     0     0 PC 17318  25.9250                S            
 8      1        0                        Baxter, Mr. Quigg Edmond   male 24.00000     0     1 PC 17558 247.5208 B58 B60        C            
 9      1        0                             Birnbaum, Mr. Jakob   male 25.00000     0     0    13905  26.0000                C         148
10      1        0                    Blackwell, Mr. Stephen Weart   male 45.00000     0     0   113784  35.5000       T        S            
# ... with 813 more rows, and 1 more variables: home.dest <chr>

ミューテーションによってデータ型がdata.tableからgrouped_dfに変更されるため、同じステートメントは機能しません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

sqliteデータベースでデータを検索中にエラーが発生しました

分類Dev

Pythonデータフレームで列を選択中にエラーが発生しました

分類Dev

グループ化されたデータ処理後にデータフレームに新しい列を追加するときにエラーが発生しました

分類Dev

djangoテンプレートの列ごとにデータをフィルタリング中にエラーが発生しました

分類Dev

pysparkデータフレームにデータを挿入中にエラーが発生しました

分類Dev

空のデータフレームにデータを挿入しようとしたときにエラーが発生しました

分類Dev

Sparkでデータフレームを作成中にエラーが発生しました

分類Dev

pandasデータフレームで条件値を使用中にエラーが発生しました

分類Dev

複数のパンダデータフレームを連結中にエラーが発生しました

分類Dev

pandasデータフレームを使用してcsvからテーブルにデータをロード中にエラーが発生しました

分類Dev

データフレームpythonからカスタマイズ辞書を作成中に文字列インデックスエラーが発生しました

分類Dev

ベクトルのデータフレームの数列の生成中にエラーが発生しました

分類Dev

アップグレード中にエラーが発生したデータベースのIDを検索する

分類Dev

データフレームから棒グラフの上に折れ線グラフを作成中にエラーが発生しました

分類Dev

集計関数を使用してデータフレームを生成した後、列の名前を変更するとエラーが発生しました

分類Dev

タイムスタンプを列として使用しているが名前がない空のデータフレームの作成中にエラーが発生しました

分類Dev

外部キーが原因でパンダデータフレームをテーブルに挿入中にエラーが発生しました

分類Dev

dplyrをループで使用してデータフレームを作成するときにエラーが発生しました

分類Dev

ResultSetを使用したデータのレンダリング中にエラーが発生しました

分類Dev

パンダのデータフレーム列:文字列値を数値に置き換えているときにエラーが発生しました

分類Dev

データフレームで性別を呼び出すときにエラーが発生しました

分類Dev

データフレームから Hive テーブルにデータを保存しようとしたときにエラーが発生しました

分類Dev

Rで商品のデータをプル中に「Quandl」でエラーが発生しました

分類Dev

JSONファイルをパンダデータフレームにフィッティング中にエラーが発生しました

分類Dev

フォームにデータを表示中にajax関数でエラーが発生しました

分類Dev

データフレームを列でグループ化し、文字列を別の列に連結します

分類Dev

jQueryを使用してフォームデータを介してファイルをアップロード中にエラーが発生しました

分類Dev

文字列をintに変換中にデータリーダーエラーが発生しました

分類Dev

2つのデータフレームをマージし、「新しい」列に値を割り当てるときにエラーが発生しました

Related 関連記事

  1. 1

    sqliteデータベースでデータを検索中にエラーが発生しました

  2. 2

    Pythonデータフレームで列を選択中にエラーが発生しました

  3. 3

    グループ化されたデータ処理後にデータフレームに新しい列を追加するときにエラーが発生しました

  4. 4

    djangoテンプレートの列ごとにデータをフィルタリング中にエラーが発生しました

  5. 5

    pysparkデータフレームにデータを挿入中にエラーが発生しました

  6. 6

    空のデータフレームにデータを挿入しようとしたときにエラーが発生しました

  7. 7

    Sparkでデータフレームを作成中にエラーが発生しました

  8. 8

    pandasデータフレームで条件値を使用中にエラーが発生しました

  9. 9

    複数のパンダデータフレームを連結中にエラーが発生しました

  10. 10

    pandasデータフレームを使用してcsvからテーブルにデータをロード中にエラーが発生しました

  11. 11

    データフレームpythonからカスタマイズ辞書を作成中に文字列インデックスエラーが発生しました

  12. 12

    ベクトルのデータフレームの数列の生成中にエラーが発生しました

  13. 13

    アップグレード中にエラーが発生したデータベースのIDを検索する

  14. 14

    データフレームから棒グラフの上に折れ線グラフを作成中にエラーが発生しました

  15. 15

    集計関数を使用してデータフレームを生成した後、列の名前を変更するとエラーが発生しました

  16. 16

    タイムスタンプを列として使用しているが名前がない空のデータフレームの作成中にエラーが発生しました

  17. 17

    外部キーが原因でパンダデータフレームをテーブルに挿入中にエラーが発生しました

  18. 18

    dplyrをループで使用してデータフレームを作成するときにエラーが発生しました

  19. 19

    ResultSetを使用したデータのレンダリング中にエラーが発生しました

  20. 20

    パンダのデータフレーム列:文字列値を数値に置き換えているときにエラーが発生しました

  21. 21

    データフレームで性別を呼び出すときにエラーが発生しました

  22. 22

    データフレームから Hive テーブルにデータを保存しようとしたときにエラーが発生しました

  23. 23

    Rで商品のデータをプル中に「Quandl」でエラーが発生しました

  24. 24

    JSONファイルをパンダデータフレームにフィッティング中にエラーが発生しました

  25. 25

    フォームにデータを表示中にajax関数でエラーが発生しました

  26. 26

    データフレームを列でグループ化し、文字列を別の列に連結します

  27. 27

    jQueryを使用してフォームデータを介してファイルをアップロード中にエラーが発生しました

  28. 28

    文字列をintに変換中にデータリーダーエラーが発生しました

  29. 29

    2つのデータフレームをマージし、「新しい」列に値を割り当てるときにエラーが発生しました

ホットタグ

アーカイブ