Rでマージされたデータテーブルから余分な行を見つける

debugcn 投稿 Dev

sjmeverett

ポイントIDとそれらの間の距離の9541ペアのリストを含むCSVファイルと、同じペアであるがそれぞれの距離が異なる別のファイルがあります。私はそれらが同じペアであると99％確信しています。

私はそれらをテーブルaとに置きb、次のようにマージしました：

names(a) <- c('Point1', 'Point2', 'Distance')
names(b) <- c('Point1', 'Point2', 'Cheby')
m <- merge(a, b)

m私が予想していたよりも8行余分にあることを除いて、すべて良好です。私はとの合併しようとしたall.x=TRUEとall.y=TRUE同様に、同じ結果で、そして何のフィールドがありませんNA。なぜそれらがそこにあるのかを理解できるように、8つの余分な行が何であるかをどのように見つけるのですか？

私は、マージしようとしたmバックaとb行が持っているかを確認するNAが、任意のはありません。さらに奇妙なことに、現在9565行があります。データフレームの小さなサブセットをマージすると完全に機能しますが、予期しない数の行が返されるまで、ますます大きなサブセットをマージするよりも、何が問題になっているのかを見つけるためのよりエレガントな方法があるのではないかと思います。

ジェームズ・トリンブル

一部のポイントがデータフレーム内で重複しているように思われますか？試してみてください

a1 <- a[,-ncol(a)]
a1[duplicated(a1),]
b1 <- b[,-ncol(b)]
b1[duplicated(b1),]

重複するポイントがあるかどうかを確認します。

編集：また、a重複したポイントを持つすべての行を取得するには、次のようにします。

a1 <- a[,-ncol(a)]
duplicated_points_a <- a1[duplicated(a1),]
merge(duplicated_points_a, a)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-28

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Rでマージされたデータテーブルから余分な行を見つける

Rでマージされたデータテーブルから余分な行を見つける

フラットファイルからデータをロードしながら、Informaticaで拒否された行を見つける方法

同じテーブル内の別の行からデータを見つけるために、1つの行でSQLQUERYを複数検索する

更新されたデータを含むテーブルがある場合、MySql で重複を見つける

マージで見つからない行を見つける方法-データフレームの1つだけに関連して？

Jqueryのテーブルから列で指定された行のインデックスと値を見つける方法は？

Angularのページ付けでソートされたマットテーブルデータを取得する

Slackから返されたデータをフィルタリングして、アクティブなユーザーを見つけるにはどうすればよいですか？

SeleniumPython要素のテーブルから指定された行と列を見つける方法

テーブルから少なくともこれらのテクノロジー[reactjs、mysql、express]で働いたことのある人を見つける

NULLで満たされた詳細セルの余分な行を使用してマスターテーブルを複数の詳細テーブルに結合する方法

データベーステーブルから特定の値を見つけるための最も簡単で最適な方法は何ですか？

Pythonでグループ化されたデータから最大値を見つける

InDesignのデータマージ-「空白行を削除」すると余分な文字が表示されます

別のブランチがマージされたときに1つのブランチで変更されたファイルを見つける方法（マージされたブランチからの変更を無視）？

データテーブル角度マテリアルに空のメッセージを表示する方法、データが見つからない場合

ロードされたウェブページからcssパターンを見つけて削除する方法

Scrapy：テーブルを見つけられないか、テーブル内のデータをスクレイピングできません

BeautifulSoupがテーブルの行を見つけられない

データテーブル行で特定の値を見つける

データテーブルの行で最小/最大日時を見つける

データベーステーブルから最初に利用可能な識別子を見つける

mysqlテーブルの調整データからEquatorを見つける

異なるデータテーブルで重複を見つける

タブページで作成された余分な下部タブバーを削除するにはどうすればよいですか

SparkジョブがHiveデータベースでテーブルを見つけられませんでした

ルーターがページを見つけられない状態でHOCを反応させる

`gam`パッケージ：` plot.gam`でデータをスケッチするときに余分なシフトが見つかりました

マージされたテーブルからMultiIndexデータフレームを作成するにはどうすればよいですか？

mysqlの結合テーブルから単一行データを見つける方法は？