두 데이터 프레임 사이에서 첫 번째 단어만으로 일치하는 행 찾기

debugcn 에 게시 Dev

어디

다음과 같이 University 열이 포함 된 두 개의 데이터 세트가 있습니다.

University | Expenditures

Abilene Christian University | 7041
Adelphi University | 10527
Albertson College | 9727
Boston University | 1234
etc.

University | Power_Rating
Abilene Christian | 0.5064
Air Force | 0.6543
Alabama | 0.7391
Boston | 0.324
etc.

두 데이터 프레임을 결합하여 University, Power_Rating 및 Expenditures 열로 모두 구성된 전체 데이터 프레임을 만들려고합니다.

예를 들어 최종 데이터 프레임에는 Abilene Christian University와 Boston이 있지만 서로 일치하지 않는 행은 포함되지 않습니다.

# Loading necessary libraries
library("dplyr")
library("tidyr")
library("ggplot2")

# Reading and setting the relevant datasets
college_basketball_df <- read.csv("cbb19.csv", stringsAsFactors = FALSE)
us_colleges_df <- read.csv("College.csv", stringsAsFactors = FALSE)

# Selecting relevant columns in the dataframes ()
us_colleges_df <- us_colleges_df %>% 
  select(X, Expend) %>% 
  rename(University = X, Expenditures = Expend)

college_basketball_df <- college_basketball_df %>% 
  select(TEAM, BARTHAG) %>% 
  rename(University = TEAM, Power_Rating = BARTHAG)

# Arrange both datasets so that they be combined/joined together
us_colleges_df <- arrange(us_colleges_df, University)
college_basketball_df <- arrange(college_basketball_df, University)

View(us_colleges_df)
View(college_basketball_df)
combined_df <- left_join(us_colleges_df, college_basketball_df, by="University")

내 현재 코드는 데이터 프레임 사이의 행에서 정확한 일치를 찾으려고 시도하는 left_join을 사용합니다 (일치하는 행이 없기 때문에 전체 power_rating 열이 NA가 됨). 첫 번째로 조인하는 방법이 있는지 알고 싶습니다. 대학 칼럼에있는 단어?

로낙 샤

University열 에서 한 단어를 추출한 다음 조인 할 수 있습니다.

library(dplyr)

df1 %>% mutate(name = stringr::word(University)) %>%
   left_join(df2 %>% mutate(name = stringr::word(University)), by = "name")

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

두 데이터 프레임 사이에서 첫 번째 단어만으로 일치하는 행 찾기

두 데이터 프레임 사이에서 첫 번째 단어만으로 일치하는 행 찾기

데이터 프레임에서 열의 최소값으로 첫 번째 행을 찾는 방법

첫 번째 데이터 프레임의 일부 열에서 수학 함수를 수행하는 동안 기존 데이터 프레임의 모든 n 번째 행에서 새 데이터 프레임을 만드는 방법

두 문장 사이에 일치하는 첫 번째 단어 찾기

첫 번째 데이터 프레임에 행이있는 경우 두 번째 데이터 프레임의 존재 값을 업데이트하는 방법

색인으로 팬더 데이터 프레임 첫 번째 행 가져 오기

다른 인덱스가있는 고유 한 값을 기반으로 첫 번째 데이터 프레임에서 두 번째 데이터 프레임으로 값을 업데이트하여 각 행을 반복합니다. 그렇지 않으면 새 ID를 추가하고 할당합니다.

두 번째 데이터 프레임에서 일치하는 키를 기반으로 Spark 데이터 프레임 열에 목록 추가

두 번째 데이터 프레임의 행을 기반으로 Pandas 한 데이터 프레임의 값 설정

여러 선택 기준과 일치하는 두 개의 서로 다른 데이터 프레임의 행을 기반으로 세 번째 데이터 프레임을 만듭니다.

레일의 첫 번째 테이블 데이터를 기반으로 두 번째 테이블 업데이트

데이터 프레임의 첫 번째 행을 헤더가 아닌 데이터 행으로 읽는 방법

Pandas 데이터 프레임-두 열의 ID를 기반으로 일치하는 행 찾기

R에서 사이트와 날짜가 두 데이터 프레임에서 일치하면 첫 번째 데이터 프레임에서 행 값을 가져옵니다.

두 번째 엑셀 파일 팬더의 데이터를 기반으로 첫 번째 엑셀에서 엑셀 행을 제거하는 방법

Python-데이터 프레임의 첫 번째 열에있는 모든 행에서 0 가져 오기

새 열에서 데이터 프레임의 첫 번째 행 (목록으로)을 변환하고 첫 번째 행을 삭제합니다.

행 번호 및 행 이름으로 2 개의 데이터 프레임을 일치시키고 일치가 발생할 때 첫 번째 df에서 값 추출

Oracle : 첫 번째 및 두 번째 테이블에서 일치하는 행

첫 번째 데이터 프레임에서 주어진 두 날짜 사이의 두 번째 데이터 프레임의 최소값과 최대 값을 찾습니다.

두 번째에서 가능한 값 범위를 기반으로 두 데이터 프레임을 병합하지만 첫 번째 값은 유지하는 방법은 무엇입니까?

Pandas 데이터 프레임에서 4 행당 첫 번째 값을 추출하여 새 데이터 프레임을 만듭니다.

데이터 프레임의 헤더를 첫 번째 행으로 드롭 / 이동

두 번째 데이터 프레임에있는 행의 허용 오차 값 내에있는 두 번째 열의 값을 기반으로 데이터 프레임 열 필터링

세 번째 데이터 프레임의 일치 값을 기반으로 새로운 부울 열이있는 두 데이터 프레임의 곱

각 행의 첫 번째 위치를 두 번째 이름으로 파일에 에코하는 Bash 스크립트

각 행의 첫 번째 위치를 두 번째 이름으로 파일에 에코하는 Bash 스크립트

Pandas의 첫 번째 행 세 개를 기반으로 데이터 프레임 변환

R에서 동일한 값의 인덱스를 찾기 위해 두 데이터 프레임의 첫 번째 열 값을 비교합니까?

PySpark : 하나의 값 (첫 번째 데이터 프레임에서)이 다른 두 값 (두 번째 데이터 프레임에서) 사이에있는 데이터 프레임을 병합합니다.