작성
·
273
1
안녕하세요 선생님 질문이 있습니다.
1. 239166 rows × 17 columns
2. 150414 rows × 2 columns
위의 두행을 합치려고 합니다.
저의 생각은 1번의 데이터프레임을 옆에다가 2번의 데이터프레임을 붙여 밑에 nun값에 해당되는 부분을 drop을 시킬려는게 계획이였습니다.
따라서 merge ( 1 , 2 , how = outer)을 적용할려고 했으나 에러에 concat을 사용하라는게 이유였습니다.
제가 생각했던 방향성을 가지고 데이터프레임을 합치기 위해선 어떤 코드를 이용하여 데이터프레임을 합칠 수 있을까요?
다시한번 말씀드리면 어떤 특정 데이터프레임에다가 또 다른 데이터 프레임을 그대로 붙여 중간중간마다 nun값이 생기는것이아니라 부족한 데이터에 nun값이 생기는 부분을 drop시킬 수 있는 합치기를 원합니다.
답변 3
0
0
0
안녕하세요.
질문해 주신 내용은 컬럼의 수가 서로 다르고 행의 수도 서로 다른데요.
이렇게 서로 다른 데이터프레임을 합치려면 뭔가 기준이 필요합니다.
concat 으로 합칠 때는 인덱스 값이나 컬럼의 값이 동일해야 행 또는 열로 합칠수가 있는데요.
질문해 주신 내용만으로는 데이터프레임이 어떻게 생겼는지 확인할 수 없어서 concat 을 사용해야 할지 merge를 사용해야 될지 답변하기 어렵습니다.
합치고자 하는 두 데이터프레임의 스크린샷을 함께 올려주시거나 아래 링크의 예제를 참고해 보세요.
다음 링크를 참고해서 데이터를 합쳐보는 것을 추천합니다.
[Merge, join, concatenate and compare — pandas 1.3.3 documentation](https://pandas.pydata.org/docs/user_guide/merging.html)
안녕하세요.
두 개의 데이터프레임을 연결해 주려면 기준이 필요합니다. 인덱스 값이 서로 같거나 컬럼값이 같아야 하는데 올려주신 내용으로는 공통사항이 보이지 않습니다.
예를들어 prlst_nm 이라는 컬럼의 값이 두 번째 데이터프레임에도 존재하면 merge 를 통해 key 값을 prlst_nm 으로 연결해 볼 수 있을거 같습니다.