참여 인원 : 방서연, 장원준, 정하윤
불참 인원 : 전병우(제외)
회의 내용 : 중간 제출물 내용 구성 회의
교수님이 주신 자료
- 우리나라의 안 좋은 점
- 서론이나 결론에 반영하면 좋은 자료인듯 → 그리고 묶이는 국가에 대한 정답인듯..?
연관성 분석
- 우리 데이터는 어떤 특징(데이터의 row가 작고 column이 크다.)을 가지고 있다.
- 그러면 그럴 때는 이러이러한 모델들이 좋다고 한다
- 그 모델들의 결과를 종합해서 변수를 선정
- A 모델에서는 10개가 이렇게 B 모델에서는 10개가 이렇게 → 그들의 공통 사항
- 공통된 변수를 우리의 주요 변수라고 생각!
- 그래서 그 변수들이 왜 중요한지 정성적으로 조사해서 쓰기
클러스터링
- 앞서 조사한 자료 → 사실 좋은 국가, 우리랑 묶일 국가는 정해져 있음…
- 클러스터링을 진행을 해서 그거에 대한 근거를 마련하면 어떨까?
- 클러스터링은 변수 2개 혹은 3개를 묶어서 몇 번에 걸쳐 진행
- 그리고 좀 공통된 것들을 비슷한 국가라고 확정할 것
- 근데 아마 NET ODA, ODA/GNI, NET GNI로 결정이 될것… 😂
- 준비한 열들 종합해서 PCA 돌려보고 이때 고유값 확인해서 몇차원으로 축소 가능한지 확인 (결측값 채우기) + 비DAC 제외 + 이전 연도 자료 참고
진행상황
연관성 분석
- 60개의 데이터셋 수집 → 단순 USD 규모가 아닌, per capita나 % of GDP의 형식으로 국가마다 차이를 완화하는 지표로만 선정