Community Detection Project

Modularity

Data Preprocessing

  • PlayList LEVEL

  • Song LEVEL

PlayList Level

1.좋아요 수가 50 이하인 PalyList 삭제 (Assumption : 좋아요 수가 최소 50 초과인 PlayList 의 음악을 추천받았을 시, 좋아할 가능성이 큼)

2. 태그의 수가 1, 그리고 10인 플레이리스트 삭제 (Assumption : Tag의 수가 최대치로 많은 것은 다양한 종류의 음악이 혼재되 있어 플레이리스트 고유의 성향이 부재할 가능성이 큼 )

3. 플레이리스트 내 곡의 갯수가 10 이하인 플레이리스트 와 200개인 플레이리스트 삭제 (Assumption : 플레이리스트는 곡의 집합으로 하나의 곡이 담겨있는 플레이리스트는 커뮤니티의 성격이 존재하지 않음./ 200개는 너무 브로드함.)

한 플레이리스트에 담겨있는 곡의 수의 분포를 보면, 곡의 수가 아예 적거나, 아예 많음을 볼 수 있음. 곡의 수가 200개 담겨있는 플레이리스트를 보면, 아마 멜론의 한 플레이리스트 당 200개 곡의 제한을 두지 않았을까 싶음. 200개 곡은 다양한 곡이 담겨있을 확률이 크므로, 200개 삭제

Song Level

  1. 2개 이하 100개 이상의 플레이리스트의 담겨있는 곡제거 (Assumption: 2개 이하의 플레이리스트 : 중요하지 않은 노래, 100개 이상의 플레이리스트의 담겨있는 곡: 추천해줘도 이미 암.)

가중치 파일은 추후 다음과 같은 .txt 파일 형태로 저장함.

visualization

Modularity Optimization

  • Fast Greedy

  • Eigen Vector

  • Betweeness Score

  • Walk Trap

Last updated