Community Detection Project
Modularity
Data Preprocessing
PlayList LEVEL
Song LEVEL
PlayList Level
1.좋아요 수가 50 이하인 PalyList 삭제 (Assumption : 좋아요 수가 최소 50 초과인 PlayList 의 음악을 추천받았을 시, 좋아할 가능성이 큼)
2. 태그의 수가 1, 그리고 10인 플레이리스트 삭제 (Assumption : Tag의 수가 최대치로 많은 것은 다양한 종류의 음악이 혼재되 있어 플레이리스트 고유의 성향이 부재할 가능성이 큼 )
3. 플레이리스트 내 곡의 갯수가 10 이하인 플레이리스트 와 200개인 플레이리스트 삭제 (Assumption : 플레이리스트는 곡의 집합으로 하나의 곡이 담겨있는 플레이리스트는 커뮤니티의 성격이 존재하지 않음./ 200개는 너무 브로드함.)
한 플레이리스트에 담겨있는 곡의 수의 분포를 보면, 곡의 수가 아예 적거나, 아예 많음을 볼 수 있음. 곡의 수가 200개 담겨있는 플레이리스트를 보면, 아마 멜론의 한 플레이리스트 당 200개 곡의 제한을 두지 않았을까 싶음. 200개 곡은 다양한 곡이 담겨있을 확률이 크므로, 200개 삭제
Song Level
2개 이하 100개 이상의 플레이리스트의 담겨있는 곡제거 (Assumption: 2개 이하의 플레이리스트 : 중요하지 않은 노래, 100개 이상의 플레이리스트의 담겨있는 곡: 추천해줘도 이미 암.)
가중치 파일은 추후 다음과 같은 .txt 파일 형태로 저장함.
visualization
Modularity Optimization
Fast Greedy
Eigen Vector
Betweeness Score
Walk Trap
Last updated