실습
: 내부 연결망이 확고한지, 외부 연결망이 확고한지를 확인하는 방법
E-I Index
값이 -1에 가까울 수록 자신이 속한 그룹에 대한 연결이 강함
Cross activity
- 그룹간 교류하는 정도를 파악하는 지표
- 네트워크 수준을 개인 수준과 집단 수준에서 비교할 수 있음
- 이를 위해 개인이 속한 집단과 그 집단 간의 관계가 뚜렷해야 함
- 개인의 원래 가지고 태어난 속성(attribute)이 아닌 네트워크 내에서 정의한 개인의 속성일 수도 있음
- R에서는 활용할 수 있는 툴이 없음
Transitivity
▤ 지인의 지인끼리 알고 있을 가능성이 높은 것
- 3자면 관계 ▶ 닫혀있는 관계에서 가능성이 가장 높음
- 집단 간의 결속력이 높은 집단 ▶ 초기에는 삼각형이었던 집단이 점점 노드와 결속력을 높여가는 단계
Clustery coeffiient(군집 계수)
: 네트워크의 집단화 성향
- 계수와 정비례함
- 개인의 위치와는 관계 없고 전체 네트워크와의 구조와 연관됨
Hub & Authority
cohesive subgroup 뭉쳐있는 그룹
subgroup 하위집단
n-clique
- 간접적인 연결로 정의됨
- 구성원간 연결 단계가 전체 구성원 숫자를 넘지 않는 망
clique
모든 집단 구성원들로서, 직접적인 연결을 가지고 있는 망의 최대치
현실에서는 나타나지 않을 수도 있음
→ 3 clique : 끝까지 연결되기 위한 연결 단계가 3단계를 넘지 않음
문제점
- 예를 들어 3 clique일 때, 3번만에 연결된기만 하면 타집단 간의 연결도 내부집단끼리의 연결로 혼동할 수 있음
- 정의된 연결이 간접적이므로, 집단 전체적으로 보면 분리되어있는 개체들도 n-clique으로 정의될 수 있음
- 노드 수가 많아지면 n-clique 의 의미가 사라짐 (집단 전체를 분석하게 됨)
▒ k-core정도만 알아두기
네트워크의 핵심 집단
: 중앙에 위치하는 집단
- 연결고리가 없는 노드는 바깥으로 밀려남
- 정의에 따라, k-core는 스스로 수준을 정할 수 있고 clique, clan보다 네트워크의 핵심을 잡아내기 좋음
- 노드 수가 너무 많은 경우 - 집단 감지 알고리즘으로 필요한 집단을 추출
성긴 곳을 자르는 방법 (Divisive)
- 선의 인접 중앙도를 모두 구함
- 수치가 가장 높은 곳을 중심으로 자름
- 아무리 노드가 많은 집단이어도 계속 자르다보면 구분 가능
I'm a Senior Student in Data Science !
데이터 사이언스를 공부하고 있는 4학년 학부생의 TIL 블로그입니다. 게시글이 도움 되셨다면 구독과 좋아요 :)
'Exploratory Data Analysis > #Theory' 카테고리의 다른 글
[분류] 군집 분석 - 여러 집단으로 개체 분류하기 (0) | 2019.10.24 |
---|---|
[UDA] 비정형데이터-군집화 (0) | 2019.10.10 |
[EDA] 사회연결망분석: 주요 개념 및 자료 (0) | 2019.09.29 |
[EDA] 데이터 전처리 및 탐색 (0) | 2019.09.27 |
[UDA] 비정형데이터분석 (0) | 2019.09.19 |