Degree Centrality (방향 중앙성)
- Indegree와 outdegree로 구별됨
- simple count, standardized
Closeness Centrality (인접중앙성)
: 한 결점이 다른 한 결점에 도달하는 최소단계를 연결망의 모든 결점으로부터 구해 합산
- 한 결점이 다른 결점에 도달하는 최소 경로거리
- 모든 다른 결점에 대해 계산해서 합산 = Farness로 표기되어 풀력되며 작은 숫자일수록 경로거리가 짧음
- 직관적 이해를 위해 역수를 취함 =1/Farness Closeness가 높을수록 중앙성이 높아짐
- 표준화는 인접성/ 논리적으로 가능한 최소 인접성
Betweenness Centrality (사이중앙성)
- 연결망 내의 한 점을 제외한 논리적으로 연결가능한 연결의 수를 센다 > (n-1)(n-2)/2
- 연결망에서 두 지점간 최소 연결 경로에서 아까 제외했던 한 점이 등장하는 연결을 센다
- 표준화는 1를 2로 나눈 값
인접중앙성과 사이중앙성의 차이
- 사이중앙성 : 연결망 내에서 바이러스가 퍼질 때 어떤 사람이 바이러스에 걸렸을 때 다른 쪽으로 금방 퍼지는지 파악하기 위한 방법
- 인접중앙성 :얼마나 빠르게 defuse가 일어나는지 (사이중앙성은 count되지 않을 수 있음)
Eigenvector Centrality (위세중앙성)
: 자신과 연결된 노드와의 연결을 고려해서 자신의 영향력을 확산하는 매커니즘
▨ 트위터와 같은 원리
☞ 나와 연결된 사람의 영향력을 합산하여 내 영향력을 계산하는 방법
☞ 개인이 어떤 사실을 세상에 알리고자 할 때 연결망 관계를 통해 영향력을 행사함
☞ 상대방을 fake하기 좋은 수단
- 사이 중앙성이 가장 높은 것 → 4번 노드
- 인접 중앙성이 가장 높은 것 → 5번 노드
그래프만 보는 것이 아닌 수치를 봐야 함
Network Centralization
: 개인이 얼마나 연결 관계 많은지 전체 네트워크에 대한 판단
star network
- nequality network
- 사이, 인접 중앙성 모두 중앙집권화 된 상태
▒ 불평등도 수치만 가지고는 어떤 분석도 할 수 없고 문맥이 있어야 함
→ 1학기 반의 수치가 0.4였는데 2학기 반의 수치가 0.7이되었다. ▶ 2학기에 1학기보다 학생의 연결망이 더 치중되었다.
중앙도가 낮은 관계
- 자신의 1차 연결망의 노드 수가 증가하면 밀도는 확률적으로 낮아짐
- 기본적으로 노드 수가 같은 것끼리 밀도 비교가 가능함
Cohesivenss와 Centrality를 결합하면 연결망에 대한 대충의 Scheme이 나옴
가장 집중되어있는 형태
연결망의 연결 형태를 보며 분포가 어떤 식으로 나오는지 감 잡을 수 있어야 함 ▶ 이 연결에는 총 5개의 노드와 4개의 연결망이 있음
이런 지표들은 그림이 아닌 수치로 봐야 함
지수함수 네트워크를 최종적으로 도출
- 전체의 20%가 80%의 분포를 가지고 있고, 전체의 80%가 20%의 분포를 가지고 있다는 분석이 가능함
- 전체 소득 기준 등의 지표 분석에 적용할 수 있음
- 구조, 역할, 위치 중 개인의 위치에 해당하는 사례
I'm a Senior Student in Data Science !
데이터 사이언스를 공부하고 있는 4학년 학부생의 TIL 블로그입니다. 게시글이 도움 되셨다면 구독과 좋아요 :)
'Exploratory Data Analysis > #Theory' 카테고리의 다른 글
[UDA] 비정형데이터-군집화 (0) | 2019.10.10 |
---|---|
[EDA] 사회연결망 분석 지표 (0) | 2019.09.30 |
[EDA] 데이터 전처리 및 탐색 (0) | 2019.09.27 |
[UDA] 비정형데이터분석 (0) | 2019.09.19 |
[EDA] 데이터 분석에 필요한 개념들 (0) | 2019.09.18 |