본문 바로가기

Exploratory Data Analysis/#Theory

[EDA] 사회연결망분석: 주요 개념 및 자료

Degree Centrality (방향 중앙성)
  • Indegree와 outdegree로 구별됨 
  • simple count, standardized

 


 

Closeness Centrality (인접중앙성)
: 한 결점이 다른 한 결점에 도달하는 최소단계를 연결망의 모든 결점으로부터 구해 합산
  1. 한 결점이 다른 결점에 도달하는 최소 경로거리
  2. 모든 다른 결점에 대해 계산해서 합산 = Farness로 표기되어 풀력되며 작은 숫자일수록 경로거리가 짧음
  3. 직관적 이해를 위해 역수를 취함 =1/Farness Closeness가 높을수록 중앙성이 높아짐
  4. 표준화는 인접성/ 논리적으로 가능한 최소 인접성

 


 

Betweenness Centrality (사이중앙성)
  1. 연결망 내의 한 점을 제외한 논리적으로 연결가능한 연결의 수를 센다 > (n-1)(n-2)/2
  2. 연결망에서 두 지점간 최소 연결 경로에서 아까 제외했던 한 점이 등장하는 연결을 센다
  3. 표준화는 1를 2로 나눈 값

 

인접중앙성과 사이중앙성의 차이
  • 사이중앙성 : 연결망 내에서 바이러스가 퍼질 때 어떤 사람이 바이러스에 걸렸을 때 다른 쪽으로 금방 퍼지는지 파악하기 위한 방법 
  • 인접중앙성 :얼마나 빠르게 defuse가 일어나는지 (사이중앙성은 count되지 않을 수 있음)

 


Eigenvector Centrality (위세중앙성)
: 자신과 연결된 노드와의 연결을 고려해서 자신의 영향력을 확산하는 매커니즘

트위터와 같은 원리

☞ 나와 연결된 사람의 영향력을 합산하여 내 영향력을 계산하는 방법

개인이 어떤 사실을 세상에 알리고자 할 때 연결망 관계를 통해 영향력을 행사함

☞ 상대방을 fake하기 좋은 수단 


 

  • 사이 중앙성이 가장 높은 것 → 4번 노드
  • 인접 중앙성이 가장 높은 것 → 5번 노드

그래프만 보는 것이 아닌 수치를 봐야 함

 

 

 


Network Centralization
: 개인이 얼마나 연결 관계 많은지 전체 네트워크에 대한 판단 

 

star network

  • nequality network
  • 사이, 인접 중앙성 모두 중앙집권화 된 상태 

▒ 불평등도 수치만 가지고는 어떤 분석도 할 수 없고 문맥이 있어야 함 

  1학기 반의 수치가 0.4였는데 2학기 반의 수치가 0.7이되었다. ▶ 2학기에 1학기보다 학생의 연결망이 더 치중되었다. 

 


 

중앙도가 낮은 관계

  • 자신의 1차 연결망의 노드 수가 증가하면 밀도는 확률적으로 낮아짐
  • 기본적으로 노드 수가 같은 것끼리 밀도 비교가 가능함 

Cohesivenss와 Centrality를 결합하면 연결망에 대한 대충의 Scheme이 나옴

 


 가장 집중되어있는 형태 

연결망의 연결 형태를 보며 분포가 어떤 식으로 나오는지 감 잡을 수 있어야 함  ▶ 이 연결에는 총 5개의 노드와 4개의 연결망이 있음

이런 지표들은 그림이 아닌 수치로 봐야 함 

지수함수 네트워크를 최종적으로 도출 

  • 전체의 20%가 80%의 분포를 가지고 있고, 전체의 80%가 20%의 분포를 가지고 있다는 분석이 가능함
  • 전체 소득 기준 등의 지표 분석에 적용할 수 있음
  • 구조, 역할, 위치 중 개인의 위치에 해당하는 사례

 

I'm a Senior Student in Data Science ! 

데이터 사이언스를 공부하고 있는 4학년 학부생의 TIL 블로그입니다. 게시글이 도움 되셨다면 구독과 좋아요 :)