본문 바로가기

Exploratory Data Analysis/#Theory

[EDA] 사회연결망 분석 지표

실습

UCINET 프로그램으로 연결망 구현하기

: 내부 연결망이 확고한지, 외부 연결망이 확고한지를 확인하는 방법


 

 

E-I Index

값이 -1에 가까울 수록 자신이 속한 그룹에 대한 연결이 강함

Cross activity

  • 그룹간 교류하는 정도를 파악하는 지표 
  • 네트워크 수준을 개인 수준과 집단 수준에서 비교할 수 있음 
  • 이를 위해 개인이 속한 집단과 그 집단 간의 관계가 뚜렷해야 함 
  • 개인의 원래 가지고 태어난 속성(attribute)이 아닌 네트워크 내에서 정의한 개인의 속성일 수도 있음
  • R에서는 활용할 수 있는 툴이 없음 

 


 

Transitivity

 

 

▤ 지인의 지인끼리 알고 있을 가능성이 높은 것

  • 3자면 관계 ▶ 닫혀있는 관계에서 가능성이 가장 높음
  • 집단 간의 결속력이 높은 집단 초기에는 삼각형이었던 집단이 점점 노드와 결속력을 높여가는 단계

 


Clustery coeffiient(군집 계수) 

: 네트워크의 집단화 성향

  1. 계수와 정비례함
  2. 개인의 위치와는 관계 없고 전체 네트워크와의 구조와 연관됨

 

Hub & Authority

cohesive subgroup 뭉쳐있는 그룹

subgroup 하위집단


n-clique 
  • 간접적인 연결로 정의됨
  • 구성원간 연결 단계가 전체 구성원 숫자를 넘지 않는 망

 

clique

모든 집단 구성원들로서, 직접적인 연결을 가지고 있는 망의 최대치 

현실에서는 나타나지 않을 수도 있음

3 clique : 끝까지 연결되기 위한 연결 단계가 3단계를 넘지 않음

 

문제점

  1. 예를 들어 3 clique일 때, 3번만에 연결된기만 하면 타집단 간의 연결도 내부집단끼리의 연결로 혼동할 수 있음
  2. 정의된 연결이 간접적이므로, 집단 전체적으로 보면 분리되어있는 개체들도 n-clique으로 정의될 수 있음
  3. 노드 수가 많아지면 n-clique 의 의미가 사라짐 (집단 전체를 분석하게 됨)

 

k-core정도만 알아두기 


네트워크의 핵심 집단
: 중앙에 위치하는 집단
  • 연결고리가 없는 노드는 바깥으로 밀려남 
  • 정의에 따라, k-core는 스스로 수준을 정할 수 있고 clique, clan보다 네트워크의 핵심을 잡아내기 좋음
  • 노드 수가 너무 많은 경우 - 집단 감지 알고리즘으로 필요한 집단을 추출

 

 


성긴 곳을 자르는 방법 (Divisive)
  1. 선의 인접 중앙도를 모두 구함
  2. 수치가 가장 높은 곳을 중심으로 자름
  3. 아무리 노드가 많은 집단이어도 계속 자르다보면 구분 가능

 


 

연결망을 구현한 것

 


 

같은 집단끼리 색을 통해 구별한 것: 위 데이터가 비정형 데이터라면 녹색 노드는 다른 집단들과 모두 연결되는 영향력있는 집단이다.

 


 

I'm a Senior Student in Data Science ! 

데이터 사이언스를 공부하고 있는 4학년 학부생의 TIL 블로그입니다. 게시글이 도움 되셨다면 구독과 좋아요 :)