데이터 썸네일형 리스트형 [ML] 머신러닝/딥러닝 - 모두를 위한 딥러닝 (1) (출처) inflearn 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌, Sung Kim OT. 수업 소개와 개요 수강 대상 머신러닝이 궁금한 사람 수학, 컴퓨터에 대한 백그라운드가 약한 사람들도 가능 (y = ax + b 정도의 이해도) 머신러닝은 알고리즘이 잘 구현되어있는 툴을 사용하기 때문에 쉽게 활용 가능 텐서플로우, 파이썬을 활용하고 싶은 사람 수업으로 얻을 수 있는 것 머신러닝에 대한 기본적인 이해 딥러닝을 이해하기 위한 기본적인 알고리즘 (회기분석, 로지스틱 회귀분석) 텐서플로우, 파이썬을 활용하여 문제해결 수업 형식 10분 가량의 렉처 텐서플로우를 활용해 프로그래밍하는 법을 익히는 랩 참고사이트 (앤드류 응 교수의 머신러닝 수업) http://class.coursera.org/ml.. 더보기 [EDA] 사회연결망분석: 주요 개념 및 자료 Degree Centrality (방향 중앙성) Indegree와 outdegree로 구별됨 simple count, standardized Closeness Centrality (인접중앙성) : 한 결점이 다른 한 결점에 도달하는 최소단계를 연결망의 모든 결점으로부터 구해 합산 한 결점이 다른 결점에 도달하는 최소 경로거리 모든 다른 결점에 대해 계산해서 합산 = Farness로 표기되어 풀력되며 작은 숫자일수록 경로거리가 짧음 직관적 이해를 위해 역수를 취함 =1/Farness Closeness가 높을수록 중앙성이 높아짐 표준화는 인접성/ 논리적으로 가능한 최소 인접성 Betweenness Centrality (사이중앙성) 연결망 내의 한 점을 제외한 논리적으로 연결가능한 연결의 수를 센다 > (n-.. 더보기 [EDA] 데이터 전처리 및 탐색 Data Dirty missing data ▶ 불완전한 데이터 결측치, 정보가 없는 데이터 outlier ▶잘못된 정보 에러나 이상치 → 연봉 중 음수의 값을 갖는 경우 일관성 결여 ▶ 코드나 이름에 일관성이 없는 데이터 → 미국과 한국의 나이 체제 Age = “42”, Birthday = “03/07/2010” Was rating “1, 2, 3”, now rating “A, B, C” discrepancy between duplicate records 데이터 처리 (Data Preprocessing) : 수집한 데이터를 분석하기 좋게 변환하는 모든 작업 분석 목적에 맞는지 데이터의 품질을 확인하고 필요하면 품질을 높이는 작업 데이터 품질이란 신뢰성을 의미하며 정확성과 적시성 (최신성)이 보장되어야 함.. 더보기 [ML] 머신러닝/딥러닝 - 모두를 위한 딥러닝 (2) (출처) inflearn 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌, Sung Kim 섹션 1. 기본적인 Machine Learning 의 용어와 개념 설명 ML : 일종의 프로그램 스팸 필터 개발자들이 일일이 스팸메일을 가려내기 힘듦 Automatic driving 마찬가지로 적용해야 하는 룰이 너무 많음 ▶ Arthur Samuel 프로그램이 자동적으로 배우도록 하는 아이디어를 냄 Learning : Supervised learning 레이블이 정해져있는 데이터(training set)으로 학습하는 방법 ▶ 일반적인 머신러닝의 형태 ▶ 이미지 레이블링, 이메일 스팸 필터, 시험 성적 예측 등에 사용할 수 있음 Training data Set : 결과값이 이미 정해져있는 Y값을 예측할 수 .. 더보기 [UDA] 비정형데이터분석 Social Network Analysis : 구조가 위치와 역할을 만든다는 분석이론 ▶ Meditz가문에 반역을 꾀할 가능성이 가장 높은 가문은 어느 곳인가? (사진 참고) 사람들의 mindmap이 다르다는 것 ▶ 거리가 멀 수록 도달하는데 시간이 많이 걸림 단어들을 통한 개념 map을 만들 수도 있음 항상 위치, 구조, 역할이 함께 작동한다는 것이 중요 초등학생의 또래 친구 집단의 변화 : 개인의 역할이나 위치가 변한 것이 아닌 전체적인 구조가 변한 것 집단 구조의 변화가 아닌 개인의 구조와 역할의 변화 ☞ 친한 친구들이 옆에 있는 짝이 아닌 학원을 같이 다니는 친구들끼리 친해지는 현상을 보일 수 있음 동일한 unit 내에서 상이한 네트워크를 구분함 ☞ 캐빈 베이컨의 법칙 : 미국 할리우드의 허브 중.. 더보기 [시각화] Plot Scatter plot: 추세만 보고 싶을 때 유용각각의 그래프가 보여주고자 하는 목적을 확실히 정하고 데이터 처리에 들어가야 합니다. 데이터 뭉개기 : 범주로 묶어 넣기사회학 범주형 분석, 심리학 분석 : 개인에 집중함 ☞ data의 track이 다름 Examples 회사에서 부당한 일을 당했을 때 70년대생, 90년대생의 대처 차이에 대한 설문조사와 같이 그룹별로 차이를 보일 수 있습니다. 답변 중 "더욱 충성한다" 항목은 90년대생 비율이 70년대생 보다 현저히 낮았으며, 70년대생은 동시에 이직을 고민하는 비율도 높았음을 알 수 있습니다. 성별 대학교 입학률이 40:60으로 나타나게 된 사회, 구조적 원인과 같은 근원적인 근거 찾기에도 활용됩니다. 갈색 홍채를 갖고 있는 사람이 빨간색의.. 더보기 이전 1 2 다음