본문 바로가기

Machine Learning/#ML

[ML] MINITAB Decision Tree(CART), 앙상블(RF/Tree Net), Auto ML (2) 목차부트스트랩 샘플링(Bootstrap Sampling)주어진 데이터로부터 동일한 크기로 복원 추출된 데이터. 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나로써 비용과 시간이 많이 드는 데이터 수집을 스스로 해결할 수 있는 샘플링 방법 집계(Aggregating)여러 분류 모델이 예측한 값들을 조합해서 투표(Voting)을 통해 하나의 결론을 도출하는 과정Hard Voting- 선거 투표와 같이 여러 개의 분류 모델에서 가장 많은 표를 받은 값을 예측으로 결정함Soft Voting       - 분류 유형 별로 확률을 구한 후 확률을 더한 값을 점수화하여 최대 점수를 가진 값을 예측값으로 결정함배깅(Bagging)Bootstrap과 Aggregating 을 합친 앙상블 기법으.. 더보기
[ML] MINITAB Decision Tree(CART), 앙상블(RF/Tree Net), Auto ML (1) 목차Decision Tree의사결정 규칙과 그 결과들을 트리 구조로 도식화하여 분류하는 통계적 분석 방법으로, 각 데이터들이 가진 속성들로부터 패턴을 찾아내서 분류 과제를 수행할 수 있도록 하는 머신러닝 모델ID3, C4.5, C5.0 알고리즘은 인공지능, 기계학습 분야에서 개발되어 발전 - 엔트로피/정보이득 등의 개념을 사용하여 분리 기준을 결정함CART, CHAID 알고리즘은 통계학 분야에서 개발된 알고리즘으로, 카이스퀘어/T검정/F검정 등의 통계분석기법을 사용하여 분류함 CART(Classification And Regression Tree)전체 데이터셋으로 두 개의 자식 노드를 생성하기 위해 모든 예측 변수를 사용하여 데이터 셋의 부분집합을 쪼갬으로써 트리를 생성함Minitab에서 Decision.. 더보기
[ML] 머신러닝/딥러닝 - 모두를 위한 딥러닝 (1) (출처) inflearn 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌, Sung Kim OT. 수업 소개와 개요 수강 대상 머신러닝이 궁금한 사람 수학, 컴퓨터에 대한 백그라운드가 약한 사람들도 가능 (y = ax + b 정도의 이해도) 머신러닝은 알고리즘이 잘 구현되어있는 툴을 사용하기 때문에 쉽게 활용 가능 텐서플로우, 파이썬을 활용하고 싶은 사람 수업으로 얻을 수 있는 것 머신러닝에 대한 기본적인 이해 딥러닝을 이해하기 위한 기본적인 알고리즘 (회기분석, 로지스틱 회귀분석) 텐서플로우, 파이썬을 활용하여 문제해결 수업 형식 10분 가량의 렉처 텐서플로우를 활용해 프로그래밍하는 법을 익히는 랩 참고사이트 (앤드류 응 교수의 머신러닝 수업) http://class.coursera.org/ml.. 더보기
[ML] 머신러닝/딥러닝 - 모두를 위한 딥러닝 (2) (출처) inflearn 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌, Sung Kim 섹션 1. 기본적인 Machine Learning 의 용어와 개념 설명 ML : 일종의 프로그램 스팸 필터 개발자들이 일일이 스팸메일을 가려내기 힘듦 Automatic driving 마찬가지로 적용해야 하는 룰이 너무 많음 ▶ Arthur Samuel 프로그램이 자동적으로 배우도록 하는 아이디어를 냄 Learning : Supervised learning 레이블이 정해져있는 데이터(training set)으로 학습하는 방법 ▶ 일반적인 머신러닝의 형태 ▶ 이미지 레이블링, 이메일 스팸 필터, 시험 성적 예측 등에 사용할 수 있음 Training data Set : 결과값이 이미 정해져있는 Y값을 예측할 수 .. 더보기