본문 바로가기

Machine Learning

[ML] MINITAB Decision Tree(CART), 앙상블(RF/Tree Net), Auto ML (2) 목차부트스트랩 샘플링(Bootstrap Sampling)주어진 데이터로부터 동일한 크기로 복원 추출된 데이터. 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나로써 비용과 시간이 많이 드는 데이터 수집을 스스로 해결할 수 있는 샘플링 방법 집계(Aggregating)여러 분류 모델이 예측한 값들을 조합해서 투표(Voting)을 통해 하나의 결론을 도출하는 과정Hard Voting- 선거 투표와 같이 여러 개의 분류 모델에서 가장 많은 표를 받은 값을 예측으로 결정함Soft Voting       - 분류 유형 별로 확률을 구한 후 확률을 더한 값을 점수화하여 최대 점수를 가진 값을 예측값으로 결정함배깅(Bagging)Bootstrap과 Aggregating 을 합친 앙상블 기법으.. 더보기
[ML] MINITAB Decision Tree(CART), 앙상블(RF/Tree Net), Auto ML (1) 목차Decision Tree의사결정 규칙과 그 결과들을 트리 구조로 도식화하여 분류하는 통계적 분석 방법으로, 각 데이터들이 가진 속성들로부터 패턴을 찾아내서 분류 과제를 수행할 수 있도록 하는 머신러닝 모델ID3, C4.5, C5.0 알고리즘은 인공지능, 기계학습 분야에서 개발되어 발전 - 엔트로피/정보이득 등의 개념을 사용하여 분리 기준을 결정함CART, CHAID 알고리즘은 통계학 분야에서 개발된 알고리즘으로, 카이스퀘어/T검정/F검정 등의 통계분석기법을 사용하여 분류함 CART(Classification And Regression Tree)전체 데이터셋으로 두 개의 자식 노드를 생성하기 위해 모든 예측 변수를 사용하여 데이터 셋의 부분집합을 쪼갬으로써 트리를 생성함Minitab에서 Decision.. 더보기
[Paper Review] The application of machine learning in bank credit rating prediction and risk assessment https://github.com/GodJiLee?tab=repositories GodJiLee - Overview Interested in Data Science. GodJiLee has 17 repositories available. Follow their code on GitHub. github.com 네 번째 논문 리뷰! 오늘은 최근 관심이 생긴 신용 평가와 관련된 논문을 읽어봤다. 기업을 대상으로 하는 lending 전략의 최적화를 위해 4가지 알고리즘으로 모델링하고 각각의 성능을 비교하는 내용이다. 이번 리뷰 역시 번역/요약했기 때문에 약간의 오역이나 오류가 있을 수 있다. 출처: https://ieeexplore.ieee.org/abstract/document/9389901?casa_toke.. 더보기
[Paper Review] Improving Neural Architecture Search Image Classifiers via Ensemble Learning (1) 세 번째 논문 리뷰! 오늘은 앙상블 모델을 활용해 모델의 성능을 높이는 예제를 다룬 논문을 읽어보았다. 이번 리뷰는 원문을 번역해 이해했기 때문에 약간의 오류(?)가 있을 수 있다. 원문은 아래 링크에 첨부한다. https://arxiv.org/abs/1903.06236 Improving Neural Architecture Search Image Classifiers via Ensemble Learning Finding the best neural network architecture requires significant time, resources, and human expertise. These challenges are partially addressed by neural architecture s.. 더보기
[Paper Review] Indoor Behavior Recognition Using Convolutional LSTM 두 번째 논문 리뷰! 이번 논문은 지난 번에 읽은 논문에 이어 Convolutional LSTM 알고리즘과 실내 환경 데이터를 활용한 특징 추출을 다루고 있다. 마침 관심있는 대회에서 이 모델을 베이스라인으로 제공하길래 좀 더 집중해서 읽어볼 수 있었다. 원문 링크는 아래에 첨부한다. https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=DIKO0015063537&dbt=DIKO 목차 Abstract 사물 인터넷 환경에서 각종 센서들을 통해 얻은 환경에 대한 정보들은 사용자의 신체로부터 직접적으로 수집된다는 점에서 개인정보 침해 등 여러 불편함이 있을 수 있다. 이에 좀 더 간접적인 방법으로 사용자 주변 상황에 대한 정보를 수집해 행동 인식에 사용.. 더보기
[Paper Review] ConvLSTM, 시계열 기계학습을 이용한 예측 모델 이 카테고리에는 딥러닝 관련 논문을 읽고 간단하게나마 리뷰를 해보려고 한다. 처음 읽어본 논문은 시계열 자료를 활용한 해수면 온도 예측 딥러닝 모델이다. 본 포스팅은 아래 논문을 읽고 남긴 리뷰임을 밝힌다. https://doi.org/10.7780/kjrs.2020.36.5.3.7 목차 1. 서론 해수면 온도 예측이 주제인만큼 해수면 온도 상승의 파급력에 대해 설명한다. 해수면 온도는 해양-대기 순환 현상을 결정하는 중요한 변수이며, 다양한 요인들로 한반도 해역의 고수온 현상이 자주 발생하고 있다. 이에 따라 다양한 방법으로 해수면 온도 예측이 이루어지고 있는데, 대표적으로 수치모델과 자료중심(Data-driven) 모델을 사용한다. 수치모델에는 ROMS, NEMO와 같이 일사량, 해류 등의 입력자료로.. 더보기
[Framework] TensorFlow의 설치 및 작동법 (출처) inflearn 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌, Sung Kim Conda에 TensorFlow 설치하는 방법 https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/install.html#tensorflow-cpu Installation — TensorFlow Object Detection API tutorial documentation Install Anaconda Python 3.7 (Optional) Although having Anaconda is not a requirement in order to install and use TensorFlow, I suggest doing so, .. 더보기
[Framework] Tensorflow로 선형회귀 구현하기 (출처) inflearn 모두를 위한 딥러닝, Sung kim 이론 (이전 포스팅 참고) 2019/10/03 - [bigdata/#Machine Learning] - Linear Regression의 Hypothesis와 cost 설명 Lab 2 ▤ 텐서플로우 구동 매커니즘 그래프 Build하기 Session 생성 후 Run Return/ Update의 실행 결과 출력 1. Bulid graph using TF operations #X and Y data x_train = [1, 2, 3] #전 포스트에서 다룬 간단한 그래프 y_train = [1, 2, 3] W = tf.Variable(tf.random_normal([1]), name = 'weight') #W와 b의 값을 정의 b = tf.Varia.. 더보기