본문 바로가기
728x90
반응형

IT39

머신러닝 train_test_split scikit-learn(feat.사이킷런) 학습데이터와 테스트데이터를 쉽게 분리 할 수 있도록 scikit-learn에서 train_test_split를 제공하고 있다. Train: 모델을 학습 시키기위한 dataset Test: 학습과 검증이완료된 모델의 성능을 평가하기위한 dataset, 학습에 관여하지 않는다. Validation: 이미 학습된 모델을 검증하기위한 dataset 으로 Train 의 일부이다. X_train, X_test, y_train,y_test = train_test_split(’피쳐데이터세트’, ‘레이블데이터세트’, test_size=’전체데이터세트중테스트데이터비율’, random_state=’호출할때마다 같은 학습//테스트용 데이트 세트를 생성하기위해 주어지는 난수 발생값 ’) train_test_split 는 무작위.. 2022. 4. 14.
머신러닝 용어 및 기본 예측 프로세스 (feat.사이킷런) 1-1.용어정리 피쳐(Feature) , 속성 피처는 데이터세트의 일반속성, 타겟값을 제외한 나머지 속성을 모두 피처로 칭함 타겟(값),결정(값)(=레이블, 클래스) 지도학습시 데이터의 학습을 위해 주어지는 정답 데이터, 레이블, 클래스 ⇒ 지도 학습 중 분류의 경우 에는 이 결정 값을 레이블 또는 클래스로 칭함 지도학습 - 정답이 주어진 데이터(Prediction) 를 학습 한 뒤 미지의 정답을 예측하는 방식(회귀,분류) 학습데이터세트-학습을 위한 데이터 세트(속성과 결정값(레이블)이 모두 있어야한다. 테스트데이터세트- 예측 성능을 평가하기 위한 데이터 세트-- 회기 분석, 분류 1-2. 예측 프로세스 데이터 세트 분리 - 데이터를 학습 데이터와 테스트 데이터로 분리 모델 학습 - 학습 데이터를 기반으.. 2022. 4. 12.
인공지능 머신러닝 딥러닝 정리 머신러닝 시작 전에 기본 용어 부터 정리해보자 1. 인공지능 인공지능은 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해 능력 등을 컴퓨터 프로그램으로 실현한 기술입니다. 즉 인간의 지능을 기계로 구현 하는것으로 컴퓨터가 마치 사람처럼 생각하고 판단하는 영역 전체를 의미하는 단어입니다. 2. 머신러닝 인공지능의 일부이며 인공지능을 구현하는 구체적인 접근 방식을 의미합니다. 경험적 데이터를 기반으로 학습하고 예측을 수행하여 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 고안하고 구축 하는 연구 분야 입니다. 데이터를 이용해서 모델을 만들어 내면 논리적으로 설명하기 어려운 분야에 머신러닝을 적용하면 사람이 직접 모델을 만드는 것보 다 좋은 결과를 얻을수 있습니다. 대량의 데이터와 알고리즘을 .. 2022. 4. 7.
[JAVA ] 자료구조- 단순구조 선형구조 비선형구조 해싱 컴퓨터는 자료의 특성에 따라 다양한 자료구조 기법을 사용합니다. 자료구조에는 단순구조, 선형구조, 비선형구조가 있습니다. 단순구조 : 정수, 실수, 문자, 문자열 등 자료의 형태 선형 구조 : 자료 간의 연결 관계가 [1:1] 관계를 가지는 형태로 자료들이 기다란 선처럼 연결되어 있는 구조 비선형구조 : 자료 간의 연결 관계가 [하나 : 여러 개] 또는 [여러 개 : 여러 개] 의 관계를 가지는 형태로, 나뭇가지 모양이나 그물 모양처럼 얽혀 있는 구조 추가 - 해싱 : 자료 검색을 위한 구조 선형 구조 : 자료를 구성하는 데이터를 순차적으로 나열시킨 형태 선형 자료구조란 하나의 자료 뒤에 하나의 자료가 존재하는 것이다. 자료들 간의 앞뒤 관계가 1:1의 선형관계 1) 배열 (Arrays) : 동일한 자료.. 2021. 12. 5.
728x90
반응형