본문 바로가기
728x90
반응형

파이썬(Python), 머신러닝, 딥러닝21

(딥러닝 with 파이썬) k겹 교차검증(k-fold cross validation / k-fold cv) 데이터를 분석하다보면, 확보할 수 있는 데이터의 양이 무한정 충분할 수 없으니, 가지고 있는 데이터를 학습용과 테스트용으로 구분하여 사용해야 한다. 이때, 테스트용 데이터는 모델 학습에 사용할 수 없다는 단점이 생긴다.특히, 데이터가 부족할 시 더 큰 문제가 되는데, 이러한 문제점을 해결하고자 k겹 교차검증(k-fold cross validation)을 실시하여 그 문제점을 보완할 수 있다. K겹 교차검증은, 가지고 있는 전체 데이터를 K겹(K-fold)로 나누어서, k겹 중 1겹은 테스트용으로, 나머지는 학습용으로 선정하여 학습시키는 것을 말하며, 이것을 모든 겹이 한번 씩 테스트용이 될때까지 반복하는 것을 말하기에 '교차검증'이라고 하는 것이다. 광물 데이터를 바탕으로 K겹 교차검증을 활용한 딥러닝 .. 2022. 8. 10.
(딥러닝 with 파이썬) 아이리스(iris/분꽃) 데이터 다중분류 문제 이번에 알아볼 문제는, 다중분류문제이다. 다중분류 문제란, 타겟(또는 종속함수 / Response)가 여러가지 클래스를 가지는 경우를 말한다. 지난번에 알아본 피마인디언의 당뇨병 예측의 경우, 타겟이 질병유무 이므로, 질병(1) 또는 정상(0)으로만 분류가 된다. 그렇기에, 1)손실함수는 binary_crossentropy를 사용했고, 2)마지막 히든레이어에서 아웃풋 레이어로 전파되는 활성화 함수는 simoid 함수를 사용했다. 하지만, 이번에 알아볼 아이리스 품종 분류 문제의 경우, 타겟이 아이리스의 품종이며 데이터에 제시된 품종은 총 3가지의 품종(setoa / versicolor / virginica)이다. 이진 분류의 경우 활성화 함수의 값이 0.5 이하면 미발생 / 0.5 이상이면 발생으로 분류.. 2022. 8. 5.
(딥러닝 with 파이썬) 당뇨병 예측(피마 인디언의 당뇨병 예측) - 2) 딥러닝 실행 지난 포스팅에서 피마 인디언의 당뇨병 데이터(diabetes)에 대해 시각화해보며, 데이터에 대해 알아보았다. 2022.08.02 - [파이썬(Python), 머신러닝, 딥러닝] - (딥러닝 with 파이썬) 당뇨병 예측 (피마 인디언의 당뇨병 예측) - 1) 데이터 시각화 (딥러닝 with 파이썬) 당뇨병 예측 (피마 인디언의 당뇨병 예측) - 1) 데이터 시각화 "당뇨병(diabete) 데이터"로 유명한 데이터셋인, "피마 인디언의 당뇨병" 데이터를 통해서, 1. 탐색적 데이터 분석(시각화) 2. 딥러닝을 통한 당뇨병 여부 예측 을 진행하겠습니다. 1. 탐색적 데 goodsarah.tistory.com 이번에는 딥러닝을 통해 해당 데이터를 학습한 뒤, 변수들 값 만으로 얼마나 정확하게 당뇨병 여부를 .. 2022. 8. 3.
(딥러닝 with 파이썬) 당뇨병 예측 (피마 인디언의 당뇨병 예측) - 1) 데이터 시각화 "당뇨병(diabete) 데이터"로 유명한 데이터셋인, "피마 인디언의 당뇨병" 데이터를 통해서, 1. 탐색적 데이터 분석(시각화) 2. 딥러닝을 통한 당뇨병 여부 예측 을 진행하겠습니다. 1. 탐색적 데이터 분석(EDA / Exploratory Data Analysis) 피마 인디언 당뇨병에 대한 데이터의 구조는 아래와 같다. 총 768명의 인디언에 대한 데이터가 수집되어있으며, 각 인디언들마다 8개의 변수에 대한 내용이 기록되어있다. 각 변수에 대한 설명은 아래와 같다. 변수1 : 과거 임신 횟수 변수2 : 포도당 부하 검사 2시간 후 공복혈당 농도(mm Hg) 변수3 : 확장기 혈압(mm Hg) 변수4 : 삼두근 피부 주름 두께(mm) 변수5 : 혈청 인슐린(2-hour, mu U/ml) 변수6 :.. 2022. 8. 2.
728x90
반응형