본문 바로가기
728x90
반응형

파이썬(Python), 머신러닝, 딥러닝21

(머신러닝 with 파이썬) Model Selection / train_test_split, K-fold CV, Startifield K-fold CV, GridSearch CV 이번에는 Model Selection에 대해서 알아보겠습니다. 1. Model Selection이란? Model Selection(모형 선택)은 머신 러닝이나 통계적 모델링에서 가장 적합한 모델을 선택하는 과정을 말합니다. 이는 데이터 분석의 중요한 단계 중 하나로, 1) 어떤 종류의 모델을 사용할 것인지, 2) 그 모델의 하이퍼파라미터를 어떻게 설정하 것인지를 결정하는 과정을 포함합니다. Model Selection이 중요한 이유는 아래와 같습니다. a) Over-fitting 또는 Under-fitting 을 방지 : 너무 복잡한 모델을 선택하여 train 데이터에 딱 맞게 만들어진 모델은 새로운 데이터를 예측하는데에는 적합하지 않는 문제인 Over-fitting 문제를 야기합니다. 반대로, 너무 단.. 2023. 8. 16.
(머신러닝 with 파이썬) 붓꽃 품종 예측 모델 만들기 (Decision Tree Classifier) / 혼동행렬, 시각화(graphviz) 추가 / Gini 계수(Gini 불순도) 이번에 해볼 것은 분류 문제로 유명한 데이터인 붓꽃(iris) 데이터를 활용하여 분류 예측 모델을 만들어보는 것입니다. 이때 사용할 모델은 분류 모델 중 가장 기초적이지만, 설명력이 높은 결정나무(Decision Tree)를 활용하는 것입니다. 1. 데이터 설명 데이터는 총 3 종류의 붓꽃(Versicolor / Setosa / Virginica) 품종에 대한 각 특징들이 기록되어 있습니다. 데이터의 일부분을 추출해서 보면 아래와 같이 나타낼 수 있습니다. 여기서 label은 붓꽃의 품종을 뜻하며, 0 : Versicolor / 1 : Setosa / 2 : Virginica 입니다. 각 품종과 함께 수집된 변수(features)는 a) sepal length : 꽃받침의 길이 (cm) b) sepal .. 2023. 8. 15.
[데이터분석] 웹 크롤링(Web Crawling) 기초 (파이썬, 코랩) 웹 크롤링의 기초에 대해서 알아보겠습니다. 1. 웹 크롤링(Web Crawling) / Selenium 라이브러리 / Selenium의 webdriver 웹 크롤링(Web Crawling)이란? - 웹 크롤링은 인터넷 상의 웹 페이지들을 자동으로 탐색하고 필요한 정보를 수집하는 프로세스를 말합니다. - 대표적인 웹 크롤링의 활용 사례는 1)정보 수집, 2)검색 엔진의 색인 구축, 3)가격 비교 웹사이트, 4)뉴스 집계 사이트 등 다양한 목적으로 활용될 수 있습니다. Selenium 라이브러리란? - Selenium은 웹 어플리케이션 자동화 및 테스트를 위한 포터블(Portable) 프레임워크 입니다. - 이를 활용해 웹 사이트를 테스트하고 브라우저 동작을 자동화할 수 있습니다. 이번 포스팅에서는 Sele.. 2023. 8. 15.
생성형 AI와 다른 인공지능의 차이점 생성형 AI는 인간이 직접 작성하지 않은 데이터를 바탕으로 스스로 새로운 데이터를 생성하는 기술이며, 이를 다룬 인공지능 기술들과의 차이점에 대해서는 아래와 같은 소주제 별로 차이점을 확인하면 그 구분이 더 명확해질 수 있습니다. 생성형 AI와 다른 인공지능의 차이점 1. 기술적인 차이점 생성형 AI와 머신러닝, 딥러닝 등의 기술들은 모두 인공지능 기술이지만, 그 작동 방식에 있어서 차이점이 존재합니다. 머신러닝과 딥러닝은 데이터를 학습하여 모델을 구축하는 기술인 반면, 생성형 AI는 이러한 모델 없이 바로 데이터를 생성하는 기술입니다. 이러한 기술적 차이점을 표로 정리해보면 다음과 같습니다. 2. 활용 분야의 차이점 생성형 AI는 주로 예술, 음악, 글쓰기, 영상 제작 등의 창의적인 분야에서 사용되는 .. 2023. 4. 23.
728x90
반응형