ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 감독학습 vs 비지도학습 (Supervised vs Unsupervised): 분류, 군집화
    practice_인공지능,머신러닝 2024. 10. 13. 14:14

    **감독학습(Supervised Learning)**과 **비지도학습(Unsupervised Learning)**은 머신러닝에서 데이터를 학습시키는 두 가지 주요 방식입니다. 두 방법의 차이와 주요 기법인 **분류(Classification)**와 **군집화(Clustering)**를 비교하면 다음과 같습니다.

    ### 1. **감독학습(Supervised Learning)**
    - **정의**: 입력 데이터와 그에 해당하는 **레이블(정답)**이 있는 경우에 사용됩니다. 주어진 데이터를 바탕으로 정답과 일치하는 패턴을 학습하고, 새로운 데이터에 대해 올바른 출력을 예측합니다.
    - **주요 목적**: 정답이 주어진 상태에서 데이터를 학습하여 미래의 입력에 대한 예측을 정확하게 수행하는 것.
    - **주요 알고리즘**:
        - **분류(Classification)**: 데이터가 특정 **카테고리**에 속하는지 예측하는 문제입니다. 예: 스팸 메일 필터링, 질병 진단.
            - **예**: 로지스틱 회귀, 결정 트리, 서포트 벡터 머신(SVM), K-최근접 이웃(KNN), 랜덤 포레스트, 신경망 등.
        - **회귀(Regression)**: 연속적인 값을 예측하는 문제입니다. 예: 주택 가격 예측, 온도 예측.
            - **예**: 선형 회귀, 다중 회귀 등.

    ### 2. **비지도학습(Unsupervised Learning)**
    - **정의**: 입력 데이터에 **레이블(정답)**이 없는 경우에 사용됩니다. 데이터의 숨겨진 패턴이나 구조를 찾는 것이 목적입니다.
    - **주요 목적**: 정답 없이 데이터 간의 관계나 패턴을 발견하고, 비슷한 데이터끼리 그룹화하거나 데이터의 분포를 분석하는 것.
    - **주요 알고리즘**:
        - **군집화(Clustering)**: 비슷한 데이터끼리 그룹을 만드는 문제입니다. 예: 고객 세분화, 이미지 분류.
            - **예**: K-평균(K-Means), 계층적 군집화, DBSCAN 등.
        - **차원 축소(Dimensionality Reduction)**: 데이터를 더 작은 차원으로 변환하면서 중요한 정보를 유지하는 방법입니다. 예: 주성분 분석(PCA), t-SNE.

    ### **분류(Classification) vs 군집화(Clustering)**

    #### **분류(Classification) - 감독학습**
    - **정답(레이블)**이 있는 데이터를 학습합니다.
    - 입력 데이터를 사전에 정의된 **클래스** 중 하나로 분류합니다.
    - **예**: 고양이와 개 이미지를 분류하거나, 고객의 신용 위험을 예측하는 문제.
      
    #### **군집화(Clustering) - 비지도학습**
    - **정답(레이블)**이 없는 데이터를 학습합니다.
    - 입력 데이터를 비슷한 특성을 가진 그룹(클러스터)으로 묶습니다.
    - **예**: 비슷한 고객을 그룹화하여 마케팅 전략을 세우거나, 유사한 뉴스 기사를 묶는 문제.

     

     



    ### 요약

    - **감독학습(Supervised Learning)**: 입력과 정답이 있는 데이터를 학습하여 새로운 데이터에 대한 예측을 수행합니다. 대표적인 방법은 **분류**(정해진 카테고리 예측)와 **회귀**(연속값 예측)입니다.
    - **비지도학습(Unsupervised Learning)**: 정답 없이 데이터 간의 관계를 파악하며, 대표적인 방법은 **군집화**(비슷한 데이터 그룹화)와 **차원 축소**입니다.

    **분류**는 **감독학습**의 문제이고, **군집화**는 **비지도학습**의 문제로, 둘 다 데이터를 그룹화하지만 정답 유무가 차이점입니다.

    'practice_인공지능,머신러닝' 카테고리의 다른 글

    04.Overfitting,Dropout,Weight Decay,Batch Normalization  (8) 2024.10.16
    05.CNN  (0) 2024.10.14
    01.데이터 전처리 (Data Pre-processing)  (0) 2024.10.13
    GPT3  (0) 2024.10.12
    Transformer, RNN 차이  (0) 2024.10.12
Designed by Tistory.