[ISLP Chapter 9] 서포트 벡터 분류기

통계/ISLP

notty 2024. 3. 20. 13:23

728x90

최적의 초평면을 찾아보자!!

초평면(Hyperplane)

: 주어진 차원보다 한 차원 낮은 아핀(affine)부분공간을 의미한다

ex) p차원 --> (p-1)차원의 초평면을 갖는다, 2차원 --> 1차원의 초평면을 갖는다

하지만 클래스를 분류하는 초평면은 무수히 많음...

--> 마진을 최대로 하는 최적의 초평면을 찾자 ==> 최대 마진 분류기

* 마진(Margine) : 서포트벡터와 초평면과의 수직거리

최대 마진 분류기(Maximum margin classifier) => 하드 마진(Hard margin)

: 마진을 최대로 하는 초평면

관측치들과 분류 초평면의 거리를 계산하는데 이떄의 관측치는 서포트 벡터를 의미한다
--> 최대마진 초평면은 서포트 벡터에 직접적으로 의존적이다 (거리 계산시 서포트 베터만 사용하여 연산량 작아짐, 하지만 서포트 벡터를 찾는 과정을 고려한다면 크게 연산량이 적어지지는 않음)
- (9.9) M(margin)을 최대로 하는 파라미터(베타)를 찾는것이 목표
- (9.10) 제약
  모든 파라미터 제곱의 합은 1
- (9.11) 제약
  M이 양수이면 각 관측치가 초평면의 올바른 쪽에 존재할것을 보장한다.

하지만

--> 오차를 어느정도 허용하는 초평면을 사용한다 ==> 소프트 마진(Sofㅅ margin)

소프트 마진(Soft margin)

: 오차를 허용하는 정도를 조절

ε : 개별 관측치들이 초평면의 옳지 않은 곳에 있을 수 있ㄱ 하는 슬랙변수(slack variable)
- εi = 0 : 마진의 올바른 쪽에 있
- εi > 0 : i 번째 관측치는 마진의 옳지 않은 쪽에 있다
- εi > 1 : 관측치는 초평면의 옳지 않은 쪽에 있다
조율파라미터(C) : 허용될 위반의 수와 그 정도를 결정, cv를 통해 최적의 값을 찾는다
- 오차( ε )의 합을 한정
- C = 0 : 오차를 허용하지 않는다
- C > 0 : 초평면의 옳지 않은 쪽에 있을 수 있음
C에 따른 편향(bias)-분산(variance) 절충
- C가 큰 경우 -> 마진 넓 -> 허용오차 많아짐 -> 분산 낮아짐, 편향 증가
  * 서포트 벡터가 많아짐
- C가 작은 경우 -> 마진 좁 -> 허용오차 적어짐(모델이 데이터에 고도로 적합) -> 분산 높아짐, 편향 감소
  *서포트 벡터가 적어짐

728x90

[ISLP Chapter 10] Single/Multi Layer NN (0)	2024.04.25
[ISLP Chapter 9] 서포트 벡터 머신 (0)	2024.04.22
[ISLP Chapter 7] 조각별 다항식 회귀 (Piecewise polynomial regression) (0)	2024.03.09
[ISLP Chapter 7] 기저함수 (0)	2024.03.06
[ISLP Chapter 7] 계단함수 (0)	2024.03.06

250x250

notty

파이썬, 벡터db, 개발자, 딥러닝, Pinecone, kaggle learn, pandas기초, 다항식회귀, pandas, 통계, 그래프, Algorithm, DP, 알고리즘, 이분탐색, 위키북스, 인공지능, 통계학습, 파이토치, chunksize,

notty