AI

AI

[ML] Linear Regression 구현, sklearn과 비교

단순한 데이터 단순한 데이터를 가지고 단변량 선형회귀분석을 머신러닝 라이브러리를 사용하지 않고 구현해보기 x_data = np.array([1,2,3,4,5], dtype=np.float64).reshape(5,1) y_data = np.array([3,5,7,9,11], dtype=np.float64).reshape(5,1) W = np.random.randn(1,1) # 1행 1열짜리 ndarray, 0과1사이의 균등분포에서 실수 난수 추출 b = np.random.randn(1) # 1차원 # learning rate의 값 설정 learning_rate = 1e-4 print('W : ', W) print('b : ', b) W는 weight, b는 bias를 의미한다 y = Wx + b 이며 lo..

AI

[ML] Linear Regression

회귀란? 쉽게 말하면 어떤 데이터에 대해서 그 데이터에 영향을 주는 조건들의 영향력을 고려하여 데이터에 대한 조건부 평균을 구하는 기법이다. 회귀모델은 여러 조건 하에 평균을 추정할 수 있게하는 효율적인 방법이다. Linear Regression 선형 회귀는 일차식을 이용한 회귀모델이다 독립 변수가 하나일 때는 단변량 선형회귀, 둘 이상일때는 다변량 선형회귀라고 한다. yi=wxi+by_i = wx_i +byi​=wxi​+b w=weigt,b=biasw = weigt, b= biasw=weigt,b=bias 다음과 같은 데이터가 있을 때 시험점수 몇 점을 받을까를 공부 시간이라는 변수 하나만 가지고 예측하는 것이 단변량 회귀분석이라고 할 수 있다. 이 데이터를 scatter로 시각화하면 다음과 같다. ..

AI

파이썬으로 수치미분 구현하기 - 중앙차분

중앙차분 전향차분, 후향차분보다 값이 정확하다. delta x는 10의 -4승, 1e-4 이용 너무 작은 값을 이용하면 실수 계산에서 오류나 나타날 수 있다. 단변수 함수의 수치미분 [함수] f(x) = x^2 f'(x) = 2x def my_func(x): return x **2 def numerical_derivative(f, x): delta_x = 1e-4 return (f(x+delta_x) - f(x-delta_x)) / (2 * delta_x) print(numerical_derivative(my_func, 5) >> 9.999999999976694 numberical_derivative의 인자로 my_funce라는 함수를 넣어주었는데 이는 파이썬이 일급함수(first-classes func..

AI

Machine Learning 개요

AI(artificial Intelligence) 인공지능 → 사람의 사고능력을 구현한 프로그램 Strong AI 사람과 구별할 수 없는 정도의 강한 AI. 전자기적 방식으로 사고하므로 생화학적 방식으로 사고하는 사람보다 100만배정도 사고속도가 빠르다. 만드는 방법조차 모른다 Weak AI 특정 영역에서 잘 동작하는 AI ex. 챗봇, 자율주행, 검색 기존 프로그램 방식 rule based programming | explicit programming 어떠한 조건, 알고리즘에 따라 수행되는 프로그램 방식 이 방식으로는 조건이 너무 많을 때 문제를 해결하는 것이 쉽지 않음 Machince Learning AI를 구현하기 위한 하나의 방법론이다. 데이터를 기반으로 특성과 패턴을 파악하여 모델이라는 결과를 ..

AI

기술통계 - 2차원 데이터

2차원(2변수) 데이터 수치지표 : 공분산, 상관계수 그래프 : scatter 공분산 Covariance Sxy=1n∑i=1N(xi−x‾)(yi−y‾)S_{xy} = {1 \over n} \sum_{i=1}^N(x_i - {\overline x})( y_i-{\overline y})Sxy​=n1​i=1∑N​(xi​−x)(yi​−y​) 공분산의 값이 양수 : 양의 상관 관계를 가진다 음수 : 음의 상관 관계를 가진다 0 : 두 변수의 관계가 없다 공분산이 0에 가까울수록 상관 관계가 없다고 말할 수 있다. 공분산의 크기는 상관이 없다. 데이터의 단위가 모두 다르기 때문! 초록선 : 평균 각 점의 x 편차, y편차를 구해 곱하면 면적이 나옴 물론 면적은 음수가 존재하지 않지만, 그렇다치면... 그 면적들을 ..

AI

기술통계 - 1차원 데이터

1차원(1변수) 데이터대표값데이터를 하나의 값으로 요약한 지표→평균, 중위값, 최대, 최소,,,,,평균x‾=1n∑i=1nxi=1n(x1+x2+x3+...+xn)\overline {x} = {1 \over n} \sum_{i=1}^nx_i = {1 \over n}(x_1 + x_2 + x_3 + ... + x_n)x=n1​i=1∑n​xi​=n1​(x1​+x2​+x3​+...+xn​)단점 : 이상치( outlier)에 취약함⇒ 절사평균(Tirmmed mean) : 이상치를 제거한 평균중위값(median) 값들의 중간 값[1, 2, 3, 4, 5, 6, 7] : 4가 중위값[1, 2, 3, 4, 5, 6] : 3과 4의 평균이 중위값최빈값(mode)가장 많이 등장한 값[1, 1, 1, 2, 2, 3] ⇒ 1이..

Heaea
'AI' 카테고리의 글 목록 (4 Page)