728x90

AI 2

Affine 계층 계산 그래프에서 역전파시 전치행렬이 나오는 이유

Affine 계층을 보면 1번의 네모 박스에서 갑자기 전치행렬이 등장하는 것을 확인할 수 있다. 물론, 수학적으로 사고가 조금 되시는 분들은 왜 전치행렬이 등장하는지 아실수 있을거 같으나, 이전에 스칼라를 이용해 역전파를 구성했을때는 전치행렬이 아닌 그냥 W 가 곱해져야 하는게 아닌가? 라고 사고할수도 있다고 생각한다. 나와같이 이런 궁금중을 가진 사람이 또 존재할까봐 한번 수식으로 증명해보며 확인해보려고 한다.탐구이럴때는 사실 작은 예시를 하나 만드는게 가장 편하다. 아래와 같은 작은 식이 하나 있다고 해보자 $$Y = W*X$$ X, W, Y 에 관한 정의는 아래와 같다X 는 (1,2) 행렬이다.W 는 (2,3) 행렬이다.W*X 의 곱의 결과가 Y 이므로 Y 는 (1,3) 의 행렬이 된다.$$X = ..

AI 2025.01.04

머신러닝 공부 1일차) 지도 학습 VS 비지도 학습

시작하며머신러닝 공부를 시작하는 이유는 요새 LLM 등이 핫한데 이것 저것 만지다보니, 어떻게 이렇게 사고하는 모델을 만들었을까? 되게 궁금증이 많이 들었고 이런 기술을 좀 더 잘 이해하기 위해서는 기초 수학 -> 머신 러닝 -> 딥러닝 -> LLM 순으로 공부해서 조금 이해도를 점진적으로 확장시켜야 겠다는 생각을 했다. 여하튼, 이게 도움이 될지 안될지는 모르겠지만, 지금 당장 AI 를 공부하는것이 흥미 있어서 2025년은 조금 AI 공부에 많은 시간을 쏟지 않을까 싶다.머신러닝이란?머신러닝이란 주어진 데이터를 기반으로 일련의 패턴을 찾아 학습된 모형을 만드는 것을 뜻합니다. 학습된 모형을 이용해 제공되는 데이터에 대한 분류가 이뤄지거나, 일련의 예측등을 수행합니다.지도 학습 vs 비지도 학습지도학습은..

AI 2024.12.05
728x90