Machine Learning (ML)
-
선형 회귀 (Linear Regression) 모델이란?Machine Learning (ML) 2022. 10. 27. 18:25
실제 데이터를 바탕으로 모델을 만들어 예측하는데 있어 가장 직관적이고 간단한 모델은 선 (line) 이다. 예측한 모델을 설명할 수 있는 선을 찾아 분석하는 방법을 선형회귀분석 이라고 한다. 예시 다양한 분포가 있는 키와 몸무게 데이터가 있다. 이를 잘 설명할 수 있는 선을 그리면 특정인의 키를 바탕으로 몸무게를 예측할 수 있을 것이다. 그어진 선은 근사치를 가리키며, 이번 세션에서 자주 등장하는 ‘예측’ 이라는 단어는 말 그대로, 정확하진 않지만 최대한 가까운, 비슷한 값을 구하는데 의를 둔다.
-
Tabular Data 란?Machine Learning (ML) 2022. 10. 27. 03:11
Tabular Data 란? 엑셀 파일 형식이나 관계형 데이터베이스의 테이블에 담을 수 있는 데이터를 말한다. 크게 두 가지로 분류 할 수 있는데, 1. 정형 데이터 (Tabular) 2. 비정형 데이터 (이미지, 텍스트, 음성...) 정형 데이터란? 우리가 흔히 보는 데이터 베이스에 table 형태의 행과 열로 표현되는 데이터를 말한다. 분야를 막론하고 많은 데이터가 정형 데이터로 존재하기에 필수적인 데이터라고도 할 수 있다. tabular data의 유명한 예제 데이터로는 타이타닉 데이터셋이나 iris 붓꽃 데이터 등 이 있다. Tabular Data 의 특징을 세 부분으로 나누면? 1. 관측치 2. 변수 3. 관계
-
알고리즘과 모델이란?Machine Learning (ML) 2022. 10. 27. 02:46
알고리즘이란 ? [명사] 어떤 문제의 해결을 위하여, 입력된 자료를 토대로 원하는 출력을 유도하여 내는 규칙 즉, 알고리즘은 머신 러닝에서 문제를 풀기 위해 필수적으로 사용되는 방법을 말한다. 아래 수식은 알고리즘을 문자로 나타낸 형태이다. 두 개의 수식 중 보다 간단해 보이는 수식이 어떤 것 인가? 모델을 학습 시킬때는, 처음에는 간단한 알고리즘 부터 학습을 진행 시킨 뒤, (잘 되지 않을 때) 점차 복잡한 알고리즘을 사용하는 방법이 낫다. 그럼 , 어차피 마지막엔 복잡한 알고리즘을 사용 할 거라면, 처음부터 하면 사용하면 안될까 ? overfiting (과적합) 이 발생할 수 있다. (n212 참조) 모델이란 ? 주어진 데이터를 알고리즘을 이용해 학습을 진행 시켜보고 일치하는 일정 값을 도출하게 되면..
-
머신러닝을 사용하는 이유?Machine Learning (ML) 2022. 10. 26. 19:43
당신은 무한도전을 아는가 ? 초창기 무한도전에서는 무모한 도전이라는 컨텐츠로 기계 vs 인간의 대결 구도를 실험했었다. 당연히 결과는 매번 기계의 승리로 끝이 났다. 머신러닝에 대해 시작하기 전, 인간은 왜 기계를 이길 수 없을까? 라는 질문에 대한 답을 할 수 있는가? 답은 정말 쉽다. 나는 인간은 한계가 정해져 있기 때문에 라고 생각한다. 다만, 멍청한 컴퓨터와 사람이 협업을 한다면 그에따른 기대효과는 얼마나 성장할까? 여기서 부터, 머신러닝을 사용하는 이유에 대해 알 수 있다. 1. 컴퓨터는 인간보다 많은 데이터를 보고 예측할 수 있기 때문에 -> 시간 단축, 비용 절감의 효과 2. 새로운 데이터를 기반으로 예측을 스스로 개선할 수 있기 때문에 -> 새로운 데이터가 추가 될 때, 기존의 방법이라면 ..
-
지도학습과 비지도학습이란? (Feat. 회귀, 분류)Machine Learning (ML) 2022. 4. 28. 01:40
개요 여기 코끼리 사진이 있다. 이 사진을 보고 코끼리 라고 인지한 것은 내 도메인 지식으로 사진을 판단한것이라고 볼 수 있다. 이는 색깔이 회색이고, 코가 길고, 긴 상아를 갖고있는 등의 특징을 인지하여 우리가 그동안 알게 모르게 학습된 코끼리의 모습이라고 결정지을수 있는 요인일것같다. 그렇다면, 위 예시를 머신러닝으로 빗대어 보았을때 기계는 어떻게 학습을하고 그 결과로 사람의 결과와 비슷하게 맞출 수 있을까? 에 대해 글을 작성하려한다. 지도학습 정답을 알려주며 학습시키는것. 즉, 문제와 정답이 주어진 상황에서 학습을 통해 예측 값을 도출 하는 것을 의미한다. 예를들면 컴퓨터에게 이 사진은 코끼리다 라고 직접 학습시키는 방식이다. ex) 컴퓨터에게 사전에 고양이 사진을 학습 시켜 놓고, 강아지 사진을..
-
머신러닝이란?Machine Learning (ML) 2022. 4. 28. 00:58
개요 머신러닝이란? 머신 러닝은 새로운 프로그래밍 패러다임으로 불려지고 있다. 머신 러닝의 가장 큰 목적은 실제 데이터를 바탕으로 모델을 생성하고, 입력 받은 값을 토대로 출력 값에 대해 예측하는 데에 있다. 머신러닝은 인공지능에 속하는 일부라고 인지 할 수 있다. 인간이 학습과 데이터를 프로그래밍 하는 대신, 컴퓨터에 모델을 적용시켜 데이터로 하여금 학습하고 개선하는데 목적을 두고 있다. 머신러닝은 데이터셋의 패턴과 상관관계를 찾고 분석한 결과를 토대로 최적의 의사결정과 예측을 할 수 있도록 학습시키는 것이다. 즉, 머신러닝에서 최적의 예측은 데이터가 많을수록 정확도가 증가한다 라고 할 수 있다. 위 설명들을 조금더 풀어 쓴다면, 머신러닝은 데이터를 분석한 결과를 가지고 분류하거나 그 값을 예측하는것이..