ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [생활코딩 - 머신러닝 야학] 머신러닝1 day3, 4
    공부일기/머신러닝 야학 2020. 8. 18. 22:38

    이미지 출처: https://opentutorials.org/course/4548

    1 - 11. 직업의 시작

    데이터 자체는 현실이 아니지만 현실을 데이터로 표현할 수 있다면 컴퓨터로 많은 양의 데이터를 처리할 수 있게 되고 데 이터를 처리하는 방법 중의 하나가 머신러닝이다. 

    데이터 산업은 데이터 과학과 데이터 공학으로 분류할 수 있다. 데이터 과학은 데이터를 만들고 만들어진 데이터를 이용하는 일이라고 할 수 있고, 데이터 공학은 데이터를 다루는 도구를 만들고 관리하는 일이라고 할 수 있다.

     

    1 - 12. 표

    데이터 산업을 입문하는데 있어 표를 이해하는 것은 굉장히 중요한 일이다. 행은 개체, 관측치, 기록, 사례, 경우 등으로도 사용되며 열은 특성, 속성, 변수, 필드와 같은 표현으로도 사용된다.

     

     

    1 - 13. 독립변수와 종속변수

    표에서 의미있는 데이터를 뽑아낼 수 있어야 한다. 통찰력은 의미있는 데이터를 얼마나 잘 추출하느냐에 달려있다.  독립변수와 종속변수는 원인과 결과에 비유할 수 있다. 독립변수와 종속변수의 관계는 인과관계이다. 인과관계과 상관관계를 구별하는 것도 중요한데, 인과관계는 상관관계 안에 포함되어 있어 상관관계를 인과관계로 오해하면 안 되고 적은 수의 데이터로 상관관계가 있다고 단정지을 수 없다. 

     

     

    1 - 14. 심리전

     

     

    1 - 15. 머신러닝의 분류

    위 사진이 기계학습의 전부는 아니다. 이미지 출처: https://opentutorials.org/course/4548/28934

     

    • 지도학습: 기계를 가르치는 것. 문제집을 푸는 것에 비유할 수 있다. 문제와 정답을 비교하고 맞추다 보면 문제풀이에 익숙해 지고 비슷한 문제를 만나면 정답을 맞출 가능성이 높아진다. 데이터로 컴퓨터를 학습시키고 모델을 만드는 방식을 지도학습이라고 한다. 

     

    • 비지도학습: 지도학습에 포함 되지 않는 방법들이다. 대체로 기계에게 데이터에 대한 통찰력을 부여하는 과정이다. 관찰을 통해 새로운 의미나 관계를 밝혀내는 것. 데이터의 성격을 파악하거나 데이터를 정리하는 데 주로 사용된다. 

     

    • 강화학습: 어떻게 하는 것이 더 좋은 결과를 낼 수 있는지 기계가 스스로 깨우치게 한다. 경험을 통해 더 좋은 답을 찾아가는 학습과정. 

     

    1 - 16. 지도학습

    머신러닝의 지도학습을 이용하기 위해선 충분히 많은 데이터를 수집해야 한다. 그리고 데이터는 독립변수와 종속변수로 이뤄져 있어야 한다.

    지도학습을 하기 위해서는 과거의 데이터가 있어야 하고 그 데이터를 독립변수(원인)과 종속변수(결과)로 분리해야 한다. 독립변수와 종속변수의 관계를 컴퓨터에게 학습시키면 컴퓨터는 그 관계를 설명하는 공식을 만들고 이 공식을 '모델'이라고 한다. 

    데이터가 많을수록, 정확할수록 좋은 모델을 만들 수 있고, 모델이 있으면 결과를 모르는 원인을 입력했을 때 예상되는 결과를 계산해서 알려줄 수 있다.

     

     

    1 - 17. 회귀

    예측하고 싶은 종속변수가 숫자일 때 회귀를 사용한다. 공부시간과 시험점수와의 관계, 역세권 여부와 집값의 관계, 자동차 속도와 충돌시 사망률의 관계 등이 회귀의 예시이다.

     

     

    1 - 18. 분류

    예측하고 싶은 종속변수가 이름이나 문자일 때 분류를 사용한다. 손톱깨무는 예시를 보면 이미지가 나타났을 때 손톱을 깨무는 지, 정상인지 분류할 수 있었다. 분류가 지도학습일 수 있는 이유는 과거의 데이터를 이용했고, 독립변수와 종속변수로 이뤄져 있기 때문에 지도학습이다. 사진이 독립변수, 손톱이나 정상과 같은 변수는 종속변수이다. 스팸메일 여부, 코로나 양성/음성 여부, 품종과 숙성기간에 따른 와인의 등급의 관계 등이 분류의 예시이다.

     

Designed by Tistory.