공부일기/머신러닝 야학
-
[생활코딩 - 머신러닝 야학] 텐서플로우 day 5/ 후기공부일기/머신러닝 야학 2020. 8. 27. 00:12
1 - 18. 히든레이어 기존의 퍼셉트론을 여러 개 사용해 연결하면 신경망을 깊게 만들 수 있다. 입력 부분인 Input Layer와 출력 부분인 Output Layer 사이에 추가돼 있는 것을 Hidden Layer라고 하는데, 밑의 사진을 기준으로 인풋과 아웃풋 사이에 하나의 층을 쌓아 모델을 구성한 것이다. 층으로 쌓은 레이어는 다섯 개의 노드를 갖고 있다. 결과를 만들기 위해서 히든레이어 모든 값들을 입력으로 하는 하나의 퍼셉트론이 필요하다. 그리고 히든레이어의 첫 번째 노드를 만들기 위해서도 하나의 퍼셉트론이 필요하다. [인풋레이어 - 히든레이어]를 하나의 모델로 보게 되면 13개의 입력을 받고 5개의 출력을 하는 모델이 되고, [히든레이어 - 아웃풋레이어]를 하나의 모델로 보게 되면 5개의 입..
-
[생활코딩 - 머신러닝 야학] 텐서플로우 day 3,4공부일기/머신러닝 야학 2020. 8. 25. 22:22
1 - 10. 보스턴 집값 예측 1 - 11. 수식과 퍼셉트론 13개의 입력으로 부터 한개의 출력을 만들어내는 구조를 만든다. 한개의 출력을 만드는 구조의 완전한 표현은 y = w1x1 + w2x2 + ... + w13x13 + b 수식이다(예제 기준). 컴퓨터는 입력되는 수식의 y와 x를 보고 w와 b를 찾게 된다. 뉴런이 실제 두뇌세포의 이름이면, 이 뉴런역할을 하는 모형의 이름을 퍼셉트론이라고 한다. w는 가중치, b는 편향이라고 부른다. 1 - 12. 보스턴 집값 예측(실습) # 파일 읽어오기 파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv' 보스턴 = pd.read_csv(파일경로) # 모양 ..
-
[생활코딩 - 머신러닝 야학] 텐서플로우 day 1,2공부일기/머신러닝 야학 2020. 8. 23. 18:27
생활코딩 머신러닝 야학 머신러닝1을 다 학습하고 텐서플로우로 넘어왔다. 코딩을 몰라도 머신러닝을 체험(?)할 수 있는 오렌지3 강의도 있었지만, 코딩 공부도 같이 할 수 있게 코드를 직접 짜보는 수업을 택했다. 1 -2. 목표와 전략 1 - 3. 지도학습의 빅픽처 머신러닝의 프로세스를 설명한다. 그림으로 쉽게 나타내 보면 이렇다. 1 - 4. 환경설정 1 - 5. 판다스 표에서 변수는 열로 표현되고 관측치에 따라 값이 변화할 수 있다는 의미가 있다. 원인은 독립변수, 결과는 종속변수. 지도학습은 이 두 가지를 분리하는 것에서 시작할 수 있다. 1 - 6. 판다스(실습) pd.read_scv('/경로/파일명.csv') # 파일 읽어오기 print(데이터.shape) # 모양 확인하기 데이터[['칼럼명1',..
-
[생활코딩 - 머신러닝 야학] 머신러닝1 day5, 6공부일기/머신러닝 야학 2020. 8. 19. 22:40
1 - 19. 군집화 군집화(clustering)는 비슷한 것들을 찾아서 그룹을 만드는 것. 분류와 혼동될 수 있으나 분류보다는 포괄적인 개념이다. 어떤 대상들을 구분해서 그룹을 만드는 것이 군집화라면 분류는 어떤 대상이 어떤 그룹에 속하는지 판단하는 것이다. 예를 들어 전 국민에게 물류서비스를 제공해야 하고, 100개의 물류센터를 만든다고 가정할 때, 전 국민의 지도상 위치(위도와 경도)를 참조해 적절히 100개의 그룹으로 묶어야 한다. 이때 이 그룹을 군집(cluster)이라고 하며 이런 군집을 만드는 것을 군집화(clustering)라고 한다. 묶어야 할 그룹들이 많아지고, 참고해야 할 특징들(위에서는 위도와 경도)이 많아진다면 자연스럽게 인간의 계산 범위를 넘어서고, 컴퓨터에게 계산을 시키는 게 ..
-
[생활코딩 - 머신러닝 야학] 머신러닝1 day3, 4공부일기/머신러닝 야학 2020. 8. 18. 22:38
1 - 11. 직업의 시작 데이터 자체는 현실이 아니지만 현실을 데이터로 표현할 수 있다면 컴퓨터로 많은 양의 데이터를 처리할 수 있게 되고 데 이터를 처리하는 방법 중의 하나가 머신러닝이다. 데이터 산업은 데이터 과학과 데이터 공학으로 분류할 수 있다. 데이터 과학은 데이터를 만들고 만들어진 데이터를 이용하는 일이라고 할 수 있고, 데이터 공학은 데이터를 다루는 도구를 만들고 관리하는 일이라고 할 수 있다. 1 - 12. 표 데이터 산업을 입문하는데 있어 표를 이해하는 것은 굉장히 중요한 일이다. 행은 개체, 관측치, 기록, 사례, 경우 등으로도 사용되며 열은 특성, 속성, 변수, 필드와 같은 표현으로도 사용된다. 1 - 13. 독립변수와 종속변수 표에서 의미있는 데이터를 뽑아낼 수 있어야 한다. 통찰..
-
[생활코딩 - 머신러닝 야학] 머신러닝1 day2공부일기/머신러닝 야학 2020. 8. 17. 19:41
1 - 7. 머신러닝머신 머신러닝을 이용하지 않으면 그저 신기한 것에 불과한다. 학습자가 아닌 공학자의 마인드로 유용한 것에 도전을 해야 한다. 여기서 저번 시간에 실습해본 teachablemachine 모델을 갖고 스크래치의 형식으로 코딩을 했다. 어플이 만들어지면 이런 느낌이겠구나하는 것을 웹을 통해 간접적으로 체험할 수 있었다. 1 - 8. 애플리케이션과 프로그램 애플리케이션은 어떤 기능을 부품으로 해서 만든 완제품이라고 볼 수 있다. 1 - 7 에서 만들어 본 애플리케이션은 머신러닝의 모델이라는 부품을 응요해서 만든 소프트웨어이다. 머신러닝과 같은 기술이 그런 것 처럼 이제는 인류에게 없던 부품(머신러닝 모델)을 쉽고 빠르고 무료로 사용할 수 있게 됐고 부품을 잘 활용하면 원리를 몰라도 부품의 능..
-
[생활코딩 - 머신러닝 야학] 머신러닝1 day1공부일기/머신러닝 야학 2020. 8. 16. 14:00
유튜브에 '생활코딩'이라는 채널이 있다. 아마 프로그래밍을 공부하는 분들이라면 한 번씩은 다 들어봤을 법한 유명한 채널이다. 8/13일부터 구글과 생활코딩 채널, 그리고 오픈튜토리얼스가 만든 '머신러닝 야학'이라는 컨텐츠를 진행한다고 해서 참가신청을 하고, 기다리고 있었다. 그리고 오늘부터 시작하게 됐고, 하루 늦게 시작했지만 매일매일 내가 배운 것들을 정리하기 위해 블로그 글로 남긴다. 1 - 2. 머신러닝이란? 결정 = 비교+ 선택. 무엇이 좋은 무엇이 더 나쁜지를 파악할 수 있다면 선택은 기계적인 게 된다. 비교가 쉽지 않은 경우가 많다. 이럴 때 특히 결정을 내리기는 더욱 어려워지게 된다. 인류는 좋은 결정을 하기 위해 몸부림을 쳐왔고 이를 위해 숫자와 같은 도구를 만들어 냈다. 이 도구들도 점점..