독학/[책] 머신러닝+딥러닝

[혼공학습단 13기 혼공머신🤖] 혼자 공부하는 머신러닝 + 딥러닝 week1

최연재 2025. 1. 12. 02:59

📜기본 숙제 : 코랩 실습 화면 캡쳐

📜 추가 숙제 : Ch.02. (2-1) 확인 문제 풀이

정답 : 1 지도 학습

 

; 입력과 타깃을 이용해서 훈련을 하고 이를 이용해서 정답을 구하기 때문에 지도 학습이 답입니다.

 


🔖  Chap01. 나의 첫 머신러닝

1.1 인공지능과 머신러닝, 딥러닝

- 인공지능 : 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템

  • 인공일반지능, 강인공지능 : 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템
  • 약인공지능 : 특정 분야에서 사람의 일을 도와주는 보조 역할을 하는 컴퓨터 시스템

- 머신러닝 : 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구한느 분야

  • 인공지능의 하위 분야 중 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야
  • 대표적인 머신러닝 라이브러리 : 사이킷런

- 딥러닝 : 머신러닝 알고리즘 중 인공신경망을 기반으로 한 방법을 통칭

  • 대표적인 딥러닝 라이브러리 : 텐서플로, 파이토치

 

1.2 코랩과 주피터 노트북

- 코랩 

  • 셀 : 코랩에서 실행할 수 있는 최소 단위
    • 텍스트 셀
    • 코드 셀

- 노트북 

  • 코랩 노트북의 경우 구글 클라으드의 가상 서버를 이용

 

1.3 마켓과 머신러닝

- 생선 분류 문제

1️⃣ 도미 데이터 준비하기

  • 특성 : 데이터의 특징

2️⃣ 데이터 시각화

3️⃣ 빙어 데이터 준비하기

4️⃣데이터 시각화

 

- K-최근접 이웃 알고리즘

  • 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이털르 보고 다수를 차지하는 것을 정답으로 판단
  • predict() 메소드 : 새로운 데이터의 정답 예측

1️⃣ 리스트 합치기

2️⃣ 2차원 리스트 형태로 데이터 수정

3️⃣훈련

  • kn.score()의 결과 : 정확도

 

 

🔖  Chap02. 데이터 다루기

2.1 훈련 세트와 테스트 세트

- 지도 학습

  • 지도 학습에서의 데이터(입력) +  정답(타깃) = 훈련 데이터
  • 자도 학습을 훈련하기 위해서는 훈련데이터가 필요
  • 지도 학습이 정답을 맞추는 것을 학습

- 비지도 학습

  • 타깃 없이 입력 데이터만 사용
  • 데이터를 잘 파악할 수 있음

- 훈련 세트와 테스트 세트

  • 훈련 세트 : 훈련에 사용하는 데이터
  • 테스트 세트 : 평가에 사용하는 데이터

 

1️⃣ 데이터 준비

 

2️⃣ 49개의 데이터 중 35개를 훈련 세트로, 14개를 테스트 세트로 이용

3️⃣ 학습 진행 ➡️ 샘플링 편항 발생

  • 샘플링 편향 : 훈련 세트와 테스트 세트에 샘플이 골고루 섞이지 않아 샘플링이 한쪽으로 치우친 경우

 

- Numpy 이용

1️⃣ 데이터를 무작위로 섞기 

2️⃣ 학습 진행 ➡️ 정확도 100% 확인

 

2.2 데이터 전처리

- Numpy로 데이터 준비

 

- 사이킷런으로 훈련 세트와 테스트 세트 나누기

- 학습  ➡️ 예측이 다르게 나옴

 

❗x축과 y축의 값 범위가 달라서 발생 ➡️ 데이터 전처리 진행 필요

 

- 전처리 데이터로 모델 훈련하기

1️⃣ 전처리 진행

 

2️⃣ 훈련 및 확인

 

💭 느낀 점

머신러닝은 지난 학기에 수강했었는데, 이번에 복습하고 싶어서 머신러닝+딥러닝으로 혼공학습단을 신청했습니다. 이제 4번째 혼공학습단 활동인데 끝까지 잘 마무리해보겠습니다.