독학/[책] 머신러닝+딥러닝
[혼공학습단 13기 혼공머신🤖] 혼자 공부하는 머신러닝 + 딥러닝 week1
최연재
2025. 1. 12. 02:59
📜기본 숙제 : 코랩 실습 화면 캡쳐
📜 추가 숙제 : Ch.02. (2-1) 확인 문제 풀이
정답 : 1 지도 학습
; 입력과 타깃을 이용해서 훈련을 하고 이를 이용해서 정답을 구하기 때문에 지도 학습이 답입니다.
🔖 Chap01. 나의 첫 머신러닝
1.1 인공지능과 머신러닝, 딥러닝
- 인공지능 : 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템
- 인공일반지능, 강인공지능 : 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템
- 약인공지능 : 특정 분야에서 사람의 일을 도와주는 보조 역할을 하는 컴퓨터 시스템
- 머신러닝 : 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구한느 분야
- 인공지능의 하위 분야 중 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야
- 대표적인 머신러닝 라이브러리 : 사이킷런
- 딥러닝 : 머신러닝 알고리즘 중 인공신경망을 기반으로 한 방법을 통칭
- 대표적인 딥러닝 라이브러리 : 텐서플로, 파이토치
1.2 코랩과 주피터 노트북
- 코랩
- 셀 : 코랩에서 실행할 수 있는 최소 단위
- 텍스트 셀
- 코드 셀
- 노트북
- 코랩 노트북의 경우 구글 클라으드의 가상 서버를 이용
1.3 마켓과 머신러닝
- 생선 분류 문제
1️⃣ 도미 데이터 준비하기
- 특성 : 데이터의 특징
2️⃣ 데이터 시각화
3️⃣ 빙어 데이터 준비하기
4️⃣데이터 시각화
- K-최근접 이웃 알고리즘
- 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이털르 보고 다수를 차지하는 것을 정답으로 판단
- predict() 메소드 : 새로운 데이터의 정답 예측
1️⃣ 리스트 합치기
2️⃣ 2차원 리스트 형태로 데이터 수정
3️⃣훈련
- kn.score()의 결과 : 정확도
🔖 Chap02. 데이터 다루기
2.1 훈련 세트와 테스트 세트
- 지도 학습
- 지도 학습에서의 데이터(입력) + 정답(타깃) = 훈련 데이터
- 자도 학습을 훈련하기 위해서는 훈련데이터가 필요
- 지도 학습이 정답을 맞추는 것을 학습
- 비지도 학습
- 타깃 없이 입력 데이터만 사용
- 데이터를 잘 파악할 수 있음
- 훈련 세트와 테스트 세트
- 훈련 세트 : 훈련에 사용하는 데이터
- 테스트 세트 : 평가에 사용하는 데이터
1️⃣ 데이터 준비
2️⃣ 49개의 데이터 중 35개를 훈련 세트로, 14개를 테스트 세트로 이용
3️⃣ 학습 진행 ➡️ 샘플링 편항 발생
- 샘플링 편향 : 훈련 세트와 테스트 세트에 샘플이 골고루 섞이지 않아 샘플링이 한쪽으로 치우친 경우
- Numpy 이용
1️⃣ 데이터를 무작위로 섞기
2️⃣ 학습 진행 ➡️ 정확도 100% 확인
2.2 데이터 전처리
- Numpy로 데이터 준비
- 사이킷런으로 훈련 세트와 테스트 세트 나누기
- 학습 ➡️ 예측이 다르게 나옴
❗x축과 y축의 값 범위가 달라서 발생 ➡️ 데이터 전처리 진행 필요
- 전처리 데이터로 모델 훈련하기
1️⃣ 전처리 진행
2️⃣ 훈련 및 확인
💭 느낀 점
머신러닝은 지난 학기에 수강했었는데, 이번에 복습하고 싶어서 머신러닝+딥러닝으로 혼공학습단을 신청했습니다. 이제 4번째 혼공학습단 활동인데 끝까지 잘 마무리해보겠습니다.