2025/02 2

[혼공학습단 13기 혼공머신🤖] 혼자 공부하는 머신러닝 + 딥러닝 week5

📜기본 숙제 : k-평균 알고리즘 작동 방식 설명하기 1️⃣ 무작위로 k개의 클러스터 중심을 정한다.2️⃣ 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다.3️⃣ 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다.4️⃣ 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복한다. 📜 추가 숙제 : Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기 Q1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분의 개수는 몇 개일까요?A1. 20 ;특성의 개수만큼 주성분을 찾을 수 있다. Q2. 샘플 개수가 1000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉 이 데이터셋의 크기는 (1000, 100)입니다. 이 데이터를..

[혼공학습단 13기 혼공머신🤖] 혼자 공부하는 머신러닝 + 딥러닝 week4

📜기본 숙제 : 교차 검증을 그림으로 설명하기   📜 추가 숙제 : Ch.05(05-3) 앙상블 모델 손코딩 코랩 화면 인증하기 아래 내용 정리에서 확인하실 수 있습니다.   🔖  Chap05. 트리 알고리즘 5.1 결정 트리1) 로지스틱 회귀로 와인 분류하기 - 설명하기 쉬운 모델과 어려운 모델 2) 결정 트리 - 트리의 높이를 제한하고, 어떤 특성으로 나뉘는지 정보 추가- 불순도결정 트리 모델은 부모 노드와 자식 노드의 불순도 차이가 최대한 크도록 트리를 성장시킴지니 불순도 = 1 - (음성 클래스 비율2 + 양성 클래스 비율2)정보 이득 :  부모와 자식 노드 사이의 불순도 차이엔트로피 불순도 : -음성 클래스 비율 * log2(음성 클래스 비율) - 양성 클래스 비율 * log2(양성 클래스..