독학/[동아리-FORZA] 데이터 분석 9

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week3

섹션 5📌 셀레니움 ver 4.0 가이드셀레니움 다운로드: cmd에 pip install selenium 입력webdriver_manager 다운로드: cmd에 pip install webdriver_manager 입력 웹사이트 자동화 종류크롤링로그인업로드다운로드좋아요 셀레니움 기본 설정from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.chrome.options import Options# 크롬 드라이버 자동 업데이트from webdriver_manager.chrome import ChromeDriverManager# 브라우저 꺼짐 방지chrome_options ..

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week2

섹션 3 : 실전 프로젝트 1) 뉴스 데이터 수집하기(1) 특정 검색어 뉴스의 제목과 링크를 크롤링하기📌 제목은 a 태그 안쪽 텍스트, 링크는 href 속성값.import requestsfrom bs4 import BeautifulSoupresponse =requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90")html = response.textsoup = BeautifulSoup(html, 'html.parser')links = soup.select(".news_tit") # 결과가 리스트print(links)print()for link in li..

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week1

나도코딩 데이터분석 및 시각화 강의를 완강하고 이번 주부터는 크롤링 강의를 듣기로 했다. https://www.inflearn.com/course/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%81%AC%EB%A1%A4%EB%A7%81-%EA%B8%B0%EC%B4%88/dashboard [무료] 이것이 진짜 크롤링이다 - 기본편 - 인프런 | 강의크롤링을 처음 배우는 분들을 위해 ① 가장 쉽고 ② 가장 친절하게 설명해 드립니다. 크롤링은 정말로 재미있습니다. 제가 책임지겠습니다. 믿고 따라와 보세요., - 강의 소개 | 인프런www.inflearn.com섹션 0 : 강의소개📌 크롤링 주의사항크롤링한 데이터를 무분별하게 상업적으로 이용하지 않는다.대상 서버에 부담을 주지 않도록 한다.섹션 1 ..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week6

📍기본 설정import matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic#matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체matplotlib.rcParams['font.size'] = 15 # 폰트 크기matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것 방지import pandas as pddf = pd.read_excel('../Pandas/score.xlsx')1. 산점도 그래프1.1 산점..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week5

📍기본 설정import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic#matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체matplotlib.rcParams['font.size'] = 15 # 폰트 크기matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것 방지df = pd.read_excel('../Pandas/score.xlsx..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week4

📍기본 설정import matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic#matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체matplotlib.rcParams['font.size'] = 15 # 폰트 크기matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것방지x = [1, 2, 3]y = [2, 4, 8]1. 범례1.1 범례를 포함해서 그래프 출력하기plt.plot(x, y, label='무슨 데..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week3

1. 데이터 수정1.1 Column 수정df['학교'].replace({'북산고':'상북고', '능남고':'무슨고'}) # 북산고를 전부 상북고로 변경, 능남고는 전부 무슨고로 변경# 실제 데이터를 변경하기 위해서는 inplace=True 속성을 지정하면 됨.📌 특정 열의 모든 값을 대/소문자로 변경하기df['SW특기'] = df['SW특기'].str.upper() #대문자로 변경df['SW특기'].str.lower() #소문자로 변경📌특정 열의 모든 값(문자열) 뒤에 특정 문자열 붙이기df['학교'] = df['학교']+'등학교' # 학교 데이터 전체 각각에 문자열 붙이기1.2 Column 추가df['총합'] = df['국어']+df['영어']+df['수학']+df['과학']+df['사회'] # 새..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week2

1. 데이터 선택 1.1 loc : 이름을 이용해서 원하는 row에서 원하는 col 선택import pandas as pddf = pd.read_excel('score.xlsx', index_col = '지원번호')dfdf.loc['인덱스 이름'] #index 이름에 해당하는 전체 데이터df.loc['index', 'col'] #index에 해당하는 col 데이터df.loc[['index, index2'], 'col'] #index, index2에 해당하는 col 데이터df.loc[['index', 'index2'], ['col','col2']] #index, index2에 해당하는 col, col2 데이터- df.loc에서 슬라이싱 사용 가능! (기존의 슬라이싱 문법과 다른 점 존재)❗시작:끝이 시작~..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week1

학회에서 데이터 스터디를 하고 여름방학부터 프로젝트를 하기로 했다. 스터디를 위해 첫 번째로 고른 강의는 다음과 같다.https://www.inflearn.com/course/%EB%82%98%EB%8F%84%EC%BD%94%EB%94%A9-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EC%8B%9C%EA%B0%81%ED%99%94/dashboard [무료] 파이썬 무료 강의 (활용편5) - 데이터 분석 및 시각화 - 인프런 | 강의파이썬을 활용하여 많은 양의 데이터를 분석하고, 분석한 데이터를 그래프 형태로 시각화하여 한 눈에 쉽게 파악할 수 있게 됩니다., - 강의 소개 | 인프런www.inflearn.com4월 10일부터 30일까지는 중간고사 기간으로 쉬어가고..