학회&동아리 19

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week3

섹션 5 📌 셀레니움 ver 4.0 가이드 셀레니움 다운로드 : cmd에 pip install selenium 입력 webdriver_manager 다운로드 : cmd에 pip install webdriver_manager 입력 웹사이트 자동화 종류 크롤링 로그인 업로드 다운로드 좋아요 셀레니움 기본 설정 from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options # 크롬 드라이버 자동 업데이트 from webdriver_manager.chrome import ChromeDriverManager # 브라우저 꺼짐 방지..

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week2

섹션 3 : 실전 프로젝트 1) 뉴스 데이터 수집하기 (1) 특정 검색어 뉴스의 제목과 링크를 크롤링하기 📌 제목은 a 태그 안쪽 텍스트, 링크는 href 속성값. import requests from bs4 import BeautifulSoup response =requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90") html = response.text soup = BeautifulSoup(html, 'html.parser') links = soup.select(".news_tit") # 결과가 리스트 print(links) print() for ..

[FORZA STUDY] 스타트 코딩 - 이것이 진짜 크롤링이다 기본편 week1

나도코딩 데이터분석 및 시각화 강의를 완강하고 이번 주부터는 크롤링 강의를 듣기로 했다. https://www.inflearn.com/course/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%81%AC%EB%A1%A4%EB%A7%81-%EA%B8%B0%EC%B4%88/dashboard [무료] 이것이 진짜 크롤링이다 - 기본편 - 인프런 | 강의 크롤링을 처음 배우는 분들을 위해 ① 가장 쉽고 ② 가장 친절하게 설명해 드립니다. 크롤링은 정말로 재미있습니다. 제가 책임지겠습니다. 믿고 따라와 보세요., - 강의 소개 | 인프런 www.inflearn.com 섹션 0 : 강의소개 📌 크롤링 주의사항 크롤링한 데이터를 무분별하게 상업적으로 이용하지 않는다. 대상 서버에 부담을 주지 않도록 한다...

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week6

📍기본 설정 import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic #matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체 matplotlib.rcParams['font.size'] = 15 # 폰트 크기 matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것 방지 import pandas as pd df = pd.read_excel('../Pandas/score.xlsx') 1. 산점도 그..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week5

📍기본 설정 import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic #matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체 matplotlib.rcParams['font.size'] = 15 # 폰트 크기 matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것 방지 df = pd.read_excel('../Pandas/sc..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week4

📍기본 설정 import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family'] = 'Malgun Gothic' # Windows, Mac일 때는 AppleGothic #matplotlib.rcParams['font.family'] = 'HYGungSo-Bold'# 궁서체 matplotlib.rcParams['font.size'] = 15 # 폰트 크기 matplotlib.rcParams['axes.unicode_minus'] = False # 한글 폰트 사용 시 마이너스 글자가 깨지는 것방지 x = [1, 2, 3] y = [2, 4, 8] 1. 범례 1.1 범례를 포함해서 그래프 출력하기 plt.plot(x, y, l..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week3

1. 데이터 수정 1.1 Column 수정 df['학교'].replace({'북산고':'상북고', '능남고':'무슨고'}) # 북산고를 전부 상북고로 변경, 능남고는 전부 무슨고로 변경 # 실제 데이터를 변경하기 위해서는 inplace=True 속성을 지정하면 됨. 📌 특정 열의 모든 값을 대/소문자로 변경하기 df['SW특기'] = df['SW특기'].str.upper() #대문자로 변경 df['SW특기'].str.lower() #소문자로 변경 📌특정 열의 모든 값(문자열) 뒤에 특정 문자열 붙이기 df['학교'] = df['학교']+'등학교' # 학교 데이터 전체 각각에 문자열 붙이기 1.2 Column 추가 df['총합'] = df['국어']+df['영어']+df['수학']+df['과학']+df['..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week2

1. 데이터 선택 1.1 loc : 이름을 이용해서 원하는 row에서 원하는 col 선택 import pandas as pd df = pd.read_excel('score.xlsx', index_col = '지원번호') df df.loc['인덱스 이름'] #index 이름에 해당하는 전체 데이터 df.loc['index', 'col'] #index에 해당하는 col 데이터 df.loc[['index, index2'], 'col'] #index, index2에 해당하는 col 데이터 df.loc[['index', 'index2'], ['col','col2']] #index, index2에 해당하는 col, col2 데이터 - df.loc에서 슬라이싱 사용 가능! (기존의 슬라이싱 문법과 다른 점 존재) ❗..

[FORZA STUDY] 나도코딩 - 데이터분석 및 시각화 week1

학회에서 데이터 스터디를 하고 여름방학부터 프로젝트를 하기로 했다. 스터디를 위해 첫 번째로 고른 강의는 다음과 같다. https://www.inflearn.com/course/%EB%82%98%EB%8F%84%EC%BD%94%EB%94%A9-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EC%8B%9C%EA%B0%81%ED%99%94/dashboard [무료] 파이썬 무료 강의 (활용편5) - 데이터 분석 및 시각화 - 인프런 | 강의 파이썬을 활용하여 많은 양의 데이터를 분석하고, 분석한 데이터를 그래프 형태로 시각화하여 한 눈에 쉽게 파악할 수 있게 됩니다., - 강의 소개 | 인프런 www.inflearn.com 4월 10일부터 30일까지는 중간고사 기간으로 ..