빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3]

20대 성장기/공부

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3]

방구석주희 2021. 11. 18. 16:04

728x90

#사용자정의 함수 만들기

def 함수이름(인수) :

함수가 실행되면 실행될 문장 1

함수가 실행되면 실행될 문장 2

return 출력할 결과값

> 'p'라는 이름의 함수(모듈)을 저장하면 작업 폴더의 위치에 상관없이 불러올 수 있다.

> 웹크롤링에서 사용하는 주요 모듈

- 웹페이지 분석 : beautifulsoup

- 브라우저 제어 : selenium

- 데이터 분석 : numpy, pandas

#패키지 가져오기 import 패키지명

#패키지에서 원하는 모듈만 가져오기 from 패키지 import 모듈명

#디렉토리 변경

import os
#지금 디렉토리는?
print(os.getcwd())

#디렉토리 변경

os.chdir()

#지정된 폴더 내 파일과 목록을 출력하는 함수

os.listdir()

#폴더만들기

os.makedirs()

> 폴더(py_temp2) 만들어서 디렉토리 변경

#txt파일 관리하기

w : 쓰기a : 이어쓰기r : 읽기(기본)

> 디렉토리 py_temp2에 test1이라는 txt파일을 생성

> 내용 추가

#파일내용읽기

f=open("readme.txt","r")
f.readlines()

(base) C:\Windows\system32>conda install pandas

#pandas 설치/엑셀파일 만들 수 있음

#예외처리 : 버그가 생겼을 때 무시하고 진행

try :

예외가 발생할 문장

except 예외 종류 :

발생하면 실행할 문장

else :

발생하지 않았을 때 실행할 문장

no1 = int(input("숫자를 입력하세요:"))
no2 = int(input("숫자를 입력하세요:"))

try :
no3 = no1 / no2

#에러코드 넣어주기
except ZeroDivisionError :
   print("0을 나눌수 없습니다. 진짜루 !")
except TypeError :
   print("숫자만 쓰세요 !")
else :
    print( " 결과값은 : ", no3 )

1. 검색자동화 구현하기

#설치

conda install bs4
conda install selenium

#크롬 버전 확인

>도움말 >크롬정보 >버전 95.0.4638.69(공식 빌드) (64비트)

'크롬드라이버' 검색해서 버전에 맞는 드라이버 다운로드

다운로드된 chromedriver 복사해서 사용하고 있는 디렉토리(py_temp2)에 붙여넣기

2. riss 크롤링

>모듈과 패키지 불러오기

#Step 1. 필요한 모듈을 로딩합니다

from selenium import webdriver

import time

#Step 2. 사용자에게 검색 관련 정보들을 입력 받습니다.

query_txt = input('1.수집할 자료의 키워드는 무엇입니까?(여러개일 경우 , 로 구분하여 입력): ')

print("\n")

#Step 3. 크롬 드라이버 설정 및 웹 페이지 열기

chrome_path = "c:/py_temp/chromedriver.exe"

driver = webdriver.Chrome(chrome_path)

url = 'http://www.riss.kr/'

driver.get(url)

time.sleep(2)

#Step 4. 자동으로 검색어 입력 후 조회하기

element = driver.find_element_by_id("query")

driver.find_element_by_id("query").click( )

element.send_keys(query_txt)

element.send_keys("\n")

728x90

저작자표시 비영리 변경금지

'20대 성장기 > 공부' 카테고리의 다른 글

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [4] 웹크롤링 (0)	2021.11.23
빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3-2] 코드 정리 (0)	2021.11.23
빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [2] (0)	2021.11.16
빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [1] (0)	2021.11.11
논문 쓰는데 필요한 R 프로그래밍 코드 정리 : 기초, 정규화 (0)	2021.11.05

현재글빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3]

언젠간 내 책을 쓸거야

더블린아틀라스, 아일랜드어학원후기, 아일랜드생활비, 결혼준비, 더블린생활비, 아일랜드아틀라스어학원, 더블린한달생활비, 아일랜드워홀, 아일랜드워홀생활비, 대전웨딩홀투어, 오픽IH후기, 더블린어학원추천, 더블린어학원후기, 해커스금융, 아틀라스어학원후기, 아일랜드어학원추천, 아일랜드아틀라스, 결혼식준비, 결혼하는법, 예비신부,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

May we meet again