분류 전체보기 63

연구용 r 코드

시계열 그래프/ ACF, PACF 그래프 작성 패키지 "forecast"에 있는 "tsdisplay" 함수 적용 1) 단위근 검정 - adf.test / 패키지 "tseries" adf.test(x, alternative = c("stationary", "explosive"), k=trunc((length(x)-1)^(1/3))) x= 분석자료, alternative = 연구가설 설정, 둘 중 하나 선택, k=time lag에 의한 절사범위 설정 - pp.test / 패키지 "stats" pp.test(x) p-value가 0.05보다 작으면 귀무가설 기각, (귀무가설 : 단위근이 존재한다) 시계열자료는 정상 시계열 2) AR모형 / 패키지 "stats" ar(x, aic=TRUE, order.max=N..

카테고리 없음 2022.02.15

논문 작성을 위한 시계열 분석 : R프로그래밍

데이터프레임 이용해서 패널 데이터 만들기 *함수를 이용하는 방법 : pdata.frame() 함수_plm패키지 3개의 데이터프레임을 rbind() 함수로 묶어 하나의 데이터 프레임으로 다시 생성하는 방법도 있음 pdata.frame(x,index,row.names)인데 row.names는 생성된 패널 자료의 행 이름을 출력할 것인지 결정, 기본값은 T 실행중인 패키지 종료 detach() ARCH-GARCH 분석을 위한 패키지 : rugarch 시계열 자료 분석을 위한 패키지 : tseries, fGarch 일반적인 시계열 자료에는 오차항에 이분산이 존재하며, 분산의 변동이 군집 현상을 이루는 경향을 보인다. 이렇게 시간에 가변적으로 변하는 변동성을 측정하기 위해 고안된 모형이 자기회귀 조건부 이분산(A..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [5] 데이터 시각화

1. matplotlib r프로그램에서 시각화를 담당하는 패키지 ggplot2()와 같은 역할을 하는 파이썬 시각화 대표 패키지 >>>conda install matplotlib #한글 폰트 사용을 위한 세팅(모듈 활성화) from matplotlib import font_manager, rc font_path='c:\\Windows\\Fonts\\malgunbd.ttf' font=font_manager.FontProperties(fname=font_path).get_name() rc('font', family=font) import matplotlib.pyplot as plt plt.style.use('default') plt.plot([2,4,5,9]) plt.show() x=[2,4,6,8] y=[..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [4-3] 판다스 기본문법

#pandas 유형 생성하기 - Series import pandas as pd #1.기본문법 member = pd.Series(['홍길동','강감찬','이민호']) member #index 변경 member = pd.Series(['홍길동','강감찬','이민호'], index=['1번','2번','3번']) member #예제 3 - 딕셔너리 형으로 생성하기 name1 = { '홍길동' : 100, '강감찬' : 90, '이민호' : 95 } name2 = pd.Series(name1) name2 name3 = { '홍길동' : 10, '강감찬' : 50, '이민호' : 100 } name4 = pd.Series(name3) name4 print(name2 + name4) #딕셔너리와 리스트를 활용하여..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [4-2] 웹크롤링

/petitions/602431 에서 요소는 [ '', 'petitions', '602431'] 3개로 구성된다. 따라서 청원등록번호(602431)를 가져오기 위해서 2번 요소를 가져와야한다. #각 게시글 별 상세페이지 내용 수집 #청원번호, 제목, 청원자 수, 카테고리, 날짜, 내용 수집 no = 1 cno2 = [] title2 = [] people2 = [] category2 = [] s_date2 = [] e_date2 = [] content2 = [] for i in range(0, len(url_list)) : print('\n') print('{} 번째 국민청원 게시글 상세 정보입니다 =================' .format(no)) full_url = 'https://www1.pre..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [4] 웹크롤링

#필요모듈 설치 conda install bs4 conda install selenium conda install pandas conda install xlwt + 크롬웹드라이버 다운 >>> 포스팅 [3] 참고 from bs4 import BeautifulSoup form selenium import webdriver import pandas as pd #판다스는 오타가 많이 나서 편하게 쓰려고 이름 지어줌 import time, sys, re, math, numpy, xlwt, random, os #사용자 정보 입력 print('=' *80) print('청와대 국민청원 게시판 크롤링하기') print('=' *80) query_txt = '청와대국민청원' cnt=int(input('1. 크롤링할 건수..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3-2] 코드 정리

from selenium import webdriver from bs4 import BeautifulSoup import time ​ query_text = input(" 검색어를 쓰세요 : ") ​ #크롬드라이버를 설정하고 웹에 접속하기 driver = webdriver.Chrome("c:/py_temp/chromedriver.exe") ​ ​ driver.get("https://www.naver.com") driver.maximize_window() ​ driver.find_element_by_id("query").send_keys(query_text + "\n") # 네이버 driver.get("https://search.naver.com/search.naver?where=view&sm=tab_ju..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [3]

#사용자정의 함수 만들기 def 함수이름(인수) : 함수가 실행되면 실행될 문장 1 함수가 실행되면 실행될 문장 2 return 출력할 결과값 > 'p'라는 이름의 함수(모듈)을 저장하면 작업 폴더의 위치에 상관없이 불러올 수 있다. > 웹크롤링에서 사용하는 주요 모듈 - 웹페이지 분석 : beautifulsoup - 브라우저 제어 : selenium - 데이터 분석 : numpy, pandas #패키지 가져오기 import 패키지명 #패키지에서 원하는 모듈만 가져오기 from 패키지 import 모듈명 #디렉토리 변경 import os #지금 디렉토리는? print(os.getcwd()) #디렉토리 변경 os.chdir() #지정된 폴더 내 파일과 목록을 출력하는 함수 os.listdir() #폴더만들..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [2]

#문자열 호출 : String 예를들어 '파이썬완전쉽죠?'의 8글자가 있다면 0번 요소 -> 파 1번 요소 -> 이 2번 요소 -> 썬 . . . str2 = "PyThoN" #대소문자가 섞여있을 경우 print(str2. lower()) print(str2. upper()) 그 외 공백/문자열내용바꾸기/문자열나누기/문자열연산/문자열길이확인 #1부터 (1을 기준으로) 나눠지는것 #리스트 = [0번 요소, 1번 요소, 2번 요소], 요소들은 문자도, 숫자도 들어갈 수 있다. list1 = ['1982-07-15', '홍길동', 30] print(list1) *왼쪽공백지우기 a.lstrip() *오른쪽공백지우기 a.rstrip() *양쪽공백지우기 a.strip() *문자열바꾸기 a.replace() *문자열..

빅데이터 디자인실무 1급 과정_파이썬 프로그래밍 [1]

> 파이썬 3.8.0 버전 사용 > 미니콘다3 설치 > 에디터(주피터랩) 설치 더보기 cd c:\py_temp (작업폴더로 이동) jupyter lab (주피터랩 실행) 주피터랩 불러놓고 아나콘다 창 끄면 안됨/크롬에서만 작동 더보기 #변수 a1 = 100 print(a1) >100 #타입확인 var1=100 var2='파이썬' print(type(var1)) print(type(var2)) > class 'int' > calss 'str' #계산 a1=2 a2=3 print(a1+a2) >5 (파이썬 예약어) and, exec, not, assert, finally, or, break, for, pass, class, from, print, continue, global, raise, def, if, ..