분류 전체보기
-
[AWS] EC2 메모리 설정AWS 2021. 10. 7. 13:25
이번에는 EC2의 메모리를 높이는 설정을 하려한다. 앞선 블로그에서 EC2를 구축할때 프리티어로 설정을 해두고 생성을 해버려 메모리(1GB)가 매우 낮다. 그래서 EC2에 인스턴스를 업그레이드 하고 용량을 8GB로 바꾸는 설정을 해볼것이다. 업그레이드 이유 인스턴스 유형 변경 해서 메모리를 늘려주는 이유는 메모리가 부족할 경우 특정 패키지가 설치가 안되는 경우가 있다고 들었다. 그런 경우를 대비해서 미리 업그레이드를 해주도록 하자. 인스턴스 요금제 확인 인스턴스 업그레이드 전에 요금제부터 확인하도록 하자. 요금제는 시간당 부과 되는 비용으로 서버를 키는 순간 비용이 발생한다.(서버를 키고 바로 꺼도 1분의 사용량의 요금을 부과 된다고한다.) 추천받은 요금제는 t2.large 요금제로 시간당 0.1152 ..
-
chapter_4.1 타이타닉 생존자 가려내기이것이 데이터 분석이다 with 파이썬 2021. 10. 6. 17:22
4.1 타이타닉 생존자 가려내기¶ 타이타닉의 생존자 그룹과 비생존자 그룹을 분류하는 예제를 4단계 step으로 살펴봅시다. Step 1 탐색: 타이타닉 데이터 살펴보기¶ 타이타닉 데이터셋의 구성은 다음과 같습니다. pclass : Passenger Class, 승객등급 survivde : 생존 여부(생존은 1, 아닌경우는 0) name : 승객 이름 sex : 승객 성별 age : 승객 나이 sibsp : 동승한 형제 또는 배우자 수 parch : 동승한 부모 또는 자녀 수 ticket : 티켓 번호 fare : 승객 지불 요금 cabin : 선실 이름 embarked : 승선항(C=쉘 부르크, Q=퀸즈타운, S=사우스 햄튼) body : 사망자 확인 번호 home.dest : 고향/목적지 분석에 사용할..
-
[AWS] EC2 구축 하기AWS 2021. 10. 6. 03:45
Amazon Web Services(AWS)는 전 세계적으로 분포한 데이터 센터에서 200개가 넘는 완벽한 기능의 서비스를 제공하는, 세계적으로 가장 포괄적이며, 널리 채택되고 있는 클라우드 플랫폼입니다. EC2 란? Elastic Compute Cloud의 준말로 가상의 운영체제를 만들어 사용가능하게 해주는 서비스 라고 보면 된다. 이제 부터 이곳에 R/python 을 설치에 분석 환경을 가추어 나갈 생각이다. 설치 과정을 하나씩 알아보자. Step 1. 인스턴스 생성하기 인스턴스는 클라우드의 가상 서버입니다. 서비스 -> EC2클릭 좌측 인스턴스 메뉴 -> 우측 상단 인스턴스 시작 클릭 Step 2. 인스턴스 옵션 설정 인스턴스 옵션을 정해주자. 비유를 하자면 컴퓨터살떄 사양을 선택하는 과정이다. 1..
-
엔씨소프트 주가 예측파이썬 프로그래밍 2021. 10. 5. 16:27
엔씨소프트¶ 엔씨 소프트의 주가를 예측해보자. 지금 현시점 주가 가장 핫하다고 생각하여 엔씨소프트를 선택하여 '이것이 데이터 분석이다 whth 파이썬' 책의 'Chapter_3.2 비트코인 시세 예측하기' 부분을 응요해서 데이터 분석을 해볼것이다. Yahoo Finance API 란 무엇입니까?¶ Yahoo Finance는 금융 뉴스, 주가 정보, 보도 자료 및 재무 보고서를 제공하는 미디어 플랫폼입니다. 그리고 Yahoo Finance에서 제공하는 모든 데이터는 무료입니다. Yahoo Finance API는 Yahoo가 재무 정보를 가져 오기 위해 제공하는 API입니다. Yahoo는 2017 년에 Finance API를 더 이상 사용하지 않습니다. 따라서 Yahoo Finance API의 대안에 대해 ..
-
WSL에 JupyterLab 설치하고 브라우저에 띄우는 방법WSL 2021. 9. 30. 21:05
그냥 윈도우에 아나콘다 깔고 주피터랩 실행하면 되는 거 아냐? 하실 수 있는데요. WSL을 이용하면 '가상 환경'이라는 기능을 이용할 수 있다는 점이 편리하답니다. 이 '가상 환경' 기능은 혼자 코딩을 공부하실 때는 굳이 필요가 없는데요. 앞으로 개발자로 회사에 들어가게 되신다거나 다른 개발자와 함께 협업할 일이 생기시면 필요할 거랍니다. 누구는 파이썬 3.7 버전으로 개발하고, 누구는 파이썬 3.8 버전으로 개발하는 등 개발자마다 자신이 개발하고 있는 환경이 다르잖아요? 협업 시 버전이 다름으로 인해 발생하는 문제가 많으니까 '가상 환경'을 이용해 개발환경을 간편하게 맞추어주는 거죠! 1. Ubuntu 터미널을 실행한다. (WSL와 Ubuntu를 설치한 상태) 2. 아래코드로 설치 진행. 2-1 $ w..
-
chapter-3.2 비트코인 시세 예측하기이것이 데이터 분석이다 with 파이썬 2021. 9. 30. 18:00
3.2 비트코인 시세 예측하기¶ 다음으로 살펴볼 예제는 비트코인 시세 예측입니다. 비트코인 시세처럼 연속적인 시간에 따라 다르게 측정되는 데이터를 시계열 데이터라 하며, 이를 분석하는 것을 '시계열 데이터 분석'이라고 합니다. 시계열 데이터 분석은 심작 박동 데이터처럼 규치적 시계열 데이터를 분석하는 것과 비트코인 시세예측처럼 불규칙적 시계열 데이터를 분석하는 것으로 구분할 수 있습니다. Step 1 탐색: 시간 정보가 포함된 데이터 살펴보기우선¶ 우선 비트코인 데이터를 탐색합니다. 다음 코드로 데이터셋을 살펴보면, 비트코인 데이터는 총 365개의 행으로 이우러진 것을 알 수 있습니다. 또한 데이터는 결측값이 없이 날짜와 가격에 대한 2개의 피처로 구성되어 있습니다. 이러한 데이터셋을 시계열 데이터셋이라..
-
chapter-3.1 프로야구 선수의 다음 해 연봉 예측하기이것이 데이터 분석이다 with 파이썬 2021. 9. 30. 17:58
3.1 프로 야구 선수의 다음 해 연봉 예측하기¶ 예제에 들어가기에 앞서 예측 분석의 가장 대표적인 방법인 회귀 분석을 살펴보겠습니다. 회귀 분석이란 독립변수(X)와 종속변수(Y) 간의 관계를 찾아내는 것입니다. 아래 그래프와 같은 일차 방정식 (Y=wX+b)을 예로 들 수 있습니다 위 그래프에서 회귀 분석이란 실제 데이터(빨간 점들)와 거리가 최소가 되는 방적식(선)을 찾아내는 것입니다. 즉, 방적식의 계수 w와 b를 정하는 것이라고 할 수 있습니다. 그렇다면 회귀 분석을 데이터 분서게 어떻게 적용하는 것일까요? 이를 우리에게 익숙한 표 형태의 데이터로 살펴봅시다. 아래의 표에서 '나이','몸무게' 피처는 방적식의 X1,X2, 그리고 '키'는 방적식의 Y로 정의할 수 있습니다. 여기에 X1의 영향력을 ..
-
fbprophet 설치 오류fbprophet 설치오류 2021. 9. 30. 00:45
다음 코드로 설치. $ pip3 install fbprophet fbprophet 설치를 했음에도 오류가 뜨는걸 볼수있다. PyInstaller: AttributeError: 'Prophet' object has no attribute 'stan_backend' 강제로 실행시켰을떄 위와 같은 에러도 있었다. 그외에도 많은 오류가 있었던거 같은데 캡쳐를 못해두었다. 일단 많은 정보를 검색을 하였고 많이 보이는 솔루션은 버전이였던걸 확인 할 수 있엇다. https://github.com/facebook/prophet/issues/1868 fbprophet ==0.7.1 버전을 1.0으로 설치해서 해결했다는 글을 보고 설치하는 방법을 찾아보았다. 설치하는 법을 찾다가 conda update --all 다음 코..