분류 전체보기
-
chapter-03 판다스 데이터프레임과 시리즈판다스 2021. 9. 17. 03:36
03-1 나만의 데이터 만들기¶ 02장에서는 파일에서 데이터 집합을 불러온 다음 실습을 진행했습니다. 이번에는 실습에 사용할 시리즈와 데이터프레임을 직접 만들어서 진행하겠습니다. 시리즈와 데이터프레임 직접 만들기¶ 1. 시리즈 만들기¶ 판다스의 Series 메서드에 리스트를 전달하여 시리즈를 생성합니다. In [27]: import pandas as pd s=pd.Series(['banana', 42]) print(s) 0 banana 1 42 dtype: object 2. 02장에서 인덱스는 보통 0부터 시작한다고 설명했던 것을 기억하나요? 하지만 시리즈를 생성할 때 문자열을 인덱스로 지정할 수도 있습니다. 문자열을 인덱스로 지정하려면 Series 메서드의 index 인자를 통해 인덱스로 사용하고자 하..
-
chapter-5 데이터 연결하기판다스 2021. 9. 17. 03:34
05-1 분석하기 좋은 데이터¶ 분석하기 좋은 데이터란?¶ 분석하기 좋은 데이터란 데이터 집합을 분석하기 좋은 상태로 만들어 놓은 것을 말합니다. 데이터 분석 단계에서 데이터 정리는 아주 중요합니다. 실제로 데이터 분석 작업의 70% 이상을 차지하고 있는 작업이 데이터 정리 작업이죠. 분석하기 좋은 데이터는 다음 조건을 만족해야 하며 이 조건을 만족하는 데이터를 특별히 깜끔한 데이터라고 부릅니다. 깔끔한 데이터의 조건¶ 데이터 분석 목적에 맞는 데이터를 모아 새로운 표를 만들어야 합니다. 축정한 값은 행을 구성해야 합니다. 변수는 열로 구성해야 합니다. 아직은 깔끔한 데이터가 왜 중요한지 알 수 없겠지만 실습을 하나씩 진행하다 보면 깔끔한 데이터의 중요성에 대해 자연스럽게 이해할 수 있을 것입니다. 깔끔..
-
chapter-4 그래프 그리기판다스 2021. 9. 17. 03:33
04-1 데이터 시각화가 필요한 이유¶ 앤스콤 4분할 그래프 살펴보기¶ 데이터 시각화를 보여주는 전형적인 사례로 앤스콤 4분할 그래프가 있습니다. 이 그래프는 영국의 프랭크 앤스콤이 데이터를 시각화하지 않고 수치만 확인할 때 발생할 수 있는 함정을 보여주기 위해 만든 그래프입니다. 그러면 앤스콤이 지적한 '함정'이란 무엇일까요? 앤스콤이 지적한 함정과 데이터 시각화의 필요성¶ 앤스콤 4분할 그래프를 구성하는 데이터 집합은 4개의 그룹으로 구성되어 있으며 모든 데이터 그룹은 x,y열을 가지고 있습니다. 그런데 이 4개의 데이터 그룹은 각각 평균, 분산과 같은 수칫값이나 상관관계, 회귀선이 같다는 특징이 있습니다. 그래서 이런 결과만 보고 '데이터 그룹 I, II, III, IV의 데이터는 모두 같을 것이다..
-
chapter-2 판다스 시작하기판다스 2021. 9. 14. 19:16
02-1데이터 집합 불러오기¶ 데이터 분석의 시작은 데이터 불러오기부터¶ 데이터 분석을 위해 가장 먼저 해야 할 일은 무엇일까요? 바로 데이터를 불러오는 것입니다. 이때 불러오는 데이터를 '데이터 집합'이라고 합니다. 그러면 데이터 집합을 불러오는 방법과 데이터를 간단히 살펴보는 방법에 대해 알아보겠습니다. 우리가 처음 불러올 데이터 집합은 갭마인더입니다. '02_practice'를 주피터 노트북으로 열어 실습을 시작해 볼까요? 갭마인더 데이터 집합 불러오기¶ 1. 판다스의 여러 기능을 사용하려면 판다스 라이브러리를 불러와야 합니다. 다음과 같이 입력하여 판다스 라이브러리를 불러오세요.¶ In [13]: import pandas 2. 갭마인더 데이터 집합을 불러오려면 read_csv메서드를 사용해야 합니..
-
구구단 2~9단 출력해보기.파이썬 프로그래밍 2021. 9. 13. 20:39
구구단 2~9단 출력해보기¶ for문¶ 파이썬의 직관적인 특징을 가장 잘 대변해 주는 것이 바로 이 for문이다. while문과 비슷한 반복문인 for문은 매우 유용하고 문장 구조가 한눈에 쏙 들어 온다는 장점이 있다. 앞서 말한것처럼 for문은 숫자 리스트를 자동으로 만들어주는 range함수와 함께 사용하는 경우가 많다. range(10)은 0부터 10 미만의 숫자를 포함하는 range 객체를 만들어준다. In [15]: a = list(range(10)) a Out[15]: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] In [16]: a_1 = list(range(2,10)) a_1 Out[16]: [2, 3, 4, 5, 6, 7, 8, 9] 2~9 단을 출력하기위해 range(2,10)를..
-
1~100까지 소수구하기.파이썬 프로그래밍 2021. 9. 13. 19:10
1~100의 소수를 구해보자.¶ 소수란 : 소수는 1보다 큰 자연수 중 1과 자기 자신만을 약수로 가지는 수다. 나눗셈 후 나머지를 반환하는 % 연산자. In [411]: 7%3 Out[411]: 1 7 = 3 * 2 + 1 In [412]: 7%7 Out[412]: 0 In [413]: 7%1 Out[413]: 0 이렇게 나머지가 0 즉 소수는 약수 2개 이하인 숫자를 구할것이다. 소수 인지 아닌지 판별부터 해보자. In [414]: a =0 j =7 for i in range(1,j+1): k = j%i print(j,"를",i,"나누었을때","나머지값",k) if k== 0: a=a+1 print("약수의개수",a) if a ==2: print("소수") else : print("소수가 아님") 7..
-
chapter06-2 3과 5의 배수 합하기점프 투 파이썬 2021. 9. 12. 17:06
3과 5의 배수 합하기¶ 자, 다음문제를 어떻게 풀면 좋을지 생각해보자. 10 미만의 자연수에서 3과 5의 배수를 구하면 3,5,6,9이다. 이들의 총합은 23이다. 1000미만의 자연수에서 3의 배수와 5의 배수의 총합을 구하라. 입력받는 값은? 1부터 999까지(1000미만의 자연수) 출력하는 값은? 3의 배수와 5의 배수의 총합 생각해 볼 것은 ? 하나. 3의 배수와 5의 배수는 어떻게 찾지? 둘. 3의 배수와 5의 배수가 겹칠 때는 어떻게 하지? 이 문제를 풀기위한 중요 포인트는 두 가지이다. 한가지는 1000미만의 자연수를 구하는 방법이고 또 다른 한 가지는 3과 5의 배수를 구하는 것이다. 이 두가지만 해결되면 문제는 쉽게 해결될 것으로 보인다. 1.먼저 1000미만의 자연수는 어떻게 구할 수..
-
for문,함수를 이용해 구구단 만들기파이썬 프로그래밍 2021. 9. 12. 16:01
함수, for문을 이용해 구구단을 만들어 보자.¶ for문¶ 파이썬의 직관적인 특징을 가장 잘 대변해 주는 것이 바로 이 for문이다. while문과 비슷한 반복문인 for문은 매우 유용하고 문장 구조가 한눈에 쏙 들어 온다는 장점이 있다. In [11]: a=range(10) a Out[11]: range(0, 10) for문은 숫자 리스트를 자동으로 만들어주는 range함수와 함께 사용하는 경우가 많다. range(10)은 0부터 10 미만의 숫자를 포함하는 range 객체를 만들어준다. In [14]: a= range(1,10) a Out[14]: range(1, 10) 구구단은 1부터 9까지의 숫자가 필요하니 range(1,10)으로 구구단을 만들어 보았다. In [21]: for i in ran..