목록분류 전체보기 (23)
그로스&퍼포먼스 마케팅

시리즈도 리스트와 마찬가지로 인덱싱,슬라이싱,필터링이 가능합니다. # 시리즈생성 import pandas as pd data = [20, 10, 40, 50, 60, 30, 70, 80] index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'] series = pd.Series(data, index=index, name='my_series') series 시리즈 인덱싱 인덱스의 이름으로 인덱싱을 할때는 ' ' 따옴표 안에 인덱스명을 넣어서 찾아줍니다. 인덱스순서로 인덱싱을 할때에는 리스트와 마찬가지로 0부터 시작해서 위치를 매칭해줍니다. 시리즈 슬라이싱 series.iloc['a'] # 라벨명으로 접근 series.loc[1] # 인덱스값으로 접근 iloc[] 는 시리즈의 ..

판다스는 데이터분석을 접해 본 사람이라면 가장 익숙한 라이브러리입니다. 파이썬에서 사용빈도 1,2위를 차지하는 매우 대중적이고 필수적인 라이브러리입니다. 판다스의 가장 중요한 개념은 시리즈와 데이터프레임입니다. 시리즈는 각행의 정보를 담고 있는 인덱스와 데이터값이 들어있는 열 한개로 구성됩니다. 데이터프레임은 시리즈를 여러개 붙였다고 생각하면 됩니다. 시리즈마다의 이름을 칼럼에 저장합니다. 시리즈생성 pd.Series() pd.Series() 함수를 이용해 시리즈를 생성할 수 있습니다. 리스트를 생성하고 함수안에만 넣어주면 끝입니다. 시리즈 내용변경 series = pd.Series(data, index=index, name='MySeries', dtype='int32') 시리즈는 각 시리즈마다의 이름,..

데이터분석에 앞서 EDA를 하면서부터 다들 가장 처음으로 겪는 오류중의 하나는 바로 한글깨짐 문제일것입니다. 파이썬은 기본언어가 영어로 설정되어있기에 그래프를 잘 출력해도.. 이처럼 한글로 적은 부분은 깨지는 문제가 발생합니다. 첫번째 해결법 ( 가장 간단한 방법) import matplotlib.pyplot as plt plt.rc('font', family='NanumGothicOTF') # For MacOS plt.rc('font', family='NanumGothic') # For Windows %matplotlib inline 저장되어있는 폰트를 불러오기만 하면 되는 간단한 방법입니다. 한번 셀에서 불러왔을경우, 뒤의 그래프를 그릴때마다 매번 불러올 필요는 없습니다. 하지만 파이참,주피터노트북,..
데이터의 처리나 연산의 단순화를 위해서는 반복문의 사용이 필수적입니다. 파이썬 함수에서 아주 중요하다고 할 수 있는 반복문의 사용법을 살펴보겠습니다. for 반복문 # 홀수 반환 함수 def return_odds(numbers): to_return = [] for i in numbers: # i가 numbers만큼 반복됨 if i % 2 == 1: # 홀수조건 to_return.append(i) # 리턴값에 홀수추가 return to_return return_odds([1, 2, 3, 4, 5, 6, 7]) # 1,3,5,7 출력 for 인수 in 객체(변수)는 반복문이 객체의 길이만큼 반복되어 실행됩니다. # 첫번째 짝수가 몇번째 숫자인지 찾는 함수 def first_even(numbers): for ..

사이킷런이란? 파이썬 머신러닝에서 쓰이는 대표적인 라이브러리중의 하나입니다. 주로 활용하는 분야는 머신러닝에서 메이저 분석이라고 불리는 분류(classification), 회귀(regression), 클러스터링(clustering)입니다. 간단한 예시를 통해 분류,회귀,클러스터링을 하나씩 해볼 예정입니다:)
지난번 기초문법1에서 자료형을 배울때, 따로 짚고 넘어가지않은 자료형이 있습니다. 바로 리스트와 튜플,딕셔너리인데요. 이번엔 이 자료형들과 인덱싱을 배워보겠습니다. 리스트 앞으로 할 데이터분석은 한두개의 데이터만을 다루지않습니다. 여러형태의 자료형을 가진 데이터를 한번에 다룰 일이 많을텐데요. 여러 데이터를 묶어주는 형태중 하나가 바로 리스트입니다. box = ['apple',True,26] print(box) 대괄호 "[ ]"로 묶어 리스트를 형성합니다. 리스트안에는 여러자료형이 한번에 들어 갈 수 있습니다. 리스트 인덱싱과 슬라이싱 리스트는 여러데이터를 가지기에 특정데이터에 접근할 방법이 필요합니다. 그것이 바로 인덱싱입니다. numbers = [1, 2, 3, 4, 5] a = numbers[3] ..