본문 바로가기

분류 전체보기

(85)
「브랜드 마케터들의 이야기」를 읽고 [ 별 영양가 없는 서문 ] 공부로 바빠도 독서는 꾸준히 하고 있다. 2020년 동안 잘 들여놓은 버릇이다. 사실 2021년의 첫 책이 「브랜드 마케터들의 이야기」는 아니다. 이미예 작가의 「달러구트 꿈 백화점」을 한 권 읽었고 지금은 캐네스 밀러의 「인간의 본능」을 한참 읽고 있는 중이다. 「달러구트 꿈 백화점」은 밀리의서재가 2020년 가장 핫했던 도서로 선정하여 호기심에 읽어봤다. 개인적으로 무척 흥미 있어하는 주제와 설정은 아니었어서 가벼운 마음으로 읽었다. 그러다 방심한 틈에 죽은 가족들이 남기는 꿈을 다루는 장에서 왈칵 눈물을 쏟았다. 아직도 나에겐 가까운 이의 갑작스러운 죽음이라는 화제가 감정적으로 취약한 부분이라는 것을 느꼈다. 캐네스 밀러의 「인간의 본능」은 진화론에 대해 더 깊게 이해하..
조사방법론Ⅱ: 척도 [ ⅰ. 척도의 의의 ] 1. 척도의 의미 척도 = 측정을 위한 도구, 숫자들의 체계 자연과학: 측정대상이 주로 물질적 → 척도= 온도계, 저울 등 사회과학: 측정대상이 주로 비물질적 → 논리적/ 경험적으로 연관된 다수의 문항들로 구성 2. 지수와 척도 지표 지수 척도 변수의 속성을 나타내는 요소 지표를 합성하여 단일 수치로 표현 측정을 위한 도구 지표 점수의 단순한 합 = 경험적으로 쉽게 인식할 수 있는 지표들로 구성된 것 측정대상 속성에 따라 가중치 부여 → 강도구조를 포함 [ ⅱ.지수와 척도의 작성과정 및 지수구성 ] 1. 지수와 척도의 작성 과정 문제에 대한 속성이나 특성을 인지하고, 이것을 표현하는 이론적 개념을 형성 이론적 개념의 내용을 특정화하여 경험적 관찰이 가능한 변수로 전환 변수(개념)..
조사방법론Ⅱ: 측정 [ ⅰ. 측정의 의의 ] 1. 측정의 의미 측정 = 대상 또는 사건에 수치를 부여하는 과정(수치화) → 통계적 분석 가능화 / 추상적 개념을 경험화하는 과정 2. 측정도구가 갖추어야 할 기준 측정대상의 특성을 수치나 기호로 할당하는 규칙을 정하는 것 정밀성: 특정한 값에 수렴하는 정도 정확성: 목표치에 일치하는 정도 신뢰성: 측정의 일관성 (1:1 대응관계) 타당성: 측정하고자 하는 것을 정확하게 측정하고 있는 정도 [ ⅱ. 측정의 수준 ] 측정 수준 간의 특성비교 명목 수준 서열/순위 수준 등간/간격 수준 비율 수준 변수 속성 이산 변수, Discrete Variable 연속 변수, Continuous Variable 범주 O O O O 순위 X O O O 등간격 X X O O 절대 영점 X X X O..
조사방법론Ⅱ: 표본추출방법 [ ⅰ. 표본추출의 의의 ] 1. 표본조사와 전수조사의 개념 표본조사: 모집단에서 일부를 추출하여 모집단의 속성을 추정하는 방법 전수조사: 모집단 전부를 조사하는 방법 2. 표본조사의 이점 시간과 비용 절약 비표본추출오차를 줄여 전수조사보다 정확한 자료 수집 파괴적 조사에 적용 [ ⅱ. 표본추출의 설계/ 표본설계 ] Sampling Design 조사대상 모집단 확정 표집틀 결정 표본추출 방법의 선택 표본의 수 결정 표본추출의 실행 1. 모집단의 확정 모집단, Population: 표본조사를 통해 얻은 연구결과를 일반화하려는 대상집단 구성요소: 모집단을 구성하고 있는 개별단위 표본추출단위: 표본추출의 각 단계에서 표본으로 추출되는 단위 2. 표집틀/표본프레임/표본추출프레임 결정 표집틀, Sampling F..
E-Commerce Part Ⅷ: 자연어분석(NLP) 응용 Natural Language Processing (NLP)¶ ⅰ. Importing Modules & Data Skimming¶ In [1]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import nltk In [2]: df = pd.read_csv("Data/yelp.csv", index_col=0) df.head() Out[2]: review_id user_id business_id stars date text useful funny cool 2967245 aMleVK0lQcOSNCs56_gSbg miHaLnLanDKfZqZHet0uWw Xp_cWXY5rxDLkX-wqUg-i..
E-Commerce Part Ⅶ: 시계열 분석 응용 Time Series Data Analysis¶ ⅰ. Importing Modules & Data Skimming¶ In [1]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [2]: pd.options.display.max_columns=30 df = pd.read_excel("Data/Superstore.xls", index_col=0) df.head() Out[2]: Order ID Order Date Ship Date Ship Mode Customer ID Customer Name Segment Country City State Postal Code Region Produ..
E-Commerce Part Ⅵ: K Means Clustering 응용 K Means Clustering¶ ⅰ. 모듈 불러오기 & DATA 특성 파악¶ In [1]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [2]: df = pd.read_csv("Data/Mall_Customers.csv", index_col = 0) df.head() Out[2]: Gender Age Annual Income (k$) Spending Score (1-100) CustomerID 1 Male 19 15 39 2 Male 21 15 81 3 Female 20 16 6 4 Female 23 16 77 5 Female 31 17 40 In [3]: df.info() ..
E-Commerce Part Ⅴ: Random Forest 모델 응용 Random Forest¶ ⅰ. 모듈 & DATA 특성 확인¶ In [1]: import numpy as pn import pandas as pd import matplotlib.pyplot as plt import seaborn as sns In [2]: member = pd.read_csv("Data/member.csv") trans = pd.read_csv("Data/transaction.csv") member.head() Out[2]: id recency zip_code is_referral channel conversion 0 906145 10 Surburban 0 Phone 0 1 184478 6 Rural 1 Web 0 2 394235 7 Surburban 1 Web 0 3 130152 9 ..