본문 바로가기

전체 글

(68)
Part Ⅵ: 데이터 전처리 filter() select() arrange() mutate() 행 추출 열(변수) 추출 정렬 변수 추가 summarise() group_by() left_join() bind_rows() 통계치 산출 집단별로 나누기 데이터 합치기(열) 데이터 합치기(행) [ ⅰ. 조건별 추출 pg.133 ] mpg 데이터를 이용해 분석 문제를 해결해 보세요. Q1. 자동차 배기량에 따라 고속도로 연비가 다른지 알아보려고 합니다. displ(배기량)이 4 이하인 자동차와 5 이상인 자동차 중 어떤 자동차의 hwy(고속도로 연비)가 평균적으로 더 높은지 알아보세요. Q2. 자동차 제조 회사에 따라 도시 연비가 다른지 알아보려고 합니다. "audi"와 "toyota" 중 어느 manufacturer(자동차 제조 회사)의 ..
2020년 1월 생각정리 혼자 세운 계획에 따라 개발 공부를 하게 되면 장단점이 뚜렷한 것 같다. 원하는 분야를 선택하여 자유롭게 공부할 수 있기 때문에 좋은 집중력으로 지식을 획득 할 수 있다는 큰 장점이다. 하지만 해당 분야의 현장에 대한 정보, 정말 실용적인 지식 등의 배경지식이 없다면 종종 내가 세운 계획이 정말 올바른 계획인지 혼란스러울 때가 많다. 이 혼란 자체도 개발을 배우는 과정 중의 하나로 생각하며 즐거운 마음으로 해결해나가려 한다! 그렇기 위해 주기적으로 ①내가 할 수 있는 일, ② 내가 하고 싶은 일, ③ 내가 해야하는 일을 정리할 필요를 느꼈다. Java Back-end : Spring과 MyBatis를 활용해 MVC모델로 간단한 CRUD 기능이 있는 웹페이지 구현 가능 Framework : Spring 3..
Part Ⅴ: 데이터 분석 기초 Q1. ggplot2의 midwest 데이터를 데이터 프레임 형태로 불러온 다음 데이터의 특징을 파악하세요 Q2. poptotal 변수를 total로, popasian 변수를 asian으로 수정하세요 Q3. total, asian 변수를 이용해 '전체 인구 대비 아시아 인구 백분율' 파생변수를 만들고 히스토그램을 만들어 도시들이 어떻게 분포하는지 살펴보세요 Q4. 아시아 인구 백분율 전체 평균을 구하고, 평균을 초과하면 "large", 그 외에는 "small"을 부여하는 파생변수를 만들어 보세요 Q5. "large"와 "small"에 해당하는 지역이 얼마나 되는지 빈도표와 빈도 막대 그래프를 만들어 확인해보세요. # Q1 library(ggplot2) df
조사방법론Ⅰ: 사회과학적 방법_04 조사설계 [ Ⅰ. 조사설계의 의의 ] 조사설계의 의미 조사설계, Research Design : 연구문제에 대한 해답을 얻도록 구상된 계획 조사설계의 특징 연구문제에 대하여 일정하게 한정된 해답만을 제공 어떤 연구문제에 대해 유일하고 완전한 조사설계는 존재하지 않음 다양한 실제적인 요인을 고려한 하나의 타협안의 성격 조사설계의 목적 특정 연구문제에 대한 해답을 가능한 타당하고 객관적/ 경제적으로 강구하기 위한 것 조사와 관련 없는 변수들의 영향을 통제하기 위한 것 내적/ 외적 타당성이 있는 연구결과를 도출하기 위한 것 [ Ⅱ. 인과관계의 추론 ] 인과관계의 의의 인과성과 사회과학 인과관계 조사는 특정 현상을 기술하는 연구나 두 개념의 공병관계에 관한 연구에서 발생하는 이슈를 모두 포괄할 뿐만 아니라 추가적으로 인..
조사방법론Ⅰ: 사회과학적 방법_03 조사윤리와 현장조사 [ Ⅰ. 조사윤리 (연구윤리) ] 의의 조사윤리(연구윤리) : 연구자가 속한 학문공동체가 자율적으로 연구의 전 과정에서 지켜야할 덕목 사회과학에서의 윤리 : 연구자가 조사대상의 권리와 복지에 각별한 주의를 기울여햐 한다는 것을 강조 사회과학의 윤리적인 문제 연구내용 및 주제 연구내용이 인간에게 해를 주는 것을 목적으로 해서는 안된다 연구대상 및 과정 인간을 수단으로 이용해서는 안된다 연구대상자에게 조사대상이 되는 것을 강요할 수 없다 연구결과 조사대상자에 대한 익명성 보장 자료원에 대한 비밀보장 연구결과의 사용권한 (표절의 문제) [ Ⅱ. 개인정보보호 ] 개인정보의 정의 및 종류 개인정보의 정의 : 해당 정보가 다른 정보와 결합하여 특정 개인을 식별할 수 있는가 개인정보보호위원회 : 총리산하 행정위원회 ..
조사방법론Ⅰ: 사회과학적 방법_02 연구문제와 가설 [ Ⅰ. 연구문제의 형성 ] 연구문제의 의미 연구문제, Research Problem : 연구의 효과적인 수행을 위해 구체적인 질문(의문문)의 형태로 진술된 것 연구문제의 유형 규범적 질문 : 당위성 ex) 복지를 위한 재정 지출이 확대되어야 하는가? 기술적 질문 : ex) 유권자들은 복지를 위한 재정지출에 찬성하는가? 관계형 질문 : ex) 복지에 대한 재정지출과 복지의 질은 어떤 관계인가? 연구문제의 원천 기존 지식의 미비 : 기존 지식이 불충분/ 상충/ 모순되는 경우 사회적 요청 : 특정 단체에서 특정 문제에 대한 연구/ 조사를 요청하는 경우 개인적 경험 : 연구문제의 선정기준 학문적 고려 : 연구문제가 학문발전에 공헌할 수 있는지를 검토, 독창성/ 이론적 의의/ 경험적 가능성 실천적 고려 : 연구..
조사방법론Ⅰ: 사회과학적 방법_01 과학적 조사의 이해 [ Ⅰ. 과학적 조사방법론의 의의 ] 과학의 의미와 목적 과학의 의미 우리를 둘러싼 여러 현상에 대한 지식을 습득하고 탐구하는 방법 과학의 목적 과학의 연구 대상 = 이론(존재에 대한 관심), not 가치관/철학(당위성에 대한 관심) 규칙성/인과성 발견 = 현상 속에 존재하는 논리적이고 지속적인 경향 변수들 사이의 관계를 기술/설명 이론을 바탕으로 현상을 예측 지식 형성의 방법 비과학적 지식 형성 방법 전통(Tradition) 사회적으로 이미 형성되어 있는 선례/ 관습/ 습성 등에 의존 권위(Authority) 사회적으로 지식생산자의 자격을 인정받은 사람들의 권위에 의존 직관(Intuition) 비판의 여지가 없는 분명한 명제에 의존 ← 부정확한 관찰, 지나친 일반화, 선택적 관찰 등의 문제 과학적 지식..
사회조사분석사 2급 필기시험과 블로그 2022년 12월 중순 무렵부터 학원에서는 한창 데이터분석에 대한 수업을 진행했다. 매우 각잡고 열심히 공부할 준비가 되어 있는 주제였다. 강사님이 성의있게 수업해 주셨지만 아쉬운 점이 많았다. 일반적인 국비지원교육 학원은 수강생들의 취업률에 존망이 걸려있다. 따라서 당장 취업전선에 뛰어들 수 있는 실용적인 기술을 주로 교육하기 때문에 기본 개념들을 더 알고 싶은 학생들은 수업에 아쉬움이 있을 수 밖에 없다. ADsP 자격증을 준비할 때도 비슷한 경험을 했다. 공부를 하다보면 t분포, 카이제곱분포, 로지스틱 회귀분석의 오즈비 등 우주뚱딴지 같은 개념들이 숱하게 나왔다. 그러나 강의와 참고서에는 태어나서 처음 그 개념을 접한 사람이 이해하기 힘든 말과 문장들로 간단하게 설명하고 넘어갔다. 나중에 우연히 이..