IT 인터넷/GA(구글 애널리틱스)

스파르타코딩클럽 데이터분석 종합밥 1주차 개발일지

호기심클럽장 2022. 8. 16. 17:09
728x90
반응형

안녕 친구들

저는 이번에 국비 내일배움카드로 코딩수업을 듣게 되었답니다. 

 

일단 저의 약점을 말하자면,

데이터에 약합니다. 그래서 데이터 볼때 두려워요.

이번기회에 그런 두려움을 내려놓고자 신청하게 되었는데요, 역시 쉽지 않습니다.

내일배움단으로 들어가기전 어떤 강의를 들어야할지 찾아보았고, 클럽에서 소개한대로 패키지 2개 강의를 선택했어요.

 

저는 데이터분석 종합반과 SQL을 듣기로 결심합니다. 

매번 주차가 끝날때마다 배운것을 복습할 수 있도록 개발일지를 쓰게 하는데요, 

개발일지를 쓰는것도 어색하고 어렵네요. 수업 목표는 다음과 같습니다. 

 

 

수업목표

HTML 문서의 개념

구글 COLAB의 사용방법

태그의 형식

크롤링을 위한 패키지 beautifulsoup4의 사용법

 

 

데이터분석이란?

컴퓨터 도구를 효율적으로 이용하고

적절한 통계학 방법을 사용하여

실제적인 문제에 답을 내리는 활동

 

예를들어, 주택가격 예측, tv 광고가 판매에 준 영향, 와인의 가격에 따른 맛, 

아버지와 아들의 키 상관성 같은것을 따져볼 수 있는게 바로 데이터 분석입니다. 

 

데이터 분석 맛보기 x 엑셀

영향을 주는 독립 변수와 다른 요인에 의해 결정되는 종속변수를 파악해야 합니다.

구글 스프레드 시트를 활용한 연습에는 캐글에서 제공하는 데이터셋을

그리고 엑셀의 상관관계 분석을 하는 부가기능으로 'analysis toolpak' 을 활용했습니다.

(설치 후 부가기능> 확장프로그램의 해당기능 start 활성화 필요)

 

애초에 모든 정보가 정리되어 있는 엑셀파일에서 필요한 것은 데이터가공인데

각 행과 열의 데이터가 무엇인지를 파악하고 있어야 합니다.

 

이 중에서 변수간의 관계는 상관관계

공부 시간이 높을 수록 성정도 높다면 시간과 성적은 양의 상관관계

공부시간이 적을때 성적이 높다면 시간과 성적은 음의 상관관계에 있다 할 수 있습니다.

 

하지만 여기 엑셀의 한계가 보입니다.

공부시간, 부모님 교육수중에 따른 최종 시험 성적을 예측하고 싶다면?

이럴 때 사용하는게 회귀 분석입니다.

더욱 정확도를 높이기 위해 정규화, 이상치 탐지의 과정을 거칩니다.(엑셀 지원 x)

 

그래서 파이썬을 통해 다양한 그래프를 통해 데이터를 분석하고

다양한 머신러닝 알고리즘을 통해 예측을 진행할 필요가 있다는 것입니다. 

 

colab 활용하기

코랩은 구글에서 제공하는 개발 환경입니다.

 

 

코랩의 함수는 몇가지가 있는데요,

코드를 설명하기 위한 용도의 주석을 넣을때는 #주석

여러개의 주석을 연달아 사용하기 위해서는 따옴표 3개 ' ' ' 

출력문을 위한 함수는 print( )

 

코랩에서는 마지막 줄만을 출력하는 특징이 있기 때문에 

결과가 여러개라면 프린트를 활용해주면 됩니다.

 

파이썬 python 기초

 

변수

컴퓨터 공간에 이름을 붙이고 값을 넣어 그 이름을 사용해 값을 사용하는것

예) a=5 b=3 / a+b =?? / 8

 

자료형

숫자, 문자열을 자료형태로 사용하는 모든 것

예) type()

 

정수형

int = integer(정수)

 

실수형

float  = float point의 약자로 실수형 자료

 

문자형

텍스트를 다루기 위한 자료형

str= string 문자열

 

리스트

대괄호 [,]로 감싼 후 정수나 문자열을 나열하는 자료형

append 는 리스트에 원소 추가

extend는 리스트에 또다른 리스트 추가

 

for문(반복문)

반복해서 사용할 것이 있는 경우

for 각각의 데이터 in 전체 데이터

for문 끝에는 :콜론을 붙인다

코드는 들여쓰기를 해준다

 

range(시작숫자, 끝숫자)

 

 

if 문(조건문)

특정조건이 참일때 특정코드를 수행 참이지 않을때 다른 코드 수행

실행코드는 들여쓰기 후 작성

조건이 한개가 아닐때는 elif를 통해 추가

예)500원 이상에만 커피를 내어준다

if 들어온돈 >=500원:

 

비교연산자

크고, 작음, 같음, 다름을 판단하기 위해 사용

 

 

 

 

반응형