Ax Wave/Dx

엑셀 데이터분석 상관분석 회귀분석

김준아 2025. 9. 26. 17:06

파일:

sales.csv
5.44MB
추가기능에서 분석도구를 추가해야됨

 

엑셀에서 데이터 분석 할때는

1. 결측값 있으면 안되고

2. 문자형 변수 안됨 (연속형 변수여야한다)

 

$A$1:$E$33702 화살표 누르고 입력하면 됨

입력범위 지정했으면 열 체크 첫째행 이름표 사용 체크 하고 확인 누르면

  Sales Quantity Discount Profit Shipping Cost
Sales 1        
Quantity 0.31086 1      
Discount -0.08374 -0.0224 1    
Profit 0.472991 0.101209 -0.31819 1  
Shipping Cost 0.756136 0.269266 -0.07446 0.347105 1

이렇게 나옴 ㅋㅋ 

상관관계 구하는 법 !!


 데이터 분석을 누르면 이외에도 여러가지 분석을 할 수 있음 

https://datalab.naver.com/

 

네이버 데이터랩

네이버의 검색 트렌드 및 급상승검색어 이력, 쇼핑 카테고리별 검색 트렌드 제공

datalab.naver.com

네이버 데이터랩을 사용해서 이것저것 눌러보자 ~~@!

검색어 : 루테인 1년
여자 / 남
처음부터 ~ 34세까지 / 34세 이후~ 끝까지

 

저 두개를 엑셀 파일로 변환 해서 한 엑셀 파일에 두개 열의 정보를 넣고

원래 텍스트 형식이기때문에 숫자로 변환을 눌러준다

그러면 이런 형식이 됨~~(파일의 일부)

날짜 19~34세 35~60세
2024-09-25 33.5396 57.08844
2024-09-26 26.79455 63.26703
2024-09-27 26.48514 49.47101

 

이걸 상관분석하면 결과가 이렇게 나온다 !!

  Column 1 Column 2
Column 1 1  
Column 2 0.842092 1

 


회귀분석

y: a1부터 a33702, x:b1부터 e의 33702까쥐

이것은 결과이다 

회귀분석 결과 요약

  • 모델 설명력 (결정계수 R²): 약 63.6%
    • Quantity, Discount, Profit, Shipping Cost 변수들이 Sales 변동의 약 63.6%를 설명
  • 모델 유의성 (유의한 F): 매우 유의미
    • F값의 p-value가 0이므로, 이 회귀 모델은 통계적으로 매우 유의미하다고 할 수 있음
  • 독립변수 영향력 (P-값):
    • Quantity, Discount, Profit, Shipping Cost 모두 p-value가 0에 가까워 Sales에 통계적으로 유의미한 영향을 줌.
    • 계수(Coefficient)가 모두 양수이므로, 각 변수의 값이 커질수록 Sales도 증가하는 경향을 보임.

 

 

통계공부를 다시하는것도 좋을것이라는 생각이...