파일:
sales.csv
5.44MB

엑셀에서 데이터 분석 할때는
1. 결측값 있으면 안되고
2. 문자형 변수 안됨 (연속형 변수여야한다)

입력범위 지정했으면 열 체크 첫째행 이름표 사용 체크 하고 확인 누르면
| Sales | Quantity | Discount | Profit | Shipping Cost | |
| Sales | 1 | ||||
| Quantity | 0.31086 | 1 | |||
| Discount | -0.08374 | -0.0224 | 1 | ||
| Profit | 0.472991 | 0.101209 | -0.31819 | 1 | |
| Shipping Cost | 0.756136 | 0.269266 | -0.07446 | 0.347105 | 1 |
이렇게 나옴 ㅋㅋ
상관관계 구하는 법 !!
데이터 분석을 누르면 이외에도 여러가지 분석을 할 수 있음
네이버 데이터랩
네이버의 검색 트렌드 및 급상승검색어 이력, 쇼핑 카테고리별 검색 트렌드 제공
datalab.naver.com
네이버 데이터랩을 사용해서 이것저것 눌러보자 ~~@!






저 두개를 엑셀 파일로 변환 해서 한 엑셀 파일에 두개 열의 정보를 넣고
원래 텍스트 형식이기때문에 숫자로 변환을 눌러준다
그러면 이런 형식이 됨~~(파일의 일부)
| 날짜 | 19~34세 | 35~60세 |
| 2024-09-25 | 33.5396 | 57.08844 |
| 2024-09-26 | 26.79455 | 63.26703 |
| 2024-09-27 | 26.48514 | 49.47101 |
이걸 상관분석하면 결과가 이렇게 나온다 !!
| Column 1 | Column 2 | |
| Column 1 | 1 | |
| Column 2 | 0.842092 | 1 |
회귀분석


이것은 결과이다
회귀분석 결과 요약
- 모델 설명력 (결정계수 R²): 약 63.6%
- Quantity, Discount, Profit, Shipping Cost 변수들이 Sales 변동의 약 63.6%를 설명
- 모델 유의성 (유의한 F): 매우 유의미
- F값의 p-value가 0이므로, 이 회귀 모델은 통계적으로 매우 유의미하다고 할 수 있음
- 독립변수 영향력 (P-값):
- Quantity, Discount, Profit, Shipping Cost 모두 p-value가 0에 가까워 Sales에 통계적으로 유의미한 영향을 줌.
- 계수(Coefficient)가 모두 양수이므로, 각 변수의 값이 커질수록 Sales도 증가하는 경향을 보임.
통계공부를 다시하는것도 좋을것이라는 생각이...
'Ax Wave > Dx' 카테고리의 다른 글
| 데이터 기반 design thinking (0) | 2025.09.26 |
|---|---|
| 11가지 개별 분석 방법론 + 그중에 뭘 선택해서 분석할것인가~~! (0) | 2025.09.25 |
| UX UI 관련 긍/부정 여론 분석하기 (0) | 2025.09.25 |
| 실습) 사업 계획서 작성하기 (0) | 2025.09.23 |
| 데이터 문제해결 기획 & 사례 (4) | 2025.09.22 |