Chương 1
INTRODUCTION DATA ANALYSIS IN BUSINESS
Nội dung
• 1. Một số vấn đề chung
• 2. Các loại dữ liệu và nguồn dữ liệu
• 3. Các phương pháp thu thập số liệu
• 4. Các phương pháp chọn mẫu
• 5 Một số công cụ xử lý và phân tích dữ
liệu
1. Một số vấn đề chung
1.1 Khái niệm chung về phân tích và xử lý dữ liệu (data analysis)
1.2 Vai trò của phân tích dữ liệu
1.3 Một số khái niệm thường dùng
1.1 Khái niệm chung về phân tích dữ liệu
• Phân tích và xử lý dữ liệu (data analysis) ra đời xuất phát từ nhu cầu thực tế của cuộc sống- nhu cầu biết thông tin.
Vị trí của môn học trong đào tạo ngành MIS
transforming,
• Data analysis is a process of inspecting, and cleaning, modeling data with the goal of discovering suggesting useful conclusions, and supporting decision- making. Data analysis has multiple facets and approaches, encompassing diver se techniques under a variety of names, in different business, science, and social science domains.
• Data mining is a particular data analysis technique that focuses on modeling and
information,
knowledge discovery for predictive rather
• Business intelligence covers data analysis
than purely descriptive purposes.
that relies heavily on aggregation, focusing
on business information. In statistical
applications, some people divide data
analysis into descriptive
statistics, exploratory data analysis (EDA),
and confirmatory data analysis (CDA).
EDA focuses on discovering new features
in the data and CDA on confirming or
falsifying existing hypotheses.
Những công việc cần làm?
Why?
1. Thu th p d li u
Phân tích dữ liệu
© 1984-1994 T/Maker Co.
ậ ữ ệ ỏ ả vd: b ng h i
ồ ả ể ữ ệ 2. Trình bày d li u vd: bi u đ , b ng
3. X lý d li u
ử
Ra quyết định
© 1984-1994 T/Maker Co.
© 2011 Pearson Education, Inc
ữ ệ ị vd: giá tr trung bình
• Để có kết quả đúng
– Vận dụng đúng phương pháp
– Đọc được ẩn số được
• Đối tượng nghiên cứu của data analysis
Mặt lượng
Các hiện tượng KTXH
Mặt chất
• Sử dụng dữ liệu lớn
1.2 Vai trò của phân tích và xử lý số liệu
Ba mặt của quá trình cải thiện chất lượng quản lý
Triết lý quản lý
Data analysis
Công cụ hành động
• Sự cần thiết của data analysis:
1. Một nghiên cứu không thể thiếu phân tích định
lượng
2. Là cơ sở để nhận thức một cách khoa học về
thế giới khách quan
3. Là căn cứ để đưa ra các kết luận của quản lý
Bóng dáng data analysis xuất hiện ở mọi ngành
• Qu n lý tài chính
• Nghiên c u ứ marketing
ướ
– Xu h
ng tài chính
– Hành vi khách hàng
– …..
– …..
ả
• Qu n lý kinh doanh
• Qu n lý marketing
ể
– Ki m kê, phân tích
– Giá
– …………...
– ….
ả ả
1.3 Một số khái niệm thường dùng
Tổng thể thông kê và đơn vị tổng thể
1
Tiêu thức thống kê
2
Chỉ tiêu thống kê
3
• Ví dụ: nghiên cứu mức độ hài lòng của
1.3.1 Tổng thể thống kê và đơn vị thống kê
khách hàng sử dụng dịch vụ viễn thông
• Khái niệm
của Viettel?
Tổng thể thống kê là một tập hợp những
đơn vị, hoặc phần tử cấu thành hiện tượng
cần được quan sát và phân tích. Các đơn vị,
phần tử cấu thành nên tổng thể được gọi là
• Các loại tổng thể
đơn vị tổng thể
Các loại tổng thể thống kê
Theo hình thức biểu hiện
Chủ thể bộc lộ
Chủ thể tiềm ẩn
Các loại tổng thể thống kê
Theo mục đích nghiên cứu
Tổng thể đồng chất
Tổng thể không đồng chất
Các loại tổng thể thống kê
Theo phạm vi nghiên cứu
Tổng thể chung
Tổng thể bộ phận
1.3.2 Các tiêu thức thống kê
• Khái niệm:
– Tổng điều tra dân số
– Điều tra tình hình sức khỏe sinh sản
– ……
• Các loại tiêu thức
Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau
Phân loại tiêu thức thống kê
Tiêu thức thời gian
Tiêu thức thực thể
Tiêu thức thông kê
Tiêu thức không gian
Phân loại tiêu thức thống kê
Tiêu thức thực thể
Nêu lên bản chất của đơn vị tổng thể
Tiêu thức thuộc tính
Tiêu thức số lượng
Tiêu thức thay phiên
Phân loại tiêu thức thống kê
Tiêu thức thời gian
Nêu lên hiện tượng nghiên cứu theo sự xuất hiện của hiện tượng theo thời gian nào
Phân loại tiêu thức thống kê
Tiêu thức không gian
Nêu lên phạm vi lãnh thổ bao trùm và sự xuất hiện theo địa điểm của hiện tượng nghiên cứu
1.3.3 chỉ tiêu thống kê
• Khái niêm
Khái niệm chỉ tiêu
Trị số của chỉ tiêu
Chỉ tiêu thống kê phản ánh mặt lượng và chất của các hiện tượng & quá trình KTXH số lớn trong điều kiện thời gian và đia điểm cụ thể
Ví dụ:
Doanh thu của doanh nghiệp A năm 2009 là 50 tỉ đồng
Các loại chỉ tiêu thống kê
Theo tính chất biểu hiện
Chỉ tiêu tuyệt đối
Chỉ tiêu tương đối
Các loại chỉ tiêu thống kê
Theo đặc điểm thời gian
Chỉ tiêu thời điểm
Chỉ tiểu thời kỳ
Các loại chỉ tiêu thống kê
Theo nội dung phản ánh
Chỉ tiêu số lượng
Chỉ tiêu chất lượng
Tổng thể chung (population) và mẫu (sample)
Tổng thể chung
Mẫu
Sử dụng thống kê để kết luận các đặc điểm
Sử dụng tham số để mô tả các đặc điểm
Suy luận về tổng thể chung từ tổng thể mẫu
Chap 1-25
Nội dung
• 1. Một số vấn đề chung
• 2. Các loại dữ liệu và nguồn dữ liệu
• 3. Các phương pháp thu thập số liệu
• 4. Các phương pháp chọn mẫu
• 5 Một số công cụ xử lý và phân tích dữ
liệu
• 2.1 Các loại dữ liệu
Ví dụ • Màu mắt • Tình trang hôn
nhân
Ví dụ • Số con
Ví dụ • Cân nặng
2. Các loại dữ liệu và nguồn dữ liệu
• 2.2 Nguồn dữ liệu
2. Các loại dữ liệu và nguồn dữ liệu
Nội dung
• 1. Một số vấn đề chung
• 2. Các loại dữ liệu và nguồn dữ liệu
• 3. Các phương pháp thu thập số liệu
• 4. Các phương pháp chọn mẫu
• 5 Một số công cụ xử lý và phân tích dữ
liệu
3.1 Các thang đo dữ liệu
Dữ
Thang đo tỉ lệ
liệu
định
Có điểm 0 tuyệt đối
lượng
Dữ
Thang đo khoảng
Các giá trị có khoảng cách đều nhau nhưng không có điểm gốc là 0
liệu
định
Giữa các biểu hiện của tiêu thức có quan hệ hơn kém
Thang đo thứ bậc
Thang đo định danh
tính
Đánh số các biểu hiện cùng loại của tiêu thức
3.2 Các phương pháp điều tra
• Phỏng vấn
– Điện thoại, thư tín,..
• Quan sát
• Thực nghiệm
• Dữ liệu có sẵn
Nội dung
• 1. Một số vấn đề chung
• 2. Các loại dữ liệu và nguồn dữ liệu
• 3. Các phương pháp thu thập số liệu
• 4. Các phương pháp chọn mẫu
• 5 Một số công cụ xử lý và phân tích dữ
liệu
4. Các phương pháp chọn mẫu
• Mẫu xác suất
– Mẫu ngẫu nhiên đơn giản
– Mẫu hệ thống
– Mẫu phân tổ
– Mẫu chùm
• Mẫu phi xác suất
5.1 Mẫu ngẫu nhiên đơn giản
• Mỗi đơn vị được chọn đều có cơ hội được chọn
như nhau
• Sự lựa chọn này có thể thay thế được (with
replacement), hoặc không thay thế được
(without replacement), tức là chọn hoàn lại hoặc
không hoàn lại;
• Có thể sử dụng bảng số ngẫu nhiên để chọn
mẫu
5.2 Mẫu hệ thống
• Quyết định cỡ mẫu: n
• Chia tổng thể chung gồm N đơn vị thành các tổ gồm k
đơn vị: k=N/n
• Chọn ngẫu nhiên một đơn vị thứ nhất từ tổ thứ nhất
• Chọn đến đơn vị ngẫu nhiên thứ k từ tổ thứ k
N = 64
n = 8
ổ ứ ấ T th nh t
k = 8
5.3 Mẫu phân tổ
• Tổng thể chung được chia làm hai hoặc hơn hai
tổ theo một số đặc điểm chung
• Từ mỗi tổ sẽ chọn ngẫu nhiện một số đơn vị
• Ghép các đơn vị đó lại với nhau thành một mẫu
5.4 Mẫu chùm
• Tổng thể chung được chia thành nhiều chùm (khối) mỗi
chùm đều có thể đại diện cho tổng thể chung
• Chọn ngẫu nhiên một hoặc một số chùm từ tất cả các
chùm đó
• Các chùm này kết hợp lại với nhau thành một mẫu
ổ ể T ng th c ượ chung đ chia thành 4 chùm
Nội dung
• 1. Một số vấn đề chung
• 2. Các loại dữ liệu và nguồn dữ liệu
• 3. Các phương pháp thu thập số liệu
• 4. Các phương pháp chọn mẫu
• 5 Một số công cụ xử lý và phân tích dữ
liệu
5 Một số công cụ xử lý và phân tích dữ liệu
• Excel
• Stata
• SPSS
• R