Chương 1

INTRODUCTION DATA ANALYSIS IN BUSINESS

Nội dung

• 1. Một số vấn đề chung

• 2. Các loại dữ liệu và nguồn dữ liệu

• 3. Các phương pháp thu thập số liệu

• 4. Các phương pháp chọn mẫu

• 5 Một số công cụ xử lý và phân tích dữ

liệu

1. Một số vấn đề chung

1.1 Khái niệm chung về phân tích và xử lý dữ liệu (data analysis)

1.2 Vai trò của phân tích dữ liệu

1.3 Một số khái niệm thường dùng

1.1 Khái niệm chung về phân tích dữ liệu

• Phân tích và xử lý dữ liệu (data analysis) ra đời xuất phát từ nhu cầu thực tế của cuộc sống- nhu cầu biết thông tin.

Vị trí của môn học trong đào tạo ngành MIS

transforming,

• Data analysis is a process of inspecting, and cleaning, modeling data with the goal of discovering suggesting useful conclusions, and supporting decision- making. Data analysis has multiple facets and approaches, encompassing diver se techniques under a variety of names, in different business, science, and social science domains.

• Data mining is a particular data analysis technique that focuses on modeling and

information,

knowledge discovery for predictive rather

• Business intelligence covers data analysis

than purely descriptive purposes.

that relies heavily on aggregation, focusing

on business information. In statistical

applications, some people divide data

analysis into descriptive

statistics, exploratory data analysis (EDA),

and confirmatory data analysis (CDA).

EDA focuses on discovering new features

in the data and CDA on confirming or

falsifying existing hypotheses.

Những công việc cần làm?

Why?

1. Thu th p d  li u

Phân tích dữ liệu

© 1984-1994 T/Maker Co.

ậ ữ ệ ỏ ả vd: b ng h i

ồ ả ể ữ ệ 2. Trình bày d  li u vd: bi u đ , b ng

3. X  lý d  li u

Ra quyết định

© 1984-1994 T/Maker Co.

© 2011 Pearson Education, Inc

ữ ệ ị vd: giá tr  trung bình

• Để có kết quả đúng

– Vận dụng đúng phương pháp

– Đọc được ẩn số được

• Đối tượng nghiên cứu của data analysis

Mặt lượng

Các hiện tượng KTXH

Mặt chất

• Sử dụng dữ liệu lớn

1.2 Vai trò của phân tích và xử lý số liệu

Ba mặt của quá trình cải thiện chất lượng quản lý

Triết lý quản lý

Data analysis

Công cụ hành động

• Sự cần thiết của data analysis:

1. Một nghiên cứu không thể thiếu phân tích định

lượng

2. Là cơ sở để nhận thức một cách khoa học về

thế giới khách quan

3. Là căn cứ để đưa ra các kết luận của quản lý

Bóng dáng data analysis xuất hiện ở mọi ngành

• Qu n lý tài chính

• Nghiên c u ứ marketing

ướ

– Xu h

ng tài chính

– Hành vi khách hàng

– …..

– …..

• Qu n lý kinh doanh

• Qu n lý marketing

– Ki m kê, phân tích

– Giá

– …………...

– ….

ả ả

1.3 Một số khái niệm thường dùng

Tổng thể thông kê và đơn vị tổng thể

1

Tiêu thức thống kê

2

Chỉ tiêu thống kê

3

• Ví dụ: nghiên cứu mức độ hài lòng của

1.3.1 Tổng thể thống kê và đơn vị thống kê

khách hàng sử dụng dịch vụ viễn thông

• Khái niệm

của Viettel?

Tổng thể thống kê là một tập hợp những

đơn vị, hoặc phần tử cấu thành hiện tượng

cần được quan sát và phân tích. Các đơn vị,

phần tử cấu thành nên tổng thể được gọi là

• Các loại tổng thể

đơn vị tổng thể

Các loại tổng thể thống kê

Theo hình thức biểu hiện

Chủ thể bộc lộ

Chủ thể tiềm ẩn

Các loại tổng thể thống kê

Theo mục đích nghiên cứu

Tổng thể đồng chất

Tổng thể không đồng chất

Các loại tổng thể thống kê

Theo phạm vi nghiên cứu

Tổng thể chung

Tổng thể bộ phận

1.3.2 Các tiêu thức thống kê

• Khái niệm:

– Tổng điều tra dân số

– Điều tra tình hình sức khỏe sinh sản

– ……

• Các loại tiêu thức

Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tùy theo mục đích nghiên cứu khác nhau

Phân loại tiêu thức thống kê

Tiêu thức thời gian

Tiêu thức thực thể

Tiêu thức thông kê

Tiêu thức không gian

Phân loại tiêu thức thống kê

Tiêu thức thực thể

Nêu lên bản chất của đơn vị tổng thể

Tiêu thức thuộc tính

Tiêu thức số lượng

Tiêu thức thay phiên

Phân loại tiêu thức thống kê

Tiêu thức thời gian

Nêu lên hiện tượng nghiên cứu theo sự xuất hiện của hiện tượng theo thời gian nào

Phân loại tiêu thức thống kê

Tiêu thức không gian

Nêu lên phạm vi lãnh thổ bao trùm và sự xuất hiện theo địa điểm của hiện tượng nghiên cứu

1.3.3 chỉ tiêu thống kê

• Khái niêm

Khái niệm chỉ tiêu

Trị số của chỉ tiêu

Chỉ tiêu thống kê phản ánh mặt lượng và chất của các hiện tượng & quá trình KTXH số lớn trong điều kiện thời gian và đia điểm cụ thể

Ví dụ:

Doanh thu của doanh nghiệp A năm 2009 là 50 tỉ đồng

Các loại chỉ tiêu thống kê

Theo tính chất biểu hiện

Chỉ tiêu tuyệt đối

Chỉ tiêu tương đối

Các loại chỉ tiêu thống kê

Theo đặc điểm thời gian

Chỉ tiêu thời điểm

Chỉ tiểu thời kỳ

Các loại chỉ tiêu thống kê

Theo nội dung phản ánh

Chỉ tiêu số lượng

Chỉ tiêu chất lượng

Tổng thể chung (population) và mẫu (sample)

Tổng thể chung

Mẫu

Sử dụng thống kê để kết luận các đặc điểm

Sử dụng tham số để mô tả các đặc điểm

Suy luận về tổng thể chung từ tổng thể mẫu

Chap 1-25

Nội dung

• 1. Một số vấn đề chung

• 2. Các loại dữ liệu và nguồn dữ liệu

• 3. Các phương pháp thu thập số liệu

• 4. Các phương pháp chọn mẫu

• 5 Một số công cụ xử lý và phân tích dữ

liệu

• 2.1 Các loại dữ liệu

Ví dụ • Màu mắt • Tình trang hôn

nhân

Ví dụ • Số con

Ví dụ • Cân nặng

2. Các loại dữ liệu và nguồn dữ liệu

• 2.2 Nguồn dữ liệu

2. Các loại dữ liệu và nguồn dữ liệu

Nội dung

• 1. Một số vấn đề chung

• 2. Các loại dữ liệu và nguồn dữ liệu

• 3. Các phương pháp thu thập số liệu

• 4. Các phương pháp chọn mẫu

• 5 Một số công cụ xử lý và phân tích dữ

liệu

3.1 Các thang đo dữ liệu

Dữ

Thang đo tỉ lệ

liệu

định

Có điểm 0 tuyệt đối

lượng

Dữ

Thang đo khoảng

Các giá trị có khoảng cách đều nhau nhưng không có điểm gốc là 0

liệu

định

Giữa các biểu hiện của tiêu thức có quan hệ hơn kém

Thang đo thứ bậc

Thang đo định danh

tính

Đánh số các biểu hiện cùng loại của tiêu thức

3.2 Các phương pháp điều tra

• Phỏng vấn

– Điện thoại, thư tín,..

• Quan sát

• Thực nghiệm

• Dữ liệu có sẵn

Nội dung

• 1. Một số vấn đề chung

• 2. Các loại dữ liệu và nguồn dữ liệu

• 3. Các phương pháp thu thập số liệu

• 4. Các phương pháp chọn mẫu

• 5 Một số công cụ xử lý và phân tích dữ

liệu

4. Các phương pháp chọn mẫu

• Mẫu xác suất

– Mẫu ngẫu nhiên đơn giản

– Mẫu hệ thống

– Mẫu phân tổ

– Mẫu chùm

• Mẫu phi xác suất

5.1 Mẫu ngẫu nhiên đơn giản

• Mỗi đơn vị được chọn đều có cơ hội được chọn

như nhau

• Sự lựa chọn này có thể thay thế được (with

replacement), hoặc không thay thế được

(without replacement), tức là chọn hoàn lại hoặc

không hoàn lại;

• Có thể sử dụng bảng số ngẫu nhiên để chọn

mẫu

5.2 Mẫu hệ thống

• Quyết định cỡ mẫu: n

• Chia tổng thể chung gồm N đơn vị thành các tổ gồm k

đơn vị: k=N/n

• Chọn ngẫu nhiên một đơn vị thứ nhất từ tổ thứ nhất

• Chọn đến đơn vị ngẫu nhiên thứ k từ tổ thứ k

N = 64

n = 8

ổ ứ ấ T  th  nh t

k = 8

5.3 Mẫu phân tổ

• Tổng thể chung được chia làm hai hoặc hơn hai

tổ theo một số đặc điểm chung

• Từ mỗi tổ sẽ chọn ngẫu nhiện một số đơn vị

• Ghép các đơn vị đó lại với nhau thành một mẫu

5.4 Mẫu chùm

• Tổng thể chung được chia thành nhiều chùm (khối) mỗi

chùm đều có thể đại diện cho tổng thể chung

• Chọn ngẫu nhiên một hoặc một số chùm từ tất cả các

chùm đó

• Các chùm này kết hợp lại với nhau thành một mẫu

ổ ể T ng th   c ượ chung đ chia thành 4  chùm

Nội dung

• 1. Một số vấn đề chung

• 2. Các loại dữ liệu và nguồn dữ liệu

• 3. Các phương pháp thu thập số liệu

• 4. Các phương pháp chọn mẫu

• 5 Một số công cụ xử lý và phân tích dữ

liệu

5 Một số công cụ xử lý và phân tích dữ liệu

• Excel

• Stata

• SPSS

• R