XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP
V?n d? d?u tin c?a cơng vi?c thu th?p d? li?u:
- Xc d?nh r nh?ng d? li?u no c?n thu th?p
- th? t? uu tin c?a cc d? li?u ny.
              
                                            
                                
            
 
            
                 16 trang
16 trang | 
Chia sẻ: Mr Hưng | Lượt xem: 1089 | Lượt tải: 0 
              
            Nội dung tài liệu Kinh tế học - Thu thập dữ liệu thống kê, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/01/2015
1
THU THẬP DỮ LIỆU THỐNG KÊ
1
KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ:
2
Xác định mục đích, nội dung, đối tượng vấn đề nghiên cứu
xây dựng hệ thống các khái niệm, chỉ tiêu thống kê.
Điều tra thống kê
Xử lý số liệu :
- Tập hợp, sắp xếp số liệu.
- Chọn các phần mềm xử lý số liệu.
- Phân tích thống kê sơ bộ.
Phân tích và giải thích kết quả. Dự đĩan xu hướng phát 
triển của hiện tượng
Viết báo cáo và truyền đạt kết quả nghiên cứu
XÁC ĐỊNH DỮ LIỆU CẦN THU THẬP
Vấn đề đầu tiên của cơng việc thu thập dữ liệu:
- Xác định rõ những dữ liệu nào cần thu thập
- thứ tự ưu tiên của các dữ liệu này.
3 4
Categorical
(Qualitative)
Discrete Continuous
Numerical
(Quantitative)
Data
21/01/2015
2
- Phản ánh tính chất, sự hơn kém của các đối
tượng nghiên cứu.
- Thu thập bằng thang đo định danh hay thứ
bậc
- Ví dụ: Sv ở nhà cha mẹ, ở trọ, ktx hay ở 
nhà bà con người quen,
- Phản ánh mức độ hay mức độ hơn kém
- Thu thập bằng thang đo bằng thang đo
khoảng cách hay thang đo tỉ lệ.
- Ví dụ: Số lượng sinh viên của lớp K713QT.
1.SV của trường X cĩ đi làm thêm.
2.Số lượng SV đi làm thêm chiếm 35%
3.Thời gian làm thêm trung bình 12 giờ (3 buổi) mỗi
tuần
4.Tính chất cơng việc ít liên quan đến ngành nghề đang
được đào tạo
5.Mục đích chủ yếu của việc đi làm thêm là lý do kinh
tế
6.Việc làm thêm cĩ ảnh hưởng đến kết quả học tập
7.Điểm trung bình học tập của SV đi làm thêm giảm
bình quân là 0,3 điểm
7
Primary
Data Collection
Secondary
Data Compilation
Observation
Experimentation
Survey
Print or Electronic 
21/01/2015
3
Dữ liệu thu thập từ những nguồn cĩ sẵn, 
đĩ chính là những dữ liệu đã qua tổng
hợp xử lý từ các cơ quan.
 Ưu điểm
-Thu thập nhanh, ít tốn kém chi phí
Nhược điểm
- Dữ liệu đơi khi ít chi tiết và khơng đáp
ứng đúng nhu cầu nghiên cứu.
9
Nguồn dữ liệu thứ cấp :
- Nội bộ: các số liệu báo cáo về tình hình 
kinh tế như sx, tiêu thụ, tài chính, nhân 
sự..của các phịng ban.
- Cơ quan thống kê nhà nước: dữ liệu tổng 
quát về dân số, lao động, việc làm, giáo 
dục, mức sống dân cư, tài nguyên
- Cơ quan chính phủ
- Báo, tạp chí
- Các tổ chức hiệp hội, viện nghiên cứu 
10
Dữ liệu thu thập trực tiếp, ban đầu từ đối
tượng nghiên cứu.
Ưu điểm
- Dữ liệu chi tiết và đáp ứng đúng nhu cầu
nghiên cứu
Nhược điểm
- Tốn kém chi phí và thời gian
11 12
phương pháp 
thu thập dữ liệu sơ cấp
Nghiên cứu thực nghiệm
Nghiên cứu quan sát
- Khảo sát qua điện thoại
-Thư hỏi và các dạng khảo sát viết khác
- Quan sát trực tiếp và phỏng vấn cá nhân
- PP thu thập khác
21/01/2015
4
13
ĐTTK
Căn cứ vào t/c liên tục 
của việc thu thập thơng tin
Căn cứ vào phạm vi 
tổng thể tiến hành điều tra
Điều tra 
thường xuyên
Điều tra khơng 
thường xuyên
Điều tra 
tồn bộ
Điều tra khơng
tồn bộ
Đ/t
trọng
điểm
Đ/t
chuyên
đề
Đ/t
chọn
mẫu
Thu thập thơng tin liên tục theo thời gian, theo sát 
với quá trình biến động của hiện tượng nghiên cứu.
VD : - Điều tra biến động nhân khẩu địa phương 
(sinh, tử, đi, đến) 
- Tình hình nhân cơng tại DN
14
Tiến hành thu thập thơng tin khơng liên tục
 Phản ánh trạng thái của hiện tượng ở một thời 
điểm hay thời kỳ nhất định theo nhu cầu.
Thường dùng cho các hiện tượng cần theo dõi 
thường xuyên.
Chi phí điều tra lớn, hoặc các hiện tượng khơng 
cần theo dõi thường xuyên. 
15
Tiến hành điều tra tất cả các đơn vị của tổng thể
nên cịn gọi là tổng điều tra.
VD : 
Tổng điều tra dân số
Tổng điều tra nơng nghiệp
Ưu điểm:cung cấp thơng tin đầy đủ về hiện tượng.
Nhược điểm: chi phí cao về thời gian, nhân lực, 
chi phí.
16
21/01/2015
5
Thu thập thơng tin của một số đơn vị được chọn từ
tổng thể chung.
Mục đích : 
Cĩ thơng tin làm căn cứ nhận định hoặc suy rộng cho
tổng thể chung.
17
 Điều tra trọng điểm
 Điều tra chuyên đề
 Điều tra chọn mẫu
18
Chỉ tiến hành thu thập thơng tin ở bộ phận chủ yếu 
(bộ phận chiếm tỷ trọng lớn) của tổng thể chung.
Kết quả điều tra khơng dùng để suy rộng cho 
tồn tổng thể nhưng giúp cho việc nắm được 
những đặc điểm cơ bản của hiện tượng.
Thích hợp với những tổng thể cĩ các bộ phận 
tương đối tập trung, chiếm tỷ trọng lớn trong tổng 
thể.
19
Là điều tra trên một số ít các đơn vị của tổng thể 
nhưng lại đi sâu nghiên cứu nhiều khía cạnh của 
đơn vị đĩ.
Thường dùng nghiên cứu những điển hình (tốt, 
xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm
Kết quả điều tra khơng dùng để suy rộng hoặc 
làm căn cứ đánh giá tình hình cơ bản của hiện 
tượng.
20
21/01/2015
6
Là tiến hành điều tra thu thập thơng tin trên một số đơn 
vị của tổng thể chung theo phương pháp khoa học sao 
cho các đơn vị này phải đại diện cho cả tổng thể chung 
đĩ.
Kết quả điều tra dùng để suy rộng cho cả tổng thể chung.
Ưu điểm : tiết kiệm thời gian ,chi phí và dữ liệu đáng tin 
cậy
21
Quota (định mức)
Sample(Mẫu)
Non-Probability 
Samples (Phi xác 
suất)
Judgement 
(Phán đốn)
Convenient (thuận 
tiện)
Probability(Xác suất)
Simple Random 
(ngẫu nhiên đơn giản)
Systematic (hệ thống)
Stratified 
(phân tầng)
Cluster 
(cụm)
23
Chọn mẫu thuận tiện
Chọn mẫu phán đốn
Chọn mẫu định mức
24
Các đơn vị mẫu được chọn ở tại một địa điểm 
và vào một thời gian nhất định
Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận 
tiện” để chọn mẫu
Chỉ dùng cho nghiên cứu thăm dị, trắc nghiệm, 
khơng dùng cho nghiên cứu mơ tả hay nhân 
quả vì tính đại diện khơng cao
21/01/2015
7
Vd: chọn mẫu những người đi mua sắm ở
Metro CT và tiếp cận họ khi họ bước vào 
sthị hoặc khi họ mua sắm mĩn hàng mà ta 
muốn khảo sát.
Ưu điểm: dễ dàng tập hợp các đơn vị mẫu
Nhược điểm: khơng đạt được độ xác thực 
cao
25 26
Các đơn vị mẫu được chọn dựa vào sự 
phán đốn của người nghiên cứu mà họ 
nghĩ rằng những mẫu này cĩ thể đại diện 
cho tổng thể
Cách chọn mẫu này được dùng phổ biến 
khi nghiên cứu định tính
Ví dụ: Chọn mẫu một số ít liên doanh lớn 
cĩ thể chiếm phần lớn tổng sản lượng 
ngành cơng nghiệp cả nước.
Ưu điểm: chọn đúng phần tử rất quan 
trọng của tổng thể
Nhược điểm: cĩ khả năng phát sinh những 
sai lệch lớn
27 28
Là chọn mẫu theo tỷ lệ gần đúng của các nhĩm đại diện 
trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi 
nhĩm
Tổng thể quá lớn, sự khác biệt (biến động) giữa các 
phần tử khơng lớn
Tổng thể đã được phân tổ nhĩm trước (đồng nhất) PVV 
chỉ cần chọn cho đủ số lượng khơng cần ngẫu nhiên
Ưu điểm: đảm bảo được số mẫu cần thiết cho từng 
nhĩm trong tổng thể phục vụ khách hàng
Nhược điểm: cĩ thể cho kết quả sai lệch
21/01/2015
8
 Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải 
khát để so sánh kết quả thống kê về thái độ khách 
hàng. Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đĩ 
600 c.ty vừa và nhỏ, 300 trung bình và 100 qui mơ lớn. 
Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 
c.ty vừa và nhỏ, 30 trung bình và 10 c.ty lớn
 Vd: ý thức tham gia giao thơng của SV ĐHCT (cĩ thể 
chọn bất kỳ sinh viên nam nữ nào vì trong trường hợp 
này thì giới tính khơng cĩ sự khác biệt lớn)
29 30
Dựa vào lý thuyết xác suất để lấy mẫu ngẫu 
nhiên
Một số cách chọn mẫu xác suất
 Chọn mẫu ngẫu nhiên đơn giản
 Chọn mẫu cĩ hệ thống
 Chọn mẫu ngẫu nhiên phân tầng
 Chọn mẫu cả cụm
31
Là cách chọn mẫu mà mỗi phần tử trong
tổng thể cĩ cùng cơ hội được chọn với
xác suất như nhau. Để chọn được mẫu,
người NC phải cĩ danh sách tổng thể NC
Vd: Chọn ngẫu nhiên 100 mẫu sinh viên 
trong tổng số 4.000 sinh viên Khoa Kinh 
Tế & QTKD. 
32
 Chọn ngẫu nhiên mẫu đầu tiên.
 Sau đĩ dùng bước nhảy (lặp đi lặp lại) 
Áp dụng tốt nếu danh sách tổng thể được xếp 
ngẫu nhiên (giảm sai lệch do tuần hồn bước 
nhảy)
Vd: PV các hộ gia đình vùng nơng thơn
21/01/2015
9
33
 Là phân chia các đối tượng nghiên cứu thành các
nhĩm, tầng theo các đặc tính, sau đĩ lấy mẫu
theo tầng, nhĩm.
 Chia tổng thể ra từng nhĩm nhỏ theo 1 tiêu thức
nào đĩ gọi là tiêu thức phân tầng (thu nhập, giới
tính, tuổi tác, TĐHV, nhân khẩu,).
 Chọn ngẫu nhiên hay hệ thống trong từng nhĩm
phân tầng theo tỷ lệ với nhĩm. 
 Ưu điểm: Phổ biến nhất vì tính chính xác và đại
diện cao.
34
Xác suất Phi xác suât
Ưu điểm Tính đại diện cao.
Khái quát hĩa cho 
tổng thể.
Tiết kiệm thời gian 
và chi phí.
Nhược điểm Tốn kém thời gian và 
chi phí.
Tính đại diện thấp.
Phạm vi sử dụng Nghiên cứu mơ tả, 
nhân quả và khám 
phá.
Nghiên cứu thăm
dị, thử nghiệm.
Basic Business Statistics, 8e © 2002 
Prentice-Hall, Inc. 
Chap 1-35
 Every individual or item from the frame has 
an equal chance of being selected
 Selection may be with replacement or 
without replacement
 Samples obtained from table of random 
numbers or computer random number 
generators
Decide on sample size: n
Divide frame of N individuals into groups of k
individuals: k=n/n
Randomly select one individual from the 1st group 
 Select every k-th individual thereafter
N = 64
n = 8
k = 8
First Group
21/01/2015
10
 Population divided into two or more groups 
according to some common characteristic
 Simple random sample selected from each group
The two or more samples are combined into one
Basic Business Statistics, 8e © 2002 
Prentice-Hall, Inc. 
Chap 1-38
 Population divided into several “clusters,” each 
representative of the population
 Simple random sample selected from each
The samples are combined into one
Population 
divided 
into 4 
clusters.
 Simple random sample and systematic sample
 Simple to use
 May not be a good representation of the population’s 
underlying characteristics
 Stratified sample
 Ensures representation of individuals across the entire 
population
Cluster sample
 More cost effective
 Less efficient (need larger sample to acquire the same 
level of precision)
Kế hoạch điều tra là gì ?
- Là một tài liệu dưới dạng văn bản:
+ đề cập những vấn đề hoặc cần được hiểu
+ thống nhất, trình tự và phương pháp tiến hành cuộc
điều tra.
+ những vấn đề thuộc về chuẩn bị và tổ chức tồn bộ
cuộc điều tra.
21/01/2015
11
- Mơ tả mục đích điều tra
- Xác định đối tượng điều tra và đơn vị điều tra
- Nội dung điều tra (mục lục các tiêu thức cần thu 
thập dữ liệu trên các đơn vị điều tra)
- Xác định thời điểm thời kì điều tra.
- Biểu điều tra và bảng giải thích cách ghi biểu
41 42
1 MỤC TIÊU
Giúp đáp viên hiểu đúng nội dung câu hỏi.
Động viên, tranh thủ sự cộng tác.
Hướng dẫn cách trả lời.
Tối thiểu các sai sĩt cĩ thể xảy ra khi đáp 
viên trả lời.
43
2 NỘI DUNG BẢN CÂU HỎI
Phần giới thiệu
Giới thiệu bản thân phỏng vấn viên.
Giới thiệu lý do, mục đích nghiên cứu.
Khoảng thời gian cần thiết để hồn thành.
44
2 NỘI DUNG BẢN CÂU HỎI
Phần sàng lọc
Chọn đúng đối tượng để thu dữ liệu.
Thường dùng BCH phân đơi.
Phần nội dung chính
Đa số câu hỏi liên quan đến nội dung NC.
Phần quản lý: xác nhận, lời cam đoan, mẫu số.
21/01/2015
12
45
Phần giới thiệu
Xin chào, tơi là thuộc nhĩm nghiên cứu . 
Chúng tơi đang thực hiện đề tài. Anh (chị) vui lịng 
dành chút thời gian khoảng để giúp chúng tơi trả 
lời một số câu hỏi dưới đây.
Chúng tơi rất hoan nghênh sự cộng tác và giúp đỡ 
của anh (chị). Các ý kiến trả lời của anh (chị) sẽ 
được đảm bảo giữ bí mật tuyệt đối. 
46
Nghiên cứu số Vùng, địa phương
Bảng câu hỏi Phỏng vấn viên
Phỏng vấn lúc Thời gian phỏng vấn
Giám sát viên Kết luận của GSV
Kiểm tra viên Kết quả kiểm tra
Tên người trả lời Địa chỉ
Điện thoại
47
1 Xác định thơng tin cần thiết
Dự án nghiên cứu Bảng câu hỏi Nhĩm người trả lời
Danh mục các 
thơng tin cần cĩ
Các câu hỏi cần 
được chi tiết
Các dữ liệu cần thu 
thập
Vd: năng suất lúa Sản lượng từng vụ
Diện tích từng vụ
Sản lượng đã thu
hoạch
Diện tích gieo trồng
48
2 XÁC ĐỊNH HÌNH THỨC PHỎNG VẤN
• Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả 
lời thấp, khĩ xác định độ tin cậy của thơng tin 
được thu thập.
• Điện thoại: tốn kém, chỉ áp dụng khi thu thập 
ít thơng tin và thời gian phỏng vấn ngắn; 
thơng tin tương đối tin cậy
• Trực tiếp: thơng tin tin cậy, tỷ lệ trả lời cao 
nhưng tốn kém
21/01/2015
13
49
3 LỰA CHỌN CẤU TRÚC CÂU HỎI
Câu hỏi MỞ:
• Phần trả lời khơng định trước, đáp viên tự trả lời theo suy nghĩ
• Khai thác ý kiến mới.
• Tạo quan hệ mật thiết khi trả lời.
• Khĩ tập hợp, mã hĩa, phân tích.
• Khơng phù hợp với phỏng vấn bằng thư tín.
• Khĩ khăn khi đáp viên trả lời dài dịng, lạc đề.
50
3 LỰA CHỌN CẤU TRÚC CÂU HỎI
Câu hỏi ĐĨNG:
Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn 
cĩ.
Ví dụ: 
•Ơng (bà) trồng lúa theo mơ hình 3g3t 
1. Cĩ (tiếp tục) 2. Khơng (tạm dừng)
•Ơng (bà) gặp những khĩ khăn nào trong canh tác lúa?
Vốn 
Lao động 
Cơng nghệ 
Thời tiết 
51
4 TỪ NGỮ SỬ DỤNG TRONG BCH
• Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: 
Who, What, Where, When, Why, How.
• Sử dụng từ ngữ đơn giản, thơng dụng.
• Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị cĩ 
thường khơng?)
• Tránh dùng câu hỏi cĩ 2 vế song song (vừa - vừa).
• Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi 
về trình độ,..).
• Ý nghĩa từ ngữ được sử dụng? Cĩ nghĩa nào khác 
khơng?
• Từ đồng âm khác nghĩa.
• Từ địa phương (vd: lợn-heo, trà-chè,)
52
5 ĐIỀU CHỈNH BCH
• Tiến hành điều tra thử (pretest, pilot survey)
• Bổ sung, chỉnh sửa nếu cĩ
• Những cuộc phỏng vấn mơ phỏng.
• Câu trả lời khơng đầy đủ, lạc đề, sai nội dung, khơng
đọc được.
• Hiệu chỉnh sai sĩt thơng qua các BCH khác.
• Dùng viết khác màu để chỉnh sửa.
• Thống nhất nguyên tắc chỉnh lý chung.
21/01/2015
14
53
6 NHẬP SỐ LIỆU
• Mã hĩa các câu hỏi và trả lời trước khi nhập.
• Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ 
cho việc đọc số liệu trong tập tin dữ liệu.
• Nhập số liệu vào máy tính, các phần mềm xử lý bảng 
tính: Excel, SPSS, Stata, Limdep, 
• Kiểm tra độ chính xác của việc nhập: so sánh ngẫu 
nhiên một số mẫu; tổ chức nhiều người nhập liệu song 
song, 
54
7 XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU
• Mã hĩa các câu hỏi và trả lời trước khi nhập.
• Soạn thảo các tập tin mơ tả việc mã hĩa để phục vụ 
cho việc đọc số liệu trong tập tin dữ liệu.
• Nhập số liệu vào máy tính, các phần mềm xử lý bảng 
tính: Excel, SPSS, Stata, Limdep, 
• Kiểm tra độ chính xác của việc nhập: so sánh ngẫu 
nhiên một số mẫu; tổ chức nhiều người nhập liệu song 
song, 
55
i. Phân tích thống kê mơ tả
Độ tập trung: mean, mode, median.
Độ phân tán:phương sai, độ lệch chuẩn, 
dãy biến động, hệ số biến động.
ii. Phân tích tần số: đếm tần số xuất hiện, 
đồ thị phân phối tần số.
iii. Phân tích phương sai: một chiều, nhiều 
chiều
iv. Phân tích hồi quy tương quan, 
56
Những câu hỏi 
cần trả lời
Các bước cần 
thực hiện
Các cơng việc chính trong 
mỗi bước
Các số liệu đã được thu thập 
cho mỗi mục tiêu NC là gì?
Số liệu cĩ hồn chỉnh và chính 
xác khơng?
Chuẩn bị số liệu cho 
phân tích
-Xem xét lại việc thu thập tại thực 
địa,
-Lập bảng kiểm kê các số liệu cho mỗi 
mục tiêu,
-Xếp thứ tự các số liệu và kiểm tra 
chất lượng,
-Kiểm tra output của máy tínhCác số liệu trơng như thế nào?
Các số liệu cĩ thể được tĩm tắt 
như thế nào cho phân tích đơn 
giản?
Tĩm tắt số liệu và mơ 
tả các biến/xác định 
biến mới
Bảng tần suất, biểu đồ, biểu đồ
phát triển, tỷ trọng, tần suất chéo, 
hệ số tương quan, các thống kê 
mơ tả, 
21/01/2015
15
57
Sự tương quan giữa các 
biến số được xác định như
thế nào?
Phân tích sự tương 
quan
-Bảng tần suất chéo,
-Đo lường sự tương quan,
-Xử lý các biến nhiễu.
Cĩ đo lường sự chênh lệch 
hay tương quan giữa các 
biến khơng?
Chuẩn bị cho phân tích 
thống kê
- Các đo lường sự phân tán, phân 
phối chuẩn và sự biến động mẫu
Xác định loại của phân 
tích thống kê
- Lựa chọn các kiểm định về mức 
ý nghĩa
Làm thế nào sự khác biệt 
giữa các nhĩm cĩ thể được 
xác định?
Phân tích các quan sát 
theo cặp và lẻ
T-test, chi-square test
paired t-test
Mc-Nemar’s chi-square test
Làm thế nào sự tương quan 
giữa các biến cĩ thể được 
xác định?
Thực hiện các đo 
lường về sự tương 
quan
Biểu đồ phân tán,
Đường hồi quy, và
Hệ số tương quan
58
Báo cáo nên được viết như
thế nào?
Viết báo cáo và xây dựng 
các kiến nghị
-Chuẩn bị dàn ý của báo cáo,
-Trình bày và diễn dịch số liệu,
-Bản nháp và bản nháp lần 2.
-Thảo luận và tĩm tắt kết luận
-Xây dựng kiến nghị
Những kết quả và kiến 
nghị nên được cơng bố và 
sử dụng như thế nào?
Trình bày tĩm tắt và 
bản nháp cho việc 
thực hiện các kiến 
nghị
Thảo luận những tĩm tắt và kế
hoạch thực hiện đối với những 
người liên quan
 Sai số do đăng kí: 
sai số này phát sinh do việc ghi chép tài liệu khơng
chính xác , do khai báo sai,.. 
 Sai số do tính chất đại biểu:
sai số này chỉ xảy ra trong điều tra khơng tồn bộ, 
đặc biệt là điều tra chọn mẫu. 
59
+ Làm tốt cơng tác chuẩn bị điều tra
+ Theo dõi, kiểm tra quá trình điều tra.
+ Làm tốt cơng tác tuyên truyền vận động
60
21/01/2015
16
Coverage error
Non response error
 Sampling error
Measurement error
Excluded from 
frame.
Follow up on non 
responses.
Chance differences from 
sample to sample.
Bad Question!
            Các file đính kèm theo tài liệu này:
 thong_ke_kinh_techuong2_8992.pdf thong_ke_kinh_techuong2_8992.pdf