Thống kê depocen - Chương 3: Tóm tắt và mô tả số liệu

Các đại lượng hướng tâm: trung bình, trung vị, Mod, phân vị, trung bình khoảng.

 Các đại lượng biến thiên: biên độ, khoảng tứ vị phân, phương sai, độ lệch chuẩn, hệ số biến thiên

 Dạng đồ thị: đối xứng, nhọn, sử dụng hộp và phần đuôi.

 

ppt30 trang | Chia sẻ: Mr Hưng | Lượt xem: 704 | Lượt tải: 0download
Bạn đang xem trước 20 trang nội dung tài liệu Thống kê depocen - Chương 3: Tóm tắt và mô tả số liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Giới thiệu về thống kêDEPOCEN Chương 3 Tóm tắt và mô tả số liệuCác chủ đề Các đại lượng hướng tâm: trung bình, trung vị, Mod, phân vị, trung bình khoảng. Các đại lượng biến thiên: biên độ, khoảng tứ vị phân, phương sai, độ lệch chuẩn, hệ số biến thiên Dạng đồ thị: đối xứng, nhọn, sử dụng hộp và phần đuôi.Các đại lượngHướng tâmTrung bìnhTrung vịModtrung bình khoảngPhân vịCác đại lượngBiến thiênPhương saiĐộ lệch chuẩnHệ số biến thiênBiên độCác đại lượng hướng tâmCác đại lượng hướng tâmTrung bìnhTrung vịModTrung bình khoảngTrung bìnhLà trung bình số học của số liệu: Hầu hết là hướng tâm Bị ảnh hưởng bởi yếu tố ngoại lai0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 Mean = 5Mean = 6Sample MeanĐặc trưng chính của trung bình:Yêu cầu một khoảng giá trị xác định.Sử dụng tất cả các giá trị.Là duy nhất.Tổng độ sai lệch tính từ trung bình đến các giá trị bằng 0.Minh họa tính chất 4: xét các số liệu có giá trị: 3, 8, 4 và có trung bình là 5. Bài toánTính trung bình độ tuổi của học sinh?Học sinh Tần xuất0 đến 10 310 đến 20 820 đến 30 1630 đến 40 1040 đến 50 950 đến 60 4 Tổng 50Trung bình của một nhóm số liệuTrung bình của một mẫu số liệu được cho ở dạng bảng phân phối tần xuất được tính như sau:Trong đó: f là tần sốTrung vị0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 Median = 5Median = 5Là một đại lượng hướng tâm quan trọngTrong một mảng có thứ tự, trung vị là số “ở giữa”:Nếu n chẵn, trung vị là số ở chính giữa.Nếu n lẻ, trung vị là trung bình của hai số nằm chính giữa.Không bị ảnh hưởng bởi giá trị ngoại lai Mod0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 9 Là một đại lượng hướng tâm Là giá trị xuất hiện nhiều nhất Không bị ảnh hưởng bởi giá trị ngoại lai Có thể có hoặc không có Mod Có thể có một vài Mod Được sử dụng với số liệu hoặc biến định tính0 1 2 3 4 5 6No ModeTrung bình khoảngLà một đại lượng hướng tâmLà trung bình của giá trị lớn nhất và nhỏ nhất quan sát được.Bị ảnh hưởng bởi giá trị ngoại laiMidrange0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10Midrange = 5Midrange = 5Điểm phân vị Không là đại lượng hướng tâm Chia khoảng số liệu có thứ tự làm 4 phần bằng nhauVị trí điểm phân vị thứ i:25%25%25%25%Q1Q2Q3 Qi(n+1)i=4Dãy số liệu: 11 12 13 16 16 17 18 21 22 Vị trí Q1 = 2.50 Q1=12.5=1•(9 + 1)4Các đại lượng biến thiênVariationPhương saiĐộ lệch chuẩnHệ số biến thiênPhương sai tổng thêPhương sai mẫuĐộ lệch chuẩn tổng thểĐộ lệch chuẩn mẫuBiên độKhoảng tứ vị phân là một đại lượng biến thiên là sự sai khác giữa giá trị lớn nhất và nhỏ nhất của quan sát: Range = không cần biết phân phối:Biên độ7 8 9 10 11 12Range = 12 - 7 = 57 8 9 10 11 12Range = 12 - 7 = 5 Khoảng tứ vị phânData in Ordered Array: 11 12 13 16 16 17 17 18 21= 17.5 - 12.5 = 5Là một đại lượng biến thiên quan trọngCông thức cho tổng thể:Công thức cho mẫu: Phương saiFor the Population: use N in the denominator.For the Sample : use n - 1 in the denominator.Là đại lượng biến thiên quan trọng nhấtCông thức cho tổng thể:Công thức cho mẫu: Độ lệch chuẩnFor the Population: use N in the denominator.For the Sample : use n - 1 in the denominator.Diễn giải và sử dụng độ lệch chuẩnThực nghiệm: với bất kỳ phân phối có đồ thị đối xứng, hình “chum”:(1) Khoảng 68% quan sát nằm trong khoảng từ giá trị trung bình cộng/trừ 1 (lần) độ lệch chuẩn(2) 95% quan sát nằm trong khoảng từ giá trị trung bình cộng/trừ 2 (lần) độ lệch chuẩn(3) 99.7% quan sát nằm trong khoảng từ giá trị trung bình cộng/trừ 3 (lần) độ lệch chuẩn Độ lệch chuẩn mẫuFor the Sample : use n - 1 in the denominator.Data: 10 12 14 15 17 18 18 24s = n = 8 Mean =16= 4.2426s So sánh các độ lệch chuẩns = = 4.2426= 3.9686Độ lệch chuẩn mẫu lớn hơn độ lệch chuẩn tổng thể.Data : 10 12 14 15 17 18 18 24N= 8 Mean =16 Comparing Standard DeviationsMean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData AMean = 15.5 s = .925811 12 13 14 15 16 17 18 19 20 21Mean = 15.5 s = 4.57Data CHệ số biến thiênLà đại lượng biến thiên. Đơn vị: %Sử dụng để so sánh 2 hoặc nhiều nhómCông thức (với mẫu): Hệ số biến thiên là tỉ số giữa độ lệch chuẩn mẫu (S) và trung bình mẫu, đơn vị tính: %Ví dụ: so sánh các hệ số biến thiên Lương: Average = $70/month Standard Deviation = $7 Hàng hóa : Average Price last year = $100 Standard Deviation = $8Coefficient of Variation:Lương: CV = 10%Hàng hóa: CV = 8%Dạng đồ thị Mô tả số liệu được phân bố như thế nào Các đại lượng ảnh hưởng đến dạng đồ thị: hệ số đối xứng và độ nghiêngRight-SkewedLeft-SkewedSymmetricMean = Median = ModeMean Median Mode Median MeanModeHộp và phần đuôiCó 5 giá trị cần xác định trong một hộp: giá trị nhỏ nhất, điểm phân vị thứ 1, trung vị, điểm phân vị thứ 3, giá trị lớn nhất.Hộp và phần đuôi Graphical Display of Data Using 5-Number SummaryMedian4 6 8 1012Q3Q1XlargestXsmallestDạng phân phối& Hộp - phần đuôiRight-SkewedLeft-SkewedSymmetricQ1 Median Q3Q1 Median Q3Q1 Median Q3Mean = Median = ModeMean Median ModeModeMedian Mean

Các file đính kèm theo tài liệu này:

  • pptthongkecoban_tongketvamotadulieu_3_0612.ppt
Tài liệu liên quan