Các biến định tính có hai giá trị như giới tính, tình trạng hôn nhân… sẽ áp dụng kiểm định sự khác biệt trung bình với trường hợp biến định tính có hai giá trị bằng phương pháp Independent Sample T-Test (kiểm định giả thuyết trung bình của hai tổng thể). Việc kiểm định sự khác biệt trung bình trong nghiên cứu giúp xác định xem có sự khác biệt trung bình biến định lượng đối với các giá trị khác nhau của một biến định tính hay không
Khái niệm về kiểm định Independent Samples T-Test
Các giả định cho Independent Samples T-Test
Hướng dẫn kiểm định Independent Samples T-Test trong spss
Để thực hiện kiểm định T độc lập (Independent Samples t Test) trong SPSS, nhấp vào Analyze > Compare Means > Independent-Samples T Test.
Cửa sổ Independent-Samples T Test sẽ mở ra, tại đây bạn sẽ chỉ định các biến được sử dụng trong phân tích. Tất cả các biến trong tập dữ liệu của bạn sẽ xuất hiện trong danh sách ở phía bên trái. Di chuyển các biến sang bên phải bằng cách chọn chúng trong danh sách và nhấp vào các nút mũi tên màu xanh. Bạn có thể di chuyển biến đến một trong hai khu vực: Grouping Variable hoặc Test Variable(s).
Test Variable(s): Là biến phụ thuộc. Đây là biến liên tục có giá trị trung bình sẽ được so sánh giữa hai nhóm. Bạn có thể thực hiện nhiều kiểm định t cùng lúc bằng cách chọn nhiều biến kiểm định.
Grouping Variable: Là biến độc lập. Các danh mục (hoặc nhóm) của biến độc lập sẽ xác định các mẫu nào sẽ được so sánh trong kiểm định t. Biến phân nhóm phải có ít nhất hai danh mục (nhóm); nó có thể có nhiều hơn hai danh mục, nhưng kiểm định t chỉ có thể so sánh hai nhóm, vì vậy bạn cần phải chỉ định hai nhóm nào sẽ được so sánh. Bạn cũng có thể sử dụng một biến liên tục bằng cách xác định một điểm cắt để tạo hai nhóm (tức là các giá trị bằng hoặc lớn hơn điểm cắt và các giá trị nhỏ hơn điểm cắt).
Define Groups: Nhấp vào Define Groups để xác định các chỉ số danh mục (nhóm) sử dụng trong kiểm định t. Nếu nút này không hoạt động, hãy đảm bảo rằng bạn đã di chuyển biến độc lập sang phải trong trường Grouping Variable. Bạn phải định nghĩa các danh mục của biến phân nhóm trước khi có thể thực hiện quy trình kiểm định t độc lập.
Define Groups khi phân tích T-test
Nhấp vào Define Groups để mở cửa sổ Define Groups như sau:
Use specified values: Nếu biến phân nhóm của bạn là biến phân loại, hãy chọn “Use specified values”. Nhập các giá trị cho các danh mục bạn muốn so sánh trong các trường Group 1 và Group 2. Nếu các danh mục của bạn được mã hóa bằng số, bạn sẽ nhập mã số tương ứng. Nếu biến phân nhóm của bạn là chuỗi văn bản, bạn sẽ nhập chính xác các chuỗi văn bản đại diện cho hai danh mục đó. Nếu biến phân nhóm của bạn có nhiều hơn hai danh mục (ví dụ: nhận các giá trị 1, 2, 3, 4), bạn có thể chỉ định hai danh mục để so sánh (SPSS sẽ bỏ qua các danh mục khác trong trường hợp này).
Trong trường hợp này: Biến giới tính được mã hóa là 1 (nam) và 2 (nữ) nên trong phần define group được chọn 1 và 2.
Lưu ý rằng khi tính toán thống kê kiểm định, SPSS sẽ trừ giá trị trung bình của Group 2 khỏi giá trị trung bình của Group 1. Thay đổi thứ tự phép trừ sẽ ảnh hưởng đến dấu của kết quả, nhưng không ảnh hưởng đến độ lớn của kết quả.
Cut point: Nếu biến phân nhóm của bạn là biến liên tục và số học, bạn có thể chỉ định một điểm cắt để chia đôi biến đó. Điều này sẽ chia các trường hợp thành hai nhóm dựa trên điểm cắt. Cụ thể, với một điểm cắt x, các nhóm mới sẽ là:
- Group 1: Tất cả các trường hợp có giá trị biến phân nhóm lớn hơn x
- Group 2: Tất cả các trường hợp có giá trị biến phân nhóm nhỏ hơn x
Lưu ý rằng điều này ngụ ý rằng các trường hợp có giá trị biến phân nhóm bằng điểm cắt sẽ được đưa vào nhóm “lớn hơn hoặc bằng”. (Nếu bạn muốn điểm cắt nằm trong nhóm “nhỏ hơn hoặc bằng”, bạn sẽ cần sử dụng lệnh “Recode into Different Variables” hoặc cú pháp “DO IF” để tự tạo biến phân nhóm này.) Ngoài ra, mặc dù bạn có thể sử dụng điểm cắt trên bất kỳ biến nào có kiểu số, nhưng điều này có thể không hợp lý trong thực tế, tùy thuộc vào mức độ đo lường của biến đó (ví dụ: các biến phân loại danh nghĩa được mã hóa bằng số). Thêm vào đó, việc sử dụng biến được chia đôi qua điểm cắt thường làm giảm độ mạnh của kiểm định so với sử dụng biến chưa được chia đôi.
Options trong lựa chọn T-test
Nhấp vào nút Tùy chọn (D) (nút Option) sẽ mở cửa sổ Tùy chọn.
Hộp nhập Phần trăm khoảng tin cậy cho phép người dùng thiết lập mức độ tin cậy cho khoảng tin cậy. Cần lưu ý rằng thiết lập này không ảnh hưởng đến thống kê kiểm định, giá trị p hoặc sai số chuẩn; thay vào đó, nó chỉ tác động đến giới hạn trên và giới hạn dưới của khoảng tin cậy được tính toán. Người dùng có thể nhập bất kỳ giá trị nào trong khoảng từ 1 đến 99; tuy nhiên, trên thực tế, mức giá trị hợp lý thường nằm trong khoảng từ 90 đến 99.
Phần Giá trị thiếu cung cấp các tùy chọn xử lý dữ liệu bị thiếu, bao gồm loại trừ theo từng phân tích riêng lẻ (pairwise deletion) hoặc loại trừ toàn bộ danh sách quan sát (listwise deletion). Cài đặt này không có ý nghĩa khi chỉ có một biến phụ thuộc được chỉ định; tuy nhiên, đối với các phân tích có nhiều hơn một biến phụ thuộc (liên tục, dạng số), phương pháp loại trừ theo từng phân tích cho phép sử dụng tất cả các quan sát có giá trị hợp lệ cho từng biến cụ thể. Ngược lại, phương pháp loại trừ toàn bộ danh sách chỉ giữ lại các quan sát có đầy đủ giá trị cho tất cả các biến trong mô hình. Việc lựa chọn phương pháp phù hợp phụ thuộc vào mức độ dữ liệu bị thiếu, trong đó phương pháp loại trừ toàn bộ danh sách có thể làm giảm đáng kể kích thước mẫu nếu tỷ lệ thiếu dữ liệu cao.
Hướng dẫn đọc kết quả T-test
Kết quả kiểm định t-test độc lập nhằm so sánh mức độ hài lòng giữa nam và nữ được trình bày qua hai bảng: Group Statistics và Independent Samples Test.
Trước tiên, bảng Group Statistics cung cấp các thống kê mô tả về mức độ hài lòng của hai nhóm giới tính. Cụ thể, mức độ hài lòng trung bình của nhóm nam là 3,8932 (độ lệch chuẩn 0,62554), trong khi nhóm nữ có mức trung bình 3,9897 (độ lệch chuẩn 0,56816). Điều này cho thấy mức độ hài lòng trung bình của nhóm nữ cao hơn nhóm nam. Tuy nhiên, cần tiến hành kiểm định t-test để xác định xem sự khác biệt này có ý nghĩa thống kê hay không.
Bảng Independent Samples Test trước hết kiểm tra giả định về tính đồng nhất phương sai thông qua kiểm định Levene’s. Kết quả kiểm định cho thấy giá trị F = 2,565 với Sig. = 0,111, lớn hơn mức ý nghĩa 0,05. Do đó, giả thuyết không về tính đồng nhất phương sai không bị bác bỏ, cho phép sử dụng kết quả t-test trong trường hợp giả định phương sai bằng nhau (Equal variances assumed).
Kết quả kiểm định t-test cho thấy giá trị t = -1,230, với bậc tự do (df) = 248 và giá trị Sig. (2-tailed) = 0,220. Vì mức ý nghĩa p = 0,220 > 0,05, không có đủ bằng chứng để kết luận rằng sự khác biệt giữa hai nhóm là có ý nghĩa thống kê. Khoảng tin cậy 95% của chênh lệch trung bình dao động từ -0,25084 đến 0,05795, bao gồm giá trị 0, càng củng cố kết luận rằng không có sự khác biệt đáng kể giữa hai nhóm.
Như vậy, mặc dù mức độ hài lòng trung bình của nhóm nữ cao hơn nhóm nam, nhưng sự khác biệt này không có ý nghĩa thống kê. Do đó, không thể kết luận rằng giới tính có ảnh hưởng đáng kể đến mức độ hài lòng.