1. Giới thiệu phân tích nhân tố khám phá (EFA)
Trong giai đoạn đầu tiên của nghiên cứu phát triển thang đo, phân tích EFA được các nhà nghiên cứu khuyến nghị sử dụng nhằm đảm bảo tính chặt chẽ của nghiên cứu (Farooq, 2016). Phân tích EFA giải thích phương sai chung lớn nhất trong ma trận tương quan với số lượng nhân tố bé nhất (Tabachnick & Fidell, 2007). Mục đích của phân tích EFA là khám phá dữ liệu và cung cấp thông tin cho nhà nghiên cứu về số lượng nhân tố tối ưu để giải thích cho bộ dữ liệu (Hair và cộng sự, 2006).
Phân tích nhân tố khám phá EFA nhằm rút gọn một tập gồm nhiều biến đo lường phụ thuộc lẫn nhau thành một tập biến ít hơn (thu nhỏ) để chúng có ý nghĩa hơn
nhƣng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (tóm tắt dữ liệu). Phân tích EFA cho phép gom các biến có mối tương quan lại với nhau thành một nhóm (các nhóm này có thể giống hoặc không giống với nhóm biến ban đầu).
2. Tiêu chuẩn trong phân tích EFA
Thứ nhất, kiểm định Kaiser-Meyer-Olkin (KMO), đây là thống kê dùng để xem xét sự thích hợp của phương pháp phân tích nhân tố. Giá trị KMO ≥ 0,60 được khuyến nghị trước khi tiến hành phân tích nhân tố (Tabachnick & Fidell, 2007).
Thứ hai, kiểm định Bartlett (Bartlett’s test of sphericity) nhằm kiểm tra các biến quan sát có tương quan với nhau hay không (Hair và cộng sự, 2010). Kiểm định Bartlett có ý nghĩa thống kê p < 0,05, chứng tỏ các biến quan sát có tương quan với nhau trong tổng thể.
Thứ ba, hệ số tải nhân tố (Factor Loading-FL) thể hiện sự tương quan giữa biến quan sát với nhân tố. Hệ số FL = 0,50 phản ánh 25% biến động mà biến quan sát giải thích cho nhân tố. Hệ số này càng cao thể hiện sự tương quan giữa biến quan sát đó với nhân tố càng lớn. Hệ số tải nhân tố của biến quan sát bằng hoặc cao hơn mức từ 0,30 đến 0,50, không có hiện tượng tải chéo (tức là hệ số tải có ý nghĩa trên nhiều hơn một nhân tố), không có nhân tố nào có ít hơn 3 biến quan sát để đạt yêu cầu về độ tin cậy và sự hội tụ về mặt lý thuyết (Kline, 2013).
Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:
- Factor Loading ở mức ± 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
- Factor Loading ở mức ± 0.5: Biến quan sát có ý nghĩa thống kê tốt.
- Factor Loading ở mức ± 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.
Thứ tư, tổng phương sai trích (Total Variance Explained-TVE) cho biết các nhân tố trích được có thể giải thích bao nhiêu phần trăm mức độ biến thiên của các biến quan sát. Giá trị TVE ≥ 50% cho thấy phân tích EFA là phù hợp (Gerbing & Anderson, 1988).
3. Phép xoay nhân tố (Rotation)
Mục tiêu của xoay nhân tố là để đạt được một cấu trúc nhân tố tối ưu, trong đó mỗi biến quan sát tải lên số lượng nhân tố ít nhất có thể, tối đa hóa số lượng tải cao trên từng nhân tố và có ý nghĩa về mặt lý thuyết để việc giải thích kết quả tốt hơn.
Có hai phép xoay phổ biến là xoay vuông góc và xoay xiên. Trong đó, phép xoay Varimax là một phép xoay vuông góc cho thấy rằng các nhân tố không tương quan với nhau. Tuy nhiên, xét về mặt lý thuyết và thực hành thì hiếm khi các nhân tố không tương quan với nhau trong các nghiên cứu thuộc nhóm ngành khoa học xã hội và hành vi (DeVellis, 2012). Nhằm mang lại kết quả tốt nhất trong phân tích EFA, nghiên cứu của luận án sử dụng phép trích PAF kết hợp với phép xoay xiên (Promax) trong nghiên cứu để tạo ra một tập hợp các nhân tố đơn giản và có ý nghĩa về mặt lý thuyết.
4. Lưu ý khi EFA
Việc thực hiện phân tích nhân tố có nhiều cách, có thể đánh giá cho từng thang đo riêng lẻ hoặc có thể đánh giá chung cùng lúc cho tất cả các thang đo. Mỗi phương pháp đều có ưu điểm riêng, cụ thể nếu phân tích cho từng khái niệm một có thể giúp phát hiện và loại một số biến quan sát có thể tạo nên các yếu tố giả. Phân tích các thang đo cùng lúc với nhau sẽ giúp cho việc đánh tốt hơn về giá trị phân biệt của các thang đo lường (Nguyễn Đình Thọ, 2013).
5. Lựa chọn phép quay khi EFA
Phương pháp xoay như Varimax (phép quay trực giao, Orthogonal), giả định các yếu tố không tương quan và chúng có thể dẫn đến mất dữ liệu có giá trị nếu được sử dụng khi các yếu tố đang được nghiên cứu có tương quan. Phương pháp trích Principal Axis Factoring với phép xoay Varimax phù hợp với mục tiêu giảm số lượng biến quan sát không có tương quan và ngăn chặn các vấn đề đa cộng tuyến (Fabrigar, et al. 1999).
Phép xoay Promax cho phép các yếu tố tương quan với nhau (Fabrigar et al., 1999; Russell, 2002).
6. Độ phân biệt và độ hội tụ trong EFA
Tính giá trị của thang đo: là mức độ mà tại đó thang đo sử dụng có thể đo lường chính xác khái niệm mà người nghiên cứu nhắm tới để đo lường. Tính giá trị của thang đo gồm: giá trị hội tụ (convergent validity) và giá trị phân biệt (discriminant validity)
Ở đây khi phân tích nhân tố khám phá EFA có hai giá trị quan trọng được xem xét là giá trị hội tụ và giá trị phân biệt. Hiểu một cách đơn giản:
Thỏa mãn “Giá trị hội tụ“: Các biến quan sát hội tụ về cùng một nhân tố (hệ số tải nhân tố ≥ 0.5). Hay nói cách khác, tất cả các câu hỏi thuộc về cùng khái niệm bắt buộc phải chia sẻ phương sai cao với một câu hỏi khác.
Đảm bảo “Giá trị phân biệt“: Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác. Giá trị phân biệt yêu cầu tất cả các câu hỏi thuộc về cùng khái niệm bắt buộc phải không được chia sẻ phương sai cao với những câu hỏi thuộc về những khái niệm khác. Nếu biến quan sát cùng tải lên 2 nhân tố thì chênh lệch hệ số tải nhân tố của biến quan sát đó phải lớn hơn 0.3.
7. Có thể bỏ qua bước EFA để thực hiện CFA trên AMOS?
Khi kiểm định thang đo, chúng ta có thể tiến hành đánh giá thang đo qua Cronbach’s alpha và EFA. Việc thực hiện đánh giá này sẽ giúp chúng ta kiểm định bằng phân tích nhân tố khẳng định CFA dễ dàng hơn. Tuy nhiên, không nhất thiết phải làm như vậy chúng ta có thể tiến hành dùng CFA để kiểm định thang đo.
CFA sẽ cho chúng ta kiểm định được độ tin cậy tổng hợp, phương sai trích, tính đơn hướng, giá trị hội tụ và giá trị phân biệt của thang đo. Phương pháp phân tích CFA sẽ giúp chúng ta kiểm định được nhiều tiêu chí đánh giá giá trị và độ tin cậy của thang đo hơn phương pháp EFA.
8. Tiến hành phân tích EFA trên SPSS
Mở phần mềm SPSS và chọn Analyze > Dimension Reduction > Factor.
Trong cửa sổ Factor Analysis, làm theo các bước sau:
Chọn biến: Chọn các biến cần đưa vào phân tích EFA từ cửa sổ bên trái và đưa chúng sang bên phải.
Descriptives: Chọn mục KMO and Bartlett’s Test để kiểm tra tính phù hợp của dữ liệu.
Extraction: Chọn phương pháp rút trích yếu tố. Phương pháp phổ biến nhất là Principal Axis Factoring (PAF) hoặc Principal Component Analysis (PCA). Trong trường hợp demo này chọn phương pháp là Principal components
Trong Extraction, chọn Eigenvalues greater than 1 (Eigenvalue > 1) để xác định số lượng nhân tố.
Rotation:
Nhấp vào Rotation và chọn phương pháp xoay nhân tố. Phổ biến nhất là Varimax (xoay vuông góc) hoặc Promax (xoay chéo) tùy vào mục tiêu nghiên cứu.
Chọn mục Rotated Solution để hiển thị ma trận xoay.
Scores: Nếu bạn muốn tạo điểm số nhân tố để sử dụng trong các phân tích tiếp theo, nhấp vào Save as Variables để lưu các điểm số nhân tố. Có thể bỏ qua phần này.
Options: Bạn có thể chọn Suppress small coefficients để ẩn các hệ số tải nhân tố (factor loading) nhỏ. Ví dụ: bạn có thể thiết lập ngưỡng tải nhân tố là 0.5. Trường hợp chọn thêm sort by size khi hiển thị kết quả hệ số tải nhân tố của các biến quan sát sẽ sắp xếp theo thứ tự từ lớn đến nhỏ
Nhấn OK để thực hiện phân tích.
9. Đọc kết quả phân tích
Kết quả cho thấy KMO = 0.884 thỏa mãn điều kiện KMO > 0.5 (Kaiser, 1974). Như vậy, có thể kết luận phân tích nhân tố là thích hợp với các dữ liệ đã có. Tương tự như vậy, kết quả kiểm định Barlett cho thấy p = 0.000 <0.05, như vậy có nghĩa là các biến có quan hệ với nhau và có đủ điều kiện để phân tích nhân tố bằng kiểm định EFA.
Tại Eigenvalue = 1.374 rút trích được 3 nhân tố (đúng bằng số nhân tố so với mô hình đề xuất ban đầu), các nhân tố đều có giá trị Eigenvalues > 1. Phương sai trích là 62.985% > 50% là đạt yêu cầu. Điều này chứng tỏ 3 nhóm nhân tố rút nêu trên thể hiện được khả năng giải thích được 62.985% sự biến thiên của các biến quan sát.
Kết quả ma trận nhân tố sau khi xoay cho thấy các biến quan sát đều có hệ số tải nhân tố lớn hơn 0.5 và các biến quan sát này chỉ tải lên 1 nhân tố duy nhất. Vì vậy, có thể kết luận các thang đo các biến độc lập đảm bảo độ hội tụ và độ phân biệt.