Share

Tổng hợp câu hỏi spss trong bảo vệ luận văn, nghiên cứu

Qua quá trình học tập mình nhận thấy rằng, hầu như các bạn sinh viên khi làm nghiên cứu đều làm một cách máy móc và không hiểu mình đang sử dụng công cụ với mục đích gì, đơn giản là vì họ làm như thế và mình làm theo, những nghiên cứu có trước kéo theo cho các nghiên cứu sau, và mình cũng từng vậy. Rất đáng tiếc là những môn học trên lớp không đủ thời gian để thầy cô chỉ dẫn, giảng giải những lỗi của sinh viên. Mình xin trích dẫn một câu nói của thầy hướng dẫn mình “Nếu chúng ta chỉ để máy làm theo một trình tự nhất định, những người nghiên cứu có lẽ sẽ không cần thiết nữa”. Vì vậy, bài viết này mình mong các bạn có thể hiểu được bản chất của việc phân tích SPSS và ý nghĩa của từng công cụ. Đây cũng là tổng hợp những câu hỏi thường xuất hiện trong các bài báo cáo luận văn cử nhân cũng như thạc sĩ. Hy vọng sẽ giúp được các bạn, chúc các bạn thành công với nghiên cứu của mình. Mọi thắc mắc các bạn có thể comment hoặc gởi email tới mình nhé! 

Câu 1: Vì sao phải chú ý đến việc thiết kế thang đo và kiểm định thang đo

Các khái niệm (biến tiềm ẩn) trong mô hình nghiên cứu cần được đo lường để nghiên cứu mối liên hệ hay ảnh hưởng tác động. Các khái niệm này thường trừu tượng nên cần được chi tiết hóa thành các mục cụ thể (item – biến quan sát) gọi là thiết kế thang đo (nếu người nghiên cứu dùng những khái niệm để hỏi người được nghiên cứu mà người được nghiên cứu hiểu khái niệm khác đi so với cách hiểu của người nghiên cứu thì không thể thu thập được dữ liệu chính xác và đáng tin cậy)

Câu 2:  Phân tích cronbach’s alpha trước khi EFA hay phân tích EFA trước

Điều này phù thuộc vào mục đích nghiên cứu, không có trường hợp nào là sai.

Mục đích phân tích EFA có 2 mục đích

Thứ nhất, khi chúng ta có quá nhiều biến quan sát và muốn sắp xếp chúng thành các nhóm khác nhau. (Ví dụ như đánh giá đặc điểm liên quan đến cơ thể chẳng hạn, qua EFA sẽ sắp xếp thành bộ phận chân, tay, đầu thân mình v.v)

Thứ hai, dùng để phát hiện những nhóm mới lạ. (Chẳng hạn, mô hình chúng ta đã được xây dựng dựa trên nhiều nghiên cứu khác nhau, và cũng nhiều biến, mặc dù đã xác định đc rõ bộ phận phân biệt với nhau, nhưng thông qua EFA ta có cách nhóm khác, chẳng hạn cơ thể bây giờ thành phần bên trong và bên ngoài, bên trên, giữa, bên dưới)

Còn Cronbach’s alpha dùng để kiểm tra các biến trong cùng một thang đo có đủ độ tin cậy để tạo thành một biến tổng đại diện dùng để phân tích hay không (cụ thể các bạn có thể xem phía dưới, phần câu hỏi về cronbach’s alpha)

Vì vậy, nếu thang đo của bạn dựa trên mô hình của những người đi trước và không thay đổi nhiều thì không nhất thiết phải dùng EFA để phân tích nhân tố mà chỉ cân dùng Cronbach’s alpha để kiểm tra độ tin cậy thang đo.

Ngoài ra, sử dụng phương pháp hệ số tin cậy Cronbach’s Alpha trước khi phân tích nhân tố EFA để loại các biến không phù hợp vì các biến rác này có thể tạo ra các yếu tố giả (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2009).

Câu 3: Vì sao đã phân tích cronbach’s alpha lại phải phân tích thêm EFA

Trong một số trường hợp như sau

Thứ nhất, vì cấu trúc thang đo trong tình huống của người nghiên cứu là khác với các nghiên cứu trước do có một số thang đo đã được hiệu chỉnh các biến quan sát và được kết hợp của các thang đo khác nhau hoặc người nghiên cứu muốn kiểm nghiệm lại thang đo

Thứ hai, một thang đo có độ tin cậy cao chưa hẳn là đã không đa hướng (dimensional), cronbach’s alpha chỉ cho biết nó có cùng một khái niệm hay không.

Câu 4: Trong phân tích cronbach’s alpha vì sao phải xét đến hệ số tương quan biến tổng.

Hệ số tin cậy Cronbach’s Alpha chỉ cho biết các đo lường có liên kết với nhau hay không; nhưng không cho biết biến quan sát nào cần bỏ đi và biến quan sát nào cần giữ lại. Khi đó, việc tính toán hệ số tương quan giữa biến-tổng sẽ giúp loại ra những biến quan sát nào không đóng góp nhiều cho sự mô tả của khái niệm cần đo (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).

Câu 5: Nếu hệ số alpha loại bỏ lớn hơn alpha tổng thì có bắt buộc phải bỏ đi?

Nếu thang đo đã có hệ số alpha > 0.7, đây đã là một hệ số tốt. Do đó, việc bỏ biến nhằm mục đích tăng hệ số alpha mà không có lý do là  một việc làm máy móc. Nếu biến đó nhà nghiên cứu cho rằng cần phải loại bỏ đi do thống kê mô tả cho thấy sự phân bố không theo quy luật chuẩn, thì mới đc bỏ đi. Tuy nhiên bỏ ở đây không có nghĩa là loại ra hẳn mô hình mà phải có sự xem xét liệu nó có cùng với các biến loại bỏ khác tạo nên một thang đo ý nghĩa.

Câu 6: Ý nghĩa của phân tích nhân tố

Phân tích nhân tố được sử dụng để rút gọn và tóm tắt dữ liệu.Trong nghiên cứu Marketing, có thể có rất nhiều biến để nghiên cứu, hầu hết chúng có tương quan với nhau và thường được rút gọn để có thể dễ dàng quản lý. Mối quan hệ giữa những bộ khác nhau của nhiều biến được xác định và đại diện bởi một vài nhân tố (hay nói cách khác một nhân tố đại diện cho một số biến)

Dùng để đánh giá giá trị hội tụ và giá trị phân biệt. EFA giúp sắp xếp các biến thành nhiều tập khác nhau (các biến thuộc cùng 1 tập là giá trị hội tụ, việc chia các tập khác nhau là giá trị phân biệt).

_Hội tụ: Các biến quan sát cùng tải mạnh (hệ số tải Factor Loading) cho 1 nhân tố sẽ gom về 1 nhân tố đó.

– Phân biệt: Mỗi nhân tố sẽ có xu hướng tải khác nhau. Nhóm biến quan sát tải cho nhân tố thứ nhất tách biệt với nhóm biến quan sát tải cho nhân tố thứ hai dẫn đến sự phân nhóm nhân tố thành từng cột trong ma trận xoay.

Câu 7: Ý nghĩa của cronbach’s alpha

Đánh giá tính nhất quán các các biến đơn lẻ về việc đại diện cho cùng một khái niệm. Hay nói cách khác, là đánh giá mức độ tin cậy của việc thiết lập một biến tổng hợp trên cơ sở nhiều biến đơn.

Đồng thời loại bỏ đi những biến rác, những biến không cùng một khái niệm để phân tích EFA tốt hơn.

Mô hình Cronbach’s Alpha nằm trong nhóm phương pháp đáng giá tương quan trong (hay còn gọi là đánh giá độ tin cậy bên trong). Tư tưởng chung của phương pháp này là tìm kiếm sự vô lý nếu có trong các câu trả lời,

Mỗi nhân tố gồm các biến quan sát biểu hiện cho 1 thang đo nhất định cho nhân tố đó. Các biến quan sát có thể hiện được ý nghĩa của nhân tố hay không chính là độ tin cậy thang đo.

Câu hỏi quan sát kém, không có căn cứ, số lượng quá ít sẽ thường không tạo được sự tin cậy cho thang đo nhân tố đó. Ngược lại, câu hỏi quan sát dựa trên các cơ sở lý luận cụ thể, lấy từ các nghiên cứu đã được kiểm duyệt, số lượng vừa đủ sẽ phản ánh được gần đúng ý nghĩa của nhân tố. Từ đó mà độ tin cậy của thang đo tăng lên.

 

Câu 8: Hệ số tương quan biến tổng là gì?

Là hệ số cho biết mức độ liên kết giữa một biến quan sát trong nhân tố với các biến còn lại.

Câu 9: Ý nghĩa KMO

Xem xét sự thích hợp của phân tích nhân tố, từ 0.5-1. KMO lớn có nghĩa phân tích nhân tố là thích hợp

Câu 10: Ý nghĩa của hệ số tải

Là những hệ số tương quan đơn giữa các biến quan sát với nhân tố. Nếu hệ số tải càng lớn chứng tỏ biến quan sát có mối quan hệ càng chặt chẽ với nhân tố.

Câu 11: Khi nào cần xử lý đa biến, nếu không xử lý có được không

 Phân tích đa biến có ứng dụng hay được dùng nhất là khống chế nhiễu và dự đoán biến phụ thuộc dựa trên các biến độc lập. Vậy nên dùng phân tích đa biến khi nghiên cứu có hai nhu cầu trên. Phân tích đa biến hay không phụ thuộc vào nhà nghiên cứu, câu hỏi/ mục tiêu nghiên cứu, bản chất mối liên quan giữa các biến trong NC và bản chất bộ số liệu

Câu 12: Khi quan sát để tránh sai số thì những điểm thường phải lưu ý là gì? Có cách nào thường được sử dụng để tránh sai số khi quan sát

Khi quan sát có thể vi phạm về vấn đề bí mật riêng tư, sai số điều tra viên vì họ chỉ muốn quan sát những gì họ cần. Sự có mặt của quan sát viên có thể làm tác động đến đối tượng và làm cho họ thực hành khác đi so với bình thường. Để tránh sai số thường cần có hướng dẫn chi tiết quan sát

Câu 13:  Khi thu thập số liệu, thông tin bị mất đến mức độ nào thì nên bỏ phiếu đó đi?

Không có qui định nào về việc mất bao nhiêu thì bỏ phiếu đó đi, các câu hỏi có tầm quan trọng khác nhau và phụ thuộc vào mục tiêu nghiên cứu cũng như các phân tích trong báo cáo. Việc mất số liệu còn do nhiều nguyên nhân ví dụ: không trả lời, câu hỏi nhạy cảm, …

Câu 14: Vì sao lấy Beta (hệ số hồi quy chuẩn hóa) để kết luận

Hệ số beta phản ảnh được thứ tự mức độ tác động của các biến độc lập đến biến phụ thuộc.

Đặc biệt khi các biết độc lập có tương quan với nhau (qua bảng Pearson) thì ảnh hưởng của mỗi biến đến biến độc lập rất khó đánh giá. Tức ảnh hưởng đó bây giờ còn phụ thuộc vào các biến độc lập khác trong phương trình chứ không thể tách riêng để đọc hệ số hồi quy riêng từng phần như hồi quy đơn.

Dùng hệ số beta khi tất cả các biến độc lập có cùng thang đo lường.

Mặc dù hệ số beta cũng thay đổi khi đưa các biến độc lập khác vào phương trình nhưng nó phản ánh tốt hơn B. (các giải quyết là dùng hệ số tương quan từng phần và tương quan riêng)

Câu 15: Hệ số Tolerance là gì?

Là hệ số độ chấp nhận của biến thường dùng được sử dụng để đo lường hiện tượng cộng tuyến

Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến độc lập khác.

Câu 16: Hệ số VIF

Là hệ số phóng đại phương sai, có liên hệ gần với độ chấp nhận. Thực tế là nghịch đảo của hệ số chấp nhận. Khi VIF vượt quá 10 là dấu hiệu của Đa cộng tuyến.

Câu 17: Hệ số Durbin-watson

Dùng để kiểm tra xem có hiện tượng tự tương quan hay không trong phần dư của phép phân tích hồi quy.

d-w có hệ số biến thiên từ 0-4; nếu các phần sai số không có tương quanh chuỗi bậc nhất với nhau thì sẽ có giá trị gần bằng 2 (Từ 1-3); nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận, nếu về 4 thì có tương quan nghịch.

Câu 18: Hệ số F trong hồi quy có ý nghĩa gì

Trước hết, kiểm định F kiểm chứng mức độ phù hợp của mô hình hồi quy với tổng thể bởi vì nghiên cứu mục đích chính là để đánh giá tổng thể các phần tử chứ không phải là mẫu phần tử

Nếu sig của F < 0.05 tức có nghĩa mô hình hồi quy có ý nghĩa áp dụng và suy ra tính chất của tổng thể.

Câu 19: Phân tích Pearson để làm gì,

mối quan hệ tương quan chặt chẽ hay không thông qua hệ số r.

Bảng pearson thì có hai chiều trong khi đó hồi quy thì không.

Chưa hẳn đã có mối quan hệ nhân quả.

Câu 20: Hiện tượng đa cộng tuyến là gì

Là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề đa tuyến là cung cấp cho mô hình những thông tin rất giống nhau và rất khó tách rời ảnh hưởng của từng biến đến bién phụ thuộc

Hậu quả

  • Hạn chế giá trị của R bình phương (Thường làm giá trị R bình phương tăng ảo)
  • Làm sai lệch hoặc đổi dấu các hệ số hồi quy trong phương trình hồi quy

Câu 21: Ý nghĩa của R bình phương.

Hệ số xác định R bình phương được chứng minh là nếu ta đưa càng nhiều biến độc lập vào mô hình thì R bình sẽ tăng, nhưng k có nghĩa là biến sẽ phù hợp hơn với dữ liệu

R có khuynh hướng ước lượng lạc quan của thước đo sự phù hợp của mô hình đối với dữ liệu.

Câu 22: Vì sao dùng R bình hiệu chỉnh mà không dùng R bình phương

Cả 2 đều dùng để đánh giá ước lượng lạc quan của thước đo sự phù hợp của mô hình và dữ liệu. Tuy nhiên, dùng R2 chuẩn hóa sẽ sát hơn, an toàn hơn không thổi phồng mức độ của mô hình