10 hiểu lầm về trị số P trong khoa học

Trị số P đóng vai trò hết sức quan trọng trong nghiên cứu khoa học, vì nó là “sổ thông hành”, một loại bảo kê cho khả năng công bố quốc tế. Trị số P cũng là thước đo của khám phá khoa học. Nhưng rất tiếc trị số P bị diễn giải sai rất nhiều. Diễn giải sai là vì người ta hiểu sai ý nghĩa của nó. Ngay cả những người học và làm về thống kê cũng hiểu sai ý nghĩa của trị số P. Trong cái note này tôi sẽ liệt kê vài hiểu lầm phổ biến nhất.

Hiểu lầm 1: Trị số P là xác suất của một giả thuyết khoa học

Một cách hiểu rất phổ cập là trị số P là Xác Suất giả thuyết vô hiệu. Chẳng hạn như nhà khoa học phát hiện mối tương quan giữa hút thuốc lá và ung thư với trị số P = 0.04, họ diễn giải rằng Xác Suất không có mối tương quan là 4 %. Suy ra, Tỷ Lệ có mối tương quan giữa hút thuốc lá và ung thư phổi là 96 %. Nhưng cách hiểu này sai. Trị số P không nói gì về Phần Trăm của một giả thuyết khoa học. Trị số P chỉ giúp tất cả chúng ta bác bỏ giả thuyết vô hiệu, chứ không chứng tỏ giả thuyết nào cả .

Hiểu lầm 2: Trị số P là xác suất dữ liệu xảy ra một cách ngẫu nhiên

Đây là một hiểu nhầm mang tính khái niệm cơ bản. Theo cách hiểu này, khi một hiệu quả nghiên cứu và phân tích ( ví dụ như giảm huyết áp 10 mmHg ) với trị số P = 0.03, thì nhà nghiên cứu hiểu rằng Phần Trăm mà hiệu quả đó xảy ra do yếu tố ngẫu nhiên là 3 % ; suy ra, Xác Suất hiệu quả giảm 10 mmHg thật là 97 %. Nhưng cách hiểu này cũng sai, chính do trị số P không nói lên tác dụng nghiên cứu là ngẫu nhiên hay mang tính mạng lưới hệ thống .

Hiểu lầm 3: Trị số P là xác suất phát hiện sai

Đây là một hiểu nhầm do tâm lý chưa cẩn trọng. Một hiểu nhầm thông dụng khác cho rằng P là Tỷ Lệ phát hiện sai. Ví dụ như nhà khoa học đo lường và thống kê thông số đối sánh tương quan và có tác dụng r = 0.25, với P = 0.01, họ hiểu rằng Phần Trăm tác dụng này sai là 1 %. Suy ra, Phần Trăm tác dụng đúng là 99 %. Nhưng cách hiểu này trọn vẹn sai, vì trị số P không cho tất cả chúng ta biết là tác dụng nghiên cứu đúng hay sai .

Hiểu lầm 4: Trị số P là alpha

Khi phong cách thiết kế một nghiên cứu khoa học ( nhất là nghiên cứu lâm sàng ), nhà khoa học phải xác lập ngưỡng alpha và beta của nghiên cứu. Nói nôm na, alpha là dương thế giả ( tức là Phần Trăm mà nghiên cứu cho ra tác dụng dương thế nhưng trong trong thực tiễn chẳng có tương quan gì ). Còn beta là âm tính giả ( tức là Phần Trăm mà nghiên cứu cho ra hiệu quả âm tính, nhưng trong thực tiễn thì có tương quan ). Do đó, có nhiều nhà khoa học hiểu rằng trị số P chính là alpha, nhưng cách hiểu đó sai. Sai vì hiểu nhầm khái niệm kiểm định giả thuyết ( test of hypothesis ). Trị số P là tác dụng của kiểm định thống kê ( test of significance ), chứ không phải kiểm định giả thuyết .

Hiểu lầm 5: Trị số P càng thấp, mức độ ảnh hưởng càng cao

Đây là một hiểu nhầm rất tai hại. Nhiều nhà nghiên cứu so sánh trị số P để nhìn nhận mức độ tác động ảnh hưởng. Chẳng hạn như họ tìm trong y văn và thấy tác động ảnh hưởng của thuốc statin trong một nghiên cứu có trị số P = 0.01, còn nghiên cứu của họ có trị số P = 0.001, họ suy luận rằng mức độ tác động ảnh hưởng họ quan sát cao hơn mức độ ảnh hưởng tác động báo cáo giải trình trong y văn. Nhưng cách hiểu này sai, vì trị số P không phản ảnh mức độ tác động ảnh hưởng so sánh giữa hai hay nhiều trị số P là không có ý nghĩa .

Hiểu lầm 6: Nô lệ vào trị số P

Nhiều nhà nghiên cứu nghĩ ( hay hiểu ) rằng khi tác dụng nghiên cứu có trị số P > 0.05 là xem như không có độc lạ hay không có ảnh hưởng tác động. Họ chỉ đồng ý hiệu quả với trị số P < 0.05. Nói cách khác, bất kỳ tác dụng nào có P < 0.05 là có ý nghĩa, còn P > 0.05 là không có ý nghĩa hoặc không đáng bàn. Tiêu biểu cho cách tâm lý này là một bài báo trên JAMA ( tập san y khoa hàng số 1 trên quốc tế ) Tóm lại : “ a low-fat dietary pattern did not result in a statistically significant reduction in invasive breast cancer risk, ” nhưng khi nhìn vào tác dụng thì thấy tỷ số rủi ro tiềm ẩn là 0.91 ( khoảng chừng đáng tin cậy 95 % : 0/83 đến 1.01 ) và trị số P = 0.07. Đây là một Kết luận … bậy bạ. Trị số P có độ xê dịch khá cao trong một quần thể, nên Tóm lại bằng cách phụ thuộc vào trị số P là một sai lầm đáng tiếc nghiêm trọng .

Hiểu lầm 7: Trị số P > 0.05 là một kết quả “negative”

Cũng giông giống như hiểu nhầm # 5, nhiều nhà nghiên cứu có cách diễn giải theo nghĩa nhị phân : trắng – đen, có – không. Khi thấy tác dụng P cao hơn 0.05, nhà nghiên cứu thường có khuynh hướng cho rằng tác dụng là “ âm tính ” – negative, là nghiên cứu đã … thất bại. Ví dụ tiêu biểu vượt trội cho trường hợp này là cách viết “ The study failed to detect an effect “ ; chữ fail ở đây được dùng không đúng. Chẳng hạn như một nghiên cứu công bố trên tập san New England Journal of Medicine ( được xem là kinh thánh y khoa ) báo cáo giải trình tỷ số odds là 2.2 ( khoảng chừng đáng tin cậy 95 % : 0.83 đến 6.2 ), trị số P = 0.13 và tác giả viết “ No difference in death rates “ ! Câu kết luận này sai, do tại trong trong thực tiễn là có difference, nhưng cái difference đó không có ý nghĩa thống kê. Viết Tóm lại như thế này được xem là … tài tử .
Trị số P không nói lên tác dụng là dương thế hay âm tính, càng không cho tất cả chúng ta biết là thành công xuất sắc hay thất bại. Nhiều nghiên cứu báo cáo giải trình tác dụng không có ý nghĩa thống kê ( tức P > 0.05 ) thường có độ nhậy ( power ) thấp và do đó, không hề cho ra câu vấn đáp dứt khoát. Nhà nghiên cứu hoàn toàn có thể không ‘ chứng tỏ ’ hai nhóm khác nhau, nhưng nhà nghiên cứu cũng không hề bác bỏ giả thuyết rằng hai nhóm hoàn toàn có thể khác nhau. Người ta có câu “ Absence of proof is not proof of absence ” hay “ Absence of evidence is not evidence of absence ” ( không có dẫn chứng không có nghĩa là dẫn chứng không có ). Những nghiên cứu có độ nhậy vừa đủ ( tức trên 80 % ) mà cho ra một hiệu quả không có ý nghĩa thống kê thì mới CÓ THỂ xem là một tác dụng âm tính .

Hiểu lầm 8: Lẫn lộn giữa ý nghĩa thống kê (statistical significance) và ý nghĩa lâm sàng / ý nghĩa thực tế (clinical significance / practical significance)

Như đề cập trên, nhiều nhà nghiên cứu diễn giải một hiệu quả có ý nghĩa thông kê ( P < 0.05 ) như thể chứng minh và khẳng định có mối liên hệ sinh học hay có ý nghĩa lâm sàng. Thật ra, trị số P không có giá trị sinh học và cũng không hề diễn giải như thể có ý nghĩa sinh học hay ý nghĩa lâm sàng. Trong lâm sàng và sinh học, mức độ ảnh hưởng tác động ( effect size ), mức độ độc lạ giữa hai hay nhiều nhóm mới là điều quan trọng. Có ý nghĩa thống kê là một điều kiện kèm theo cần, nhưng chưa đủ để Tóm lại mối liên hệ hay ảnh hưởng tác động là có thật .

Hiểu lầm 9: Diễn giải trị số P trong bối cảnh nhiều giả thuyết

Tình huống tiêu biểu vượt trội trong thực tiễn là một nghiên cứu kiểm định nhiều giả thuyết. Chẳng hạn như một nghiên cứu so sánh 50 biến số giữa hai nhóm bệnh nhân, tức nhà khoa học có 50 trị số P. Giả dụ như trong 50 trị số P đó, chỉ có một trị số P = 0.046, so sánh về chiều dài của ngón chân cái. Nhà khoa học Tóm lại rằng liệu pháp điều trị làm tăng chiều dài ngón chân cái của bệnh nhân ! Nhưng cách hiểu hay diễn giải này sai, chính do nhà khoa học kiểm định quá nhiều giả thuyết và cái ngưỡng alpha 0.05 không còn vận dụng nữa. Cái phát hiện có ý nghĩa thống kê rất hoàn toàn có thể chỉ là ngẫu nhiên .

Hiểu lầm 10: Khoảng tin cậy 95% là xác suất của kết quả

Đây cũng là một hiểu nhầm rất phổ cập trong khoa học. Tiêu biểu cho cách hiểu này là nhà nghiên cứu nghiên cứu và phân tích tài liệu và có hiệu quả thuốc bisph giảm rủi ro tiềm ẩn tử trận với relative risk 0.75, khoảng chừng an toàn và đáng tin cậy 95 % là từ 0.35 đến 0.97 ; nhà nghiên cứu diễn giải rằng thuốc giảm rủi ro tiềm ẩn tử trận 25 % và Xác Suất 95 % là mức độ giảm giao động từ 3 % đến 65 %. Nhưng về mặt triết lý cách hiểu này sai. Khoảng an toàn và đáng tin cậy 95 % không phải là Phần Trăm 95 %. Để tính được Phần Trăm 95 % đó, phải dùng giải pháp Bayes .
Trị số P là một số lượng hay gặp nhất trong nghiên cứu khoa học. Trong một bài nghiên cứu và phân tích tuyệt vời trên JAMA, những tác giả dùng máy tính “ đọc ” những bài báo và tóm tắt ( abstracts ) công bố trong thời hạn 1990 – năm ngoái, họ nhận dạng ra gần 4.6 triệu trị số P trong số 1.6 triệu abstracts và 3.4 triệu trị số P trong số 385 ngàn bài báo. Điều mê hoặc là trị số P có vẻ như ngày càng thấp hơn, tức là có nhiều nghiên cứu có hiệu quả có ý nghĩa thống kê nhiều hơn .

Trên đây là 10 hiểu lầm (cũng có thể xem là sai sót) trong cách hiểu về ý nghĩa của trị số P. Những cách hiểu sai này gây tác hại rất lớn đến nghiên cứu khoa học. Rất nhiều thuốc vô hiệu quả, rất nhiều liệu pháp điều trị vô dụng, rất nhiều khám phá khoa học sai, rất nhiều kết luận gây hoang mang trong công chúng, rất nhiều đầu tư sai lầm, v.v… có nguồn từ hiểu sai trị số P. Chính vì hiểu sai rồi đi đến kết luận sai, nên đại đa số (có thể hơn 90%) các phát hiện khoa học báo cáo trên các tập san quốc tế là sai lầm.

Không phải chỉ giới khoa học, mà ngay cả giới báo chí truyền thông cũng cần phải hiểu rõ ý nghĩa của trị số P. Hiểu rõ để tránh đi đến Tóm lại sai và đưa tin giật gân. Hy vọng rằng qua cái note này những bạn đã phân biệt được khoa học dởm và khoa học thật qua trị số P .
Lan Phương ( sưu tầm )
Nguồn : http://tuanvannguyen.blogspot.com/2017/03/10-hieu-lam-ve-tri-so-p-trong-khoa-hoc.html

Source: https://thevesta.vn
Category: Bản Tin