Methodology

Note: Website đang trong quá trình hoàn thiện nên xin mời bạn đọc vui lòng truy cập fanpage Scientometrics for Vietnam để theo dõi các nội dung cập nhật hàng tuần.


Phương pháp luận đối với chuỗi bài viết TOP 15 CƠ SỞ GIÁO DỤC ĐẠI HỌC VIỆT NAM VỀ CÔNG BỐ ISI (GIAI ĐOẠN 2011-2015) 


CÁC CHỈ SỐ ĐƯỢC LỰA CHỌN

Chúng tôi chọn chỉ số Số lượt các bài báo kể trên được được trích dẫn (có xét đến chỉ số tự trích dẫn) và chỉ số H-index trong cùng giai đoạn làm đại diện cho thông tin về Chất lượng (của các bài báo). Xem thêm [1].

Chúng tôi không chọn chỉ số tần suất (citation rate) làm đại diện cho thông tin về Chất lượng vì phân bố của các trích dẫn về các bài báo quốc tế thuộc ISI trong giai đoạn 2011-2015 không phải phân bố chuẩn (normal distribution) và gặp phải vấn đề về độ lệch (skewness). Ngay chính Thomson Reuters cũng đã nhấn mạnh rằng phân bố của chỉ số trích dẫn thường có độ lệch rất lớn, vì vậy, không nên dùng chỉ số chỉ số tần suất trích dẫn để đại diện cho xu hướng tập trung của phân phối (central tendency of the distribution). Xem [2].

Ngoài ra các chỉ số sau cũng được chúng tôi lựa chọn để xem xét đánh giá:

  • Tổng số lượng trích dẫn không kể số lượng tự trích dẫn (xem thêm [3]);
  • Chỉ số H nội lực (chỉ tính các bài báo có tác giả thuộc cơ sở GD ĐH tương ứng là tác giả liên hệ-corresponding author) (xem thêm [4]);
  • Tỷ lệ % số bài có tác giả thuộc cơ sở GD ĐH tương ứng là tác giả liên hệ tính trong số 10% số bài báo có tác động cao nhất (có số lượt trích dẫn lớn nhất) của từng cơ sở GD ĐH (xem thêm [5]).

QUY TRÌNH VÀ PHƯƠNG PHÁP THU THẬP DỮ LIỆU

Trong tháng 10/2015, chúng tôi tiến hành thu thập toàn bộ dữ liệu của cho bảng kết quả dưới đây từ cơ sở dữ liệu ISI của Thomson Reuter tại địa chỉ www.webofknowledge.com

Đầu tiên, tại vòng 1, 15 trường có nhiều bài báo nhất được lọc ra. Sau đó, tại vòng 2, chúng tôi tính toán các chỉ số khác với các bài báo được chọn ra trong vòng 1 và xếp hạng các trường theo từng tiêu chí tương ứng.

Ngoài việc dùng từ khoá là tên tiếng Anh của các cơ sở giáo dục đại học (sau đây gọi tắt là trường) của Việt Nam hiện đang được sử dụng, riêng với các ĐHQG và ĐH vùng, chúng tôi còn sử dụng thêm cả tên trường ĐH thành viên để tìm kiếm. Đối với những trường hợp tên có khả năng nhầm lẫn cao (vd như, Univ Sci có thể thuộc ĐHQG Hà Nội hoặc ĐHQG HCM hoặc ĐH Huế), phương pháp kiểm tra thủ công từng bài được áp dụng. Phương pháp trên giúp tối ưu hóa ở mức độ cao đối với tính đáng tin cậy của dữ liệu mà nhóm nghiên cứu đã khám phá ra.
Một khó khăn là tên tiếng Anh của các trường đại học Việt Nam chưa thống nhất và hay dễ lẫn lộn với nhau. Vì vậy, để đảm bảo không bỏ sót bài báo hay không nhầm bài báo của trường này sang trường khác, ngoài tên gọi chính thức bằng tiếng Anh được lấy từ website của các trường, chúng tôi sử dụng thêm các tổ hợp cú pháp có liên quan khác để tìm dữ liệu (ví dụ Vietnam National University, Hanoi hay Hanoi National University đều chỉ ĐHQGHN hoặc Da Nang University hay Danang University đều để chỉ ĐH Đà Nẵng).

Trong một số trường hợp, chúng tôi phát hiện một số bài báo có tên trường bị sai chính tả; ví dụ DUY TAN UNIV bị viết nhầm thành DAY TAN UNIV. Trong trường hợp này, chúng tôi vẫn tính bài cho trường có tên tương ứng.
Trong một số trường hợp khác, tên một số trường lại trùng với tên địa danh (đường phố)của một trường khác đặt trụ sở. Ví dụ Trường ĐH Sư phạm thuộc ĐH Đà Nẵng có địa chỉ tại Đường Tôn Đức Thắng. Vì vậy, khi chọn từ khoá TON DUC THANG để tìm số bài báo của trường ĐH Tôn Đức Thắng sẽ tìm ra kết quả bài báo của tác giả từ Trường ĐH Sư phạm thuộc ĐH Đà Nẵng. Trong trường hợp này, bài báo trên không được tính cho Trường ĐH Tôn Đức Thắng.

Bằng cách làm trên, các trường đại học Việt Nam có số lượng bài báo khoa học được công bố trên các tập san thuộc ISI được đưa vào danh sách đánh giá của chúng tôi.

PHƯƠNG THỨC PHÂN NGÀNH

Về phương thức phân ngành, chúng tôi chọn cách phân ngành của Web of Science trong đó các ngành được chia thành 22 nhóm (xem thêm [6]). Bảng ngoài cùng bên trái trong hình là số lượng công bố và trích dẫn của toàn bộ các cơ sở nghiên cứu từ Việt Nam (bao gồm các cơ sở GD ĐH và các viện, trung tâm nghiên cứu …) từ 01/01/2011 đến 26/10/2015.

Các kết quả được công bố theo các phân ngành với các chỉ số được lựa chọn, quy trình và phương pháp tương tự như đối với tất cả các ngành.

Một điểm lưu ý thêm là một số cơ sở GD ĐH lọt vào Top 15 trong bảng tổng tất cả các ngành có thể lại nằm ngoài Top 15 đối với bảng từng phân ngành. Vì vậy, trong các bảng biểu trong hình vẽ, độc giả có thể thấy xuất hiện tên một số cơ sở GD ĐH mới. Vì vậy, chúng tôi bổ sung thêm Bảng viết bằng chữ màu tím (phía dưới bên trái) là số công bố ISI của các cơ sở GD ĐH thuộc top 15 trong bảng tổng tất cả các ngành nhưng bị loại khỏi bảng Top 15 phân ngành để độc giả tham khảo thêm.


Phương pháp luận đối với chuỗi bài viết TOP 15 CƠ SỞ GIÁO DỤC ĐẠI HỌC VIỆT NAM VỀ CÔNG BỐ ISI (GIAI ĐOẠN 2011-2015) 


Kết quả (về số lượng và chất lượng công bố ISI) của Việt Nam trong mối tương quan so sánh với các nước ASEAN sẽ được S4VN phản ánh theo tổng tất cả 22 phân ngành và từng phân ngành với các chỉ số được lựa chọn, quy trình và phương pháp tương tự như trên. Cụ thể, các chỉ số được lựa chọn trong chuỗi bài này bao gồm:

1. Vị trí xếp hạng thế giới qua từng năm theo số lượng công bố ISI thuộc phân ngành Khoa học đa ngành của Việt Nam và các nước ASEAN (2010-2015);
2. Số lượng các bài báo ISI được công bố qua từng năm thuộc phân ngành Khoa học đa ngành của Việt Nam và các nước ASEAN (2010-2015);
3. Tốc độ tăng trưởng hằng năm về số lượng công bố ISI thuộc phân ngành Khoa học đa ngành của Việt Nam so với các nước ASEAN (2010-2015).
4. Số lượt trích dẫn của công bố ISI thuộc phân ngành Khoa học đa ngành qua từng năm của Việt Nam và các nước ASEAN (2010-2015);
5. Mức độ chênh lệch tương đối về trích dẫn đối với các công bố ISI thuộc phân ngành Khoa học đa ngành qua từng năm của Việt Nam so với các nước ASEAN (2010-2015);
6. Chỉ số H của công bố ISI thuộc phân ngành Khoa học đa ngành qua từng năm của Việt Nam và các nước ASEAN (2010-2015).

Khái niệm mức độ chênh lệch tương đối (relative difference) được định nghĩa là tỉ lệ giữa mức chênh lệch tuyệt đối và giá trị quy chiếu. Mức độ chênh lệch tương đối = mức chênh lệch tuyệt đối/giá trị quy chiếu = (giá trị so sánh – giá trị quy chiếu)/giá trị quy chiếu. Mức chênh lệch tuyệt đối và tương đối có giá trị dương nếu giá trị được so sánh lớn hơn giá trị quy chiếu, và có giá trị âm nếu giá trị được so sánh nhỏ hơn giá trị quy chiếu (xem thêm ở [7]).

___________________________________
Tài liệu tham khảo:
[1] http://researchguides.uic.edu/c.php?g=252299&p=1683205
[2] http://ipscience-help.thomsonreuters.com/incitesLive/ESIGroup/fieldBaselines/ citationRatesBaselines.html
[3] http://wokinfo.com/essays/journal-self-citation-jcr/
[4] http://www.leidenranking.com/methodology/indicators
[5] Hu X.J., Rousseau R., Chen J. In those fields where multiple authorship is the rule, the h-index should be supplemented by role-based h-indices. Journal of Information Science 36 (1) (2010) 73-85. doi:10.1177/0165551509348133
[6] http://archive.sciencewatch.com/about/met/fielddef/
[7] Bennett, J. O., & Briggs, W. L. (2011). Using and understanding mathematics: A quantitative reasoning approach.Pearson, London.

Nhóm dự án S4VN (Trắc lượng Khoa học Việt Nam)