BÀI GIẢNG NGHIÊN CỨU KHOA HỌC BẬC NGHIÊN CỨU SINH TIẾN SỸ HỆ THỐNG THÔNG TIN
CHƯƠNG 2. TiẾN HÀNH NGHIÊN CỨU
PGS. TS. HÀ QUANG THỤY HÀ NỘI 09-2013 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI
1
Nội dung
1.
2.
3.
Quá trình NCKH Lý thuyết hóa Phương pháp nghiên cứu Một số bài học trong tiến hành nghiên cứu
2
4.
1. Quá trình NCKH
1.1. Đặt câu hỏi nghiên cứu 1.2. Vai trò của tài liệu trong quá trình nghiên cứu 1.3. Thiết kế nghiên cứu 1.4. Phương pháp luận nghiên cứu khoa học
3
Câu hỏi nghiên cứu
Năm đầu tiên của hành trình NCS
Dành riêng để đáp ứng hai thách thức
các tài liệu hiện có
Phương pháp và lý thuyết: Khảo sát một cách hệ thống
Khảo sát một cách hệ thống các tài liệu
Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu
lý thuyết liên quan
Có tính cấu trúc cao Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng (tutorial). Nhấn mạnh luận án TS liên quan Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và
Thường là một chương của luận án: literature review. Làm ít hơn: Không chấp nhận. Thuyết bất khả tri miền ứng dụng (domain-agnostic) cho phép nghiên cứu có tính độc lập miền
4
Nền tảng tạo năng lực phương pháp NC tốt.
Một số vấn đề đặt câu hỏi nghiên cứu
"Phát biểu thang máy"
“người nghe đã rời khỏi thang máy”
Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút
cách
Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng
“Cái gì vậy"
Câu hỏi NC tốt chỉ khi là câu hỏi ngắn Đủ phân biệt với các hiện tượng, vấn đề liên quan khác
biện minh câu hỏi nghiên cứu
“Giải quyết thế giới"
Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ! Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và
nguyên (chỉ một mình NCS) và/hoặc thời gian (2-3 năm).
Câu hỏi thực sự quan trọng song không thể giải được do tài
5
Không tìm được giải pháp với tài nguyên và thời gian cho phép
Một số vấn đề đặt câu hỏi nghiên cứu
“Không giải được"
Lý do logic: Thông tin cần cho giải đáp không thể nhận được một cách
logic hoặc hợp lệ
Lý do khả thi: Tính khả thi với các ràng buộc tài nguyên
Câu hỏi không thể trả lời được đúng nghĩa
“Nhiều"
Ví dụ: Nghiên cứu theo chiều dọc: phải trải qua nhiều năm
lớn
Đưa quá nhiều câu hỏi: câu hỏi quá hẹp/quá không thích hợp/quá
Câu hỏi quá rõ ràng: “Có thách thức khi dùng CNTT ?” Câu hỏi không liên quan: “tác động thời tiết tới mức lương của chuyên
viên HTTT ?“ . Chẳng hề liên quan !
Câu hỏi vô lý: “Trái đất phẳng?” Mọi người đều phản đối ! Câu hỏi định nghĩa: “xung đột công nghệ đặc trưng bởi sự bất đồng?” Câu hỏi khẳng định: “một công cụ hỗ trợ quyết định có thể được phát triển để tạo điều kiện ra quyết định cho giám đốc điều hành cấp cao 6 bán lẻ”.
Nên 01/02 câu hỏi Một số ví dụ (Danh sách đen)
Một số hướng dẫn tìm câu hỏi NC tốt
Gợi ý
một tuyên bố quan trọng xác định hiện tượng được nghiên cứu
(các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay quanh và tiến hóa nó (chúng)/
các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó trong luận án
Một số câu hỏi hướng dẫn
Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ? Hãy cho biết thân tri thức của lĩnh vực đó là gì ?
vực là gì ?
Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh
Những vùng nào cần được tiếp tục khảo sát ?
đến một hiểu biết nhiều hơn?
7
Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn
Một số hướng dẫn tìm câu hỏi NC tốt
Một số câu hỏi hướng dẫn (tiếp)
chủ đề?
Nhiều ra sao các nghiên cứu đã được tiến hành trong vùng
chỗ cho sự cải tiến?
Nghiên cứu đề xuất đã được thực hiện trước đây ? Liệu có còn
Có phù hợp thời gian hay không khi câu hỏi được trả lời? Nó là một chủ đề bền vững và quan trọng hay nó hiện là chủ đề nóng nhưng là mốt nhất thời nên có nguy cơ trở nên lỗi thời?
Ai sẽ quan tâm đến việc có được một câu trả lời cho câu hỏi? Tác động tiềm năng của nghiên cứu được đề xuất là gì? Lợi ích của việc trả lời câu hỏi nghiên cứu là gì? Nó sẽ trợ giúp ai, và nó sẽ giúp họ như thế nào?
Ba thành phần chính khi phát triển câu hỏi NC Động lực, Đặc tả phát biểu câu hỏi, Biện luận tường minh
8
Nghiên cứu đề xuất có một tác động đáng kể về lĩnh vực này?
Ba thành phần Phát triển câu hỏi NC Động lực (Motivation)
thành dãy các trao đổi. Dãy trao đổi này đề cập tới: Một miền bài toán quan trọng cần đề cập Một khoảng trống tri thức cần bù đắp Một hiện tượng quan trọng cụ thể mà được cộng đồng nghiên
cứu quan tâm
Đặt câu hỏi NC là các trao đổi logic, cần thiết, không tránh khỏi
Động lực không nhất thiết rộng mà cần đề cập 3 khía cạnh trên Ví dụ về dãy các trao đổi
Các tổ chức đầu tư vào CNTT mới, hy vọng thu được ích lợi từ các đầu tư này. Miền bài toán: Đầu tư vào CNTT, được hưởng lợi từ CNTT. Quan trọng: lượng tiền
CNTT. Hiện tượng đặc biệt: Nhân viên không dùng CNTT.
Lợi ích như thế không có được nếu nhân viên không dùng
9
Dẫn tới câu hỏi nghiên cứu Tại sao nhân viên tử chối dùng CNTT? (cid:0) Bài báo “Identifying and Testing the Inhibitors of Technology Usage Intentions”
Ba thành phần Phát triển câu hỏi NC Đặc tả phát biểu bài toán (Specification of
Problem Statement) Khi có động lực thích hợp (cid:0) xác định chính xác câu hỏi NC Loại câu hỏi NC
kiếm và khám phá các chủ đề vẫn còn ít tri thức
Câu hỏi “ai”, “cái gì”, “ở đâu”: hướng tới các mục tiêu tìm
Câu hỏi “làm thế nào”, “vì sao”: câu hỏi giải thích, tìm kiếm câu trả lời về cơ chế nhân-quả tới công việc liên quan một hiện tượng cụ thể
thức và kinh nghiệm
Phát triển câu hỏi NC như một phát biểu bài toán là một trong các bước quan trọng nhất NCS TS (cid:0) cần kiên nhẫn và linh hoạt. Dành thời gian hiệu chỉnh câu hỏi NC theo sự phát triển tri
ban đầu
Không cứng nhắc: mềm dẻo khi thực tiễn khác biệt so với
cứu và điều tra
10
Câu hỏi NC: cần có tín hiệu về cách thức trả lời Câu hỏi NC nên theo hướng phân cấp: quản lý được với nghiên
Ba thành phần Phát triển câu hỏi NC
Biện luận tường minh (Justification)
trọng và xứng đáng quan tâm
Diễn giải Câu hỏi NC tốt: đi kèm lập luận lý do vấn đề cụ thể là quan
thể
mỗi câu hỏi cho thấy thiếu hụt tri thức trong một miền cụ
trọng
Cung cấp trao đổi: vì sao quan tâm cụ thể / câu hỏi là quan
độ quan trọng của các vấn đề nghiên cứu
11
Nên tiếp cận từ trên xuống: thu hẹp dần để vẫn giữ được
Đánh giá câu hỏi NC
Tiêu chí đánh giá câu hỏi NC tốt
Khả thi: Sẵn có về
đầy đủ các chủ thể nghiên cứu, chuyên môn kỹ thuật, thời gian và tiền bạc, và phạm vị quản lý được
và duy trì động lực trong nhiều năm,
Thú vị để khảo sát: Tự tin về việc duy trì sự quan tâm tới chủ đề
hiện mới
Mới: Câu trả lời sẽ bác bỏ các phát hiện đã có hoặc đưa ra phát
đức, không tạo các nguy cơ mất an toàn
Đạo đức: Theo đuổi và trả lời câu hỏi không vi phạm nguyên lý đạo
12
Xác đáng: Câu hỏi và câu trả lời (trong tương lai) là rất quan trọng: thông báo tri thức khoa học, thực hành công nghiệp, hướng NC
Vai trò của tài liệu trong QT nghiên cứu
Ba loại kiến thức cần có trong hành trình NCS
hỏi và hiện tượng
Kiến thức về miền nghiên cứu và chủ đề quan tâm Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu
được NCS áp dụng để phát triển kiến sản phẩm sáng tạo hay tường minh các câu hỏi mới.
Kiến thức về phương pháp nghiên cứu liên quan mà có thể thức mới, xây dựng các
Sơ bộ về vai trò của tài liệu
Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa học và kho tri thức. NCS công bố bài báo, chương sách, sách
cung cấp cả ba loại kiến thức trên đây
Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế
13
Cần suốt hành trình nghiên cứu NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu biết vững thân tri thức mới đóng góp vào thân tri thức
Vai trò tài liệu
Hệ thống tài liệu chỉ dẫn
mức độ, chủng loại, và bản chất các vấn đề tới hiện thời: tạo độ
khả thi để hình thức hóa vấn đề nghiên cứu. sự thiếu hụt tri thức xung quanh một vấn đề cụ thể: Hỗ trợ xác định câu hỏi NC hàn lâm quan trọng (câu hỏi NC được quan tâm nghiên cứu vì câu trả lời sẽ đóng góp thân tri thức).
• Hệ thống tài liệu: tri thức nền tảng quan trọng
14
mức độ mà lý thuyết hiện thời có thể để giải thích được về các đặc thù của hiện tượng hoặc vấn đề, và tương ứng là chỗ mà chúng còn thiếu hụt chiến lược và phương pháp đã được sử dụng trong quá khứ để nghiên cứu các hiện tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan) các lý thuyết liên quan được dùng để lên khung cuộc khảo sát thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)
Vai trò tài liệu
Hệ thống tài liệu cung cấp
phát hiện và hiểu biết sâu một miền bài toán cụ thể
lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn đề/hiện tượng quan tâm
và áp dụng cho nghiên cứu
Quá trình đọc-nghĩ-giải thích
Tình trạng hiện thời của các phương pháp được làm phù hợp
quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan.
Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên
15
Hầu hết NCS đánh giá thấp sự liên quan của các bài báo khác: cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”
Đọc-nghĩ-giải thích
Những câu hỏi thu hoạch
vực nghiên cứu là gì?
Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh
Liên quan gì tới tài liệu khác và thực tế khác ?
đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là một trường hợp?
NC ?
Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực
thức trong lĩnh vực tại thời điểm được công bố.
16
Suy nghĩ như thế nào về tác động của bài báo tới thân tri
Đọc-nghĩ-giải thích Những câu hỏi thu hoạch
http://www.fsc.yorku.ca/york/istheory/wiki/index.php/Main_Page
Về lý thuyết: xem
http://www.qual.auckland.ac.nz/ http://dstraub.cis.gsu.edu:88/quant/default.asp ...
Tài liệu ngoài miền nghiên cứu
Về phương pháp
bên cạnh miền nghiên cứu cụ thể
Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác,
Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn
17
Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa chung nhất
Một vài kinh nghiệm nhỏ
Hai thông tin cần thiết cơ bản nhất
(chú ý các NCS)
Hội nghị thế giới về lĩnh vực chuyên sâu
Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng
18
Các hiệp hội nghề nghiệp Association for Computing Machinery - ACM: http://www.acm.org/ Association for Information Systems – AIS: http://aisnet.org/ IEEE-CS: http://www.computer.org/portal/web/guest/home và các phân hội của các hiệp hội này, chẳng hạn KDD: http://www.sigkdd.org/index.php Các bài toán được đặt ra Các báo cáo mời Các bài báo được giải thưởng Ví dụ: KDD 2014 http://www.kdd.org/kdd2014/ (Xem trang sau)
Hội nghị KDD 2014
19
Hội nghị KDD 2014: Keynote Talks
Oren Etzioni: The battle for the future of data mining. Eric Horvitz: Data, predictions, and decisions in support of people and society Eric E. Schadt: A data driven approach to diagnosing and treating disease Sendhil Mullainathan: Bugbears or legitimate threats?: (social) scientists' criticisms of machine learning?
http://www.informatik.uni- trier.de/~ley/db/conf/kdd/kdd2014.html
20
KDD 2014: Keynote Talks. Oren Etzioni
http://www.informatik.uni-trier.de/~ley/pers/hd/e/Etzioni:Oren.html
Deep learning has catapulted to the front page of the New York Times, formed the core of the so-called 'Google brain', and achieved impressive results in vision, speech recognition, and elsewhere. Yet researchers have offered simple conundrums that deep learning doesn't address. For example, consider the sentence: 'The large ball crashed right through the table because it was made of Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel', the answer is clearly 'the large ball'. To automatically answer this type of question, our computers require an extensive body of knowledge. We believe that text mining can provide the requisite body of knowledge. My talk will describe work at the new Allen Institute for AI towards building the next- generation of text-mining systems.
21
Một vài kinh nghiệm nhỏ
Nhà khoa học hàng đầu
KDD: http://www.sigkdd.org/innovation-service-awards
Các nhà khoa học được giải thưởng: Ví dụ, ACM : http://awards.acm.org/
Những người báo cáo mời tại các hội nghị hàng đầu
ACM: http://awards.acm.org/doctoral_dissertation/year.cfm
KDD: http://www.sigkdd.org/2014-doctoral-dissertation-award
Những người hướng dẫn NCS được các giải thưởng
(có thể) Những người viết các bài tổng quan về vấn đề nghiên cứu được công bố tại các ấn phẩm có uy tín
: một danh sách các nhà khoa học có chỉ số h-index cao (Google Scholar); Không chỉ ra chủ đề nghiên cứu
Trang web http://www.cs.ucla.edu/~palsberg/h-number.html
để loang tới những bài báo cập nhật nhất
22
Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu
Kinh nghiệm: Tra cứu tài liệu
DBLP
DBLP:
The
DBLP
Digital Bibliography & Library Project Computer Science Bibliography http://www.informatik.uni-trier.de/~ley/db/
+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP” + Tìm dòng kết quả: dblp: tên_người
Để tìm công bố của một tác giả trên DBLP
+ Vào trang web tương ứng + Có thể biết các chủ đề nghiên cứu cập nhật
Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=D http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?PC=K http ://thomsonreuters.com/products_services/science/science_products/a-z/conf_proceedings_citation_index/
Danh mục Scopus
http://www.scimagojr.com/journalrank.php?category=0&area=0&year=2013&country=& order=sjr&page=0&min=0&min_type=cd&out=xls
23
2. Lý thuyết hóa
2.1 Khái niệm lý thuyết và lý thuyết hóa 2.2. Các loại lý thuyết 2.3. Quá trình lý thuyết hóa
24
3. Phương pháp NC
3.1 Phương pháp định lượng 3.2. Phương pháp định tính 3.3. Phương pháp kết hợp 3.4. Phương pháp thiết kế khoa học:
13_#design-science-research-in-information- systems.pdf
25
4. Một số bài học trong tiến hành NC
4.1 Mười quy tắc đơn giản để thực thi nghiên
cứu tốt nhất
4.2. Mười quy tắc đơn giản để hợp tác nghiên
cứu thành công
26