Công nghệ thông tin & Cơ sở toán học cho tin học<br />
<br />
HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU,<br />
TÌM KIẾM THÔNG TIN BỆNH<br />
Nguyễn Hồng Sơn1*, Dương Trọng Hải2, Hoa Tất Thắng3<br />
Abstract: Hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin<br />
bệnh “Smart Doctor” được xây dựng dựa trên phương thức tìm kiếm ngữ nghĩa,<br />
tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa<br />
Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Đầu tiên, chúng tôi kế thừa<br />
và Việt hóa mạng tri thức về các bệnh tật Disease Ontology là sản phẩm kết hợp<br />
của đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School<br />
of Medicine, Viện Khoa học Di truyền. Mạng tri thức này là cơ sở cho suy luận,<br />
hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá<br />
trình tìm kiếm. Tiếp đến, thông tin tìm kiếm được phân cụm động (dynamic<br />
clustering) theo các facets và hệ thống phân cấp (categories) dựa trên mạng ngữ<br />
nghĩa và tương tác của người dùng. Dựa trên cơ sở đó, hệ thống tương tác thông<br />
minh trong tra cứu và tìm kiếm thông tin bệnh “Smart Doctor” được xây dựng và<br />
trình bày trong bài báo này như là một minh chứng thực tế cho các khái niệm của<br />
chúng tôi.<br />
Keywords: Big Data, Smart doctor, Dynamic clustering, Facets.<br />
<br />
1. MỞ ĐẦU<br />
Sự bùng nổ số lượng thông tin bởi người dùng trực tuyến cũng như sự phát triển của dữ<br />
liệu lớn - Big data, cung cấp một cơ hội mới và cũng là một thách thức cho việc tìm ra<br />
đúng thông tin cần thiết. Khi tìm kiếm thông tin, người dùng có nhu cầu muốn biết thật<br />
chính xác hoặc nhiều thông tin liên quan với những từ khóa ngắn nhất. Đôi lúc người dùng<br />
cũng cần hệ thống đề nghị một số từ khóa hay thông tin liên quan để tiếp tục quá trình tìm<br />
kiếm vì họ cũng chưa thực sự hiểu được nội dung đang tìm kiếm là gì. Ví dụ, người bệnh<br />
chỉ biết một số triệu chứng bệnh căn bản và cần biết mình đang mắc bệnh gì; họ cần hệ<br />
thống khuyến nghị một số triệu chứng bệnh liên quan để người dùng chọn và xác nhận [5].<br />
Hiện nay, các trang tìm kiếm thông tin về bệnh tật chủ yếu dừng ở mức độ tra cứu,<br />
thường theo một tuần tự, phải đi từ chỉ mục đến vấn đề/triệu chứng cần tra cứu, tiếp đến<br />
phải đọc rất nhiều để tìm đến thông tin cần tham khảo, như thế mất rất nhiều thời gian,<br />
hiệu quả đem lại không cao và thường kém chính xác. Đây chính là những lý do cơ bản<br />
khiến cho các hệ thống tìm kiếm hiện nay có kết quả trả về không phải lúc nào cũng thỏa<br />
mãn yêu cầu của người sử dụng [5].<br />
Trong ngữ cảnh đó, chúng tôi tập trung vào việc xây dựng hệ thống Web tìm kiếm ngữ<br />
nghĩa [1] tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ<br />
nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, mạng tri thức về<br />
các bệnh tật Disease Ontology [5] được kế thừa và Việt hóa là cơ sở cho suy luận, hướng<br />
luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm.<br />
Cụ thể là, Web tìm kiếm ngữ nghĩa sử dụng dữ liệu bệnh tật được đặc tả nói trên, có khả<br />
năng tự tạo lập và cập nhật một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ<br />
liệu bệnh được cung cấp bởi chuyên gia và các nguồn đáng tin cậy. Nhờ đó, thông tin tìm<br />
kiếm được phân cụm động theo các facets và hệ thống phân cấp (categories) dựa trên<br />
mạng ngữ nghĩa và tương tác của người dùng. Dựa trên thông tin cung cấp ban đầu và lịch<br />
sử tương tác của người dùng, các facets được tạo ra thích ứng với tương tác người dùng<br />
nhằm điều hướng luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong<br />
<br />
<br />
160 N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh … thông tin bệnh.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
quá trình tìm kiếm. Với sự điều hướng luồng thông tin tìm kiếm giúp người dùng tìm đến<br />
thông tin chủ ý và thông tin liên quan nhanh chóng và chính xác.<br />
Bài báo được trình bày theo cấu trúc như sau: phần 2 sẽ trình bày cấu trúc khung của hệ<br />
thống Smart Doctor, và tóm tắt về Disease Ontology; phần 3 sẽ trình bày chi tiết công cụ<br />
chiết thông tin và phương pháp tạo lập cũng như sử dụng mạng Disease Ontology. Trong<br />
phần này, việc chuyển hóa Disease Ontology sang tiếng Việt cũng được trình bày. Do hạn<br />
chế của giới hạn bài báo, chúng tôi chỉ giới thiệu sơ lược cách sử dụng máy học (machine<br />
learning) trong hướng nghiên cứu này. Kết luận và hướng mở của đề tài sẽ được trình bày<br />
trong phần 4.<br />
2. HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU/TÌM KIẾM<br />
THÔNG TIN BỆNH - “SMART DOCTOR”<br />
Smart Doctor cung cấp công cụ tìm kiếm bệnh thông minh thông qua những triệu<br />
chứng của người dùng. Mặc khác, ứng dụng cung cấp nhiều thông tin về bệnh, được lấy từ<br />
nhiều nguồn với sự xem xét và đánh giá của những chuyên gia trong lĩnh vực y tế. Mục<br />
tiêu của “Smart Doctor” cố gắng giảm thiểu công sức và thời gian của người dùng trong<br />
quá trình tìm kiếm bệnh, và cung cấp những thông tin cần thiết về bệnh cho người dùng để<br />
họ có thể sớm biết về tình trạng bệnh, và có những biện pháp phù hợp.<br />
2.1. Cấu trúc khung của Hệ thống<br />
Cấu trúc khung của Hệ thống “Smart Doctor” được mô tả trong hình 1:<br />
<br />
<br />
<br />
<br />
Hình 1. Cấu trúc khung của ứng dụng.<br />
2.2. Ontology dịch bệnh<br />
Ontology dịch bệnh (Disease Ontology) đã được phát triển như là một bản thể học<br />
chuẩn cho bệnh nhân với mục đích cung cấp cho cộng đồng y sinh thiệu phù hợp, tái sử<br />
dụng và bền vững về bệnh của con người, đặc điểm kiểu hình và khái niệm bệnh từ vựng y<br />
tế có liên quan thông qua các nỗ lực hợp tác của các nhà nghiên cứu tại Đại học<br />
Northwestern, Trung tâm y học di truyền và Đại học Maryland School of Medicine, Viện<br />
Khoa học Di truyền [5].<br />
Ví dụ thông tin bệnh trong Disease Ontology (xem hình 2, 3).<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 161<br />
Công nghệ thông tin & Cơ sở toán học cho tin học<br />
<br />
3. XÂY DỰNG HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA<br />
CỨU/TÌM KIẾM THÔNG TIN BỆNH - “SMART DOCTOR”<br />
3.1. Công cụ trích xuất dữ liệu<br />
Dựa vào cấu trúc thông tin với định dạng XML của bệnh trong “Disease Ontology”,<br />
công cụ “Extraction data tool” mô hình hóa cấu trúc dữ liệu của “Disease Ontology” thành<br />
những lớp trong ngôn ngữ lập trình, và trích xuất dữ liệu đưa vào cơ sở dữ liệu bệnh<br />
(Disease schema) theo những phương pháp sau:<br />
a. Phương pháp rút thông tin bệnh<br />
<br />
<br />
<br />
<br />
Hình 2. Mẫu ví dụ về một bệnh trong Disease Ontology.<br />
<br />
<br />
<br />
<br />
Hình 3. Mẫu dữ liệu bệnh trong Disease Ontology.<br />
Mã số bệnh:<br />
- Dữ liệu được chứa vào cột [DiseaseId] của bảng [Disease]<br />
- Dữ liệu được rút từ tag<br />
“”, <br />
=> [DiseaseId] = “DOID:0050004”<br />
Tên bệnh:<br />
<br />
<br />
162 N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh … thông tin bệnh.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
- Dữ liệu được chứa vào cột [LabelEn] của bảng [Disease]<br />
- Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong Hình 4.5:<br />
seminal<br />
vesicle acute gonorrhea<br />
=> [LabelEn] = “seminal vesicle acute gonorrhea”<br />
Mã số bệnh cha:<br />
- Dữ liệu được chứa vào cột [ParentDiseaseId] của bảng [Disease]<br />
- Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong hình 7:<br />
<br />
=> [LabelEn] = “DOID:10400”<br />
b. Phương pháp rút loại thuộc tính bệnh<br />
<br />
<br />
<br />
<br />
Hình 4. Mẫu dữ liệu loại thuộc tính bệnh trong Disease Ontology.<br />
Tên loại thuộc tính bệnh bệnh:<br />
- Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseasePropertyCategory]<br />
- Dữ liệu được rút từ tag “” như sau:<br />
has_symptom<br />
”<br />
=> Rút được [LabelEn] = “has_symptom”<br />
c. Phương pháp rút dữ liệu tính chất bệnh<br />
<br />
<br />
<br />
<br />
Hình 5. Mẫu dữ liệu chứa tính chất bệnh trong Disease Ontology.<br />
Tên tính của tính chất bệnh:<br />
- Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseaseProperty]<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 163<br />
Công nghệ thông tin & Cơ sở toán học cho tin học<br />
<br />
- Rút dữ liệu tính chất bệnh trong tag “” và<br />
“”. Dữ liệu trong những tags này chứa nhiều tính chất<br />
bệnh, như:<br />
“A viral infectious disease that results_in infection located_in joint,<br />
has_material_basis_in Chikungunya virus, which is transmitted_by Aedes mosquito bite.<br />
The infection has_symptom fever”<br />
=> Trích xuất được thông tin của tính chất loại: “results_in”, “has_material_basis_in” ,<br />
“transmitted_by”, và “has_symptom”.<br />
Vì vậy, công cụ này sẽ dùng trích xuất dữ liệu bằng kỷ thuật “regular expression”, theo<br />
từng bước như sau:<br />
Bước 1: chia nhỏ từng phần của đoạn dữ liệu lớn thành từng phần nhỏ, và đảm bảo một<br />
phần chỉ chứa duy nhất một tính chất của bệnh, như ví dụ trên thì có thể chia thành những<br />
phần sau:<br />
“A viral infectious disease that”<br />
“results_in infection”<br />
“located_in joint,”<br />
“has_material_basis_in Chikungunya virus, which is”<br />
“transmitted_by Aedes mosquito bite. The infection”<br />
“has_symptom fever”<br />
Bước 2: sử dụng mẫu (pattern) của “regular expression” theo từng loại thuộc tính bệnh<br />
để rút chính thông tin, như ví dụ trên thì:<br />
“has_symptom fever”: dùng mẫu của loại “has_symptom” là “has_symptom (.*)”,<br />
và có thể rút ra được dữ liệu “fever”.<br />
d. Phương pháp dịch dữ liệu sang tiếng Việt<br />
Hệ thống hỗ trợ phương thức dịch từ ngữ từ tiếng Anh sang tiếng Việt, thông qua<br />
“Translation website” của Google:<br />
<br />
<br />
<br />
<br />
Hình 6. Phương thức dịch ngôn ngữ.<br />
Dữ liệu sau khi được dịch sẽ được lưu vào cột “LabelVn” của những bảng như:<br />
“Disease”, “DiseaseProperty”, “DiseasePropertyCategory”.<br />
e. Kết quả trích xuất dữ liệu từ Disease Ontology<br />
<br />
<br />
164 N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh … thông tin bệnh.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
* Bệnh: có 8796 bệnh trong bảng “Disease”<br />
<br />
<br />
<br />
<br />
Hình 7. Mẫu dữ liệu trong bảng “Disease”.<br />
* Loại thuộc tính bệnh: các loại tính chất bệnh trong “DiseasePropertyCategories”:<br />
<br />
<br />
<br />
<br />
Hình 8. Mẫu dữ liệu trong bảng “DiseasePropertyCategories”.<br />
* Thuộc tính bệnh: có 2444 thuộc tính bệnh trong bảng “DiseaseProperty”<br />
<br />
<br />
<br />
<br />
Hình 9. Mẫu dữ liệu trong bảng "DiseaseProperty".<br />
3.2. Công cụ Machine learning<br />
Dựa vào dữ liệu từ trích xuất từ “Disease Ontology”, thì những tính chất của bệnh có<br />
mỗi quan hệ với nhau, ví dụ:<br />
<br />
<br />
<br />
<br />
Hình 10. Mẫu dữ liệu bệnh trong CSDL.<br />
Trong 2 bệnh nêu trên có những tính chất bệnh cùng xuất hiện ở hai bệnh như: sốt<br />
(fever), đau đầu (headache), …<br />
Vì vậy, có thể sử dụng một số thuật toán của “machine learning”, cụ thể là Word2Vec<br />
[9] để khám phá ra mối quan hệ của những tính chất bệnh.<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 165<br />
Công nghệ thông tin & Cơ sở toán học cho tin học<br />
<br />
<br />
<br />
<br />
Hình 11. Khám phá 1.355.834 luật liên kết của tính chất bệnh.<br />
<br />
<br />
<br />
<br />
Hình 12. Mẫu dữ liệu về một luật liên kết.<br />
Theo hình trên, thì ta có thông tin luật với mã số (ID) = 2 là:<br />
- Độ hỗ trợ (Support) = 0.2581<br />
- Độ tin cậy (Confidence) = 60<br />
- Mối quan hệ:{fever, vomiting, water contaminated with feces, muschle spasams}<br />
=>{direct contract with the oral secretions, ingestion of food, human poliovirus 3}<br />
3.3. Ghi lại quá trình tìm kiếm của người dùng<br />
Trong tìm kiếm của người sử dụng, hệ thống lưu lại các truy vấn của người dùng như<br />
các từ khóa tìm kiếm, bối cảnh của người sử dụng (thời gian, địa điểm); và cũng là tham<br />
khảo kết quả của người sử dụng như: kết quả mà bệnh được nhập, bao lâu dừng sử dụng<br />
để đọc thông tin dịch bệnh, những nhận xét của người dùng về mỗi kết quả tìm kiếm của<br />
bệnh, và sự đánh giá của người dùng trên mỗi kết quả tìm kiếm của bệnh. Hệ thống sẽ lưu<br />
lại lịch sử tìm kiếm để khám phá các hành vi của người sử dụng, và điều chỉnh cơ sở dữ<br />
liệu bệnh trên đánh giá của người sử dụng.<br />
3.4. Các thành phần khác<br />
Ngoài các thành phần cấu thành hệ thống như đã nêu ở trên, Hệ thống Smart Doctor<br />
còn bao gồm một số thành phần sau:<br />
- Mô hình thực thể trong cơ sở dữ liệu.<br />
- Lớp truy xuất dữ liệu: cung cấp các phương thức truy xuất cơ sở dữ liệu.<br />
- Lớp Repository: chứa những câu truy vấn phức tạp sử dụng “Lambda expression”<br />
- Lớp nghiệp vụ của hệ thống: dùng để hiện thực các nghiệp vụ của hệ thống.<br />
- Các hàm truy vấn dữ liệu - REST APIs: cung cấp những phương thức truy vấn dữ<br />
liệu của hệ thống thông qua URI cho những hệ thống khách.<br />
- Ứng dụng Single page (SPA): Sử dụng công nghệ web như: HTML5, CSS3,<br />
Typescripts, và Angular.js để làm ứng dụng website trên một trang với mục tiêu<br />
đưa trải nghiệm người dùng trên web như ứng dụng trên máy tính.<br />
3.5. Kết quả giao diện người sử dụng<br />
<br />
<br />
<br />
<br />
Hình 13. Autocomplete trong khung tìm kiếm.<br />
<br />
<br />
166 N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh … thông tin bệnh.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
Hệ thống này cung cấp tính năng gợi ý đề nghị để tăng tính tương tác giữa người sử<br />
dụng và hệ thống, trong một số tình huống dưới đây:<br />
Khi người sử dụng chỉ cần nhập một số ký tự vào hộp tìm kiếm, hệ thống sẽ đề nghị<br />
truy vấn với các gợi ý bắt đầu với những ký tự này. Nó giúp người sử dụng điền các truy<br />
vấn nhanh hơn bằng cách lựa chọn câu hỏi từ gợi ý và sử dụng các tiêu chí tìm kiếm chính<br />
xác hơn bằng cách đưa ra gợi ý chính tả.<br />
Trong trường hợp, người sử dụng chỉ nhớ một từ khóa của các truy vấn, và họ có thể<br />
nhập các từ khóa vào ô tìm kiếm, hệ thống sẽ đề xuất các truy vấn, có chứa các từ khóa<br />
này. Nó giúp người sử dụng lựa chọn các truy vấn phù hợp với ý định của họ mà không<br />
cần nhớ toàn bộ truy vấn.<br />
Ngoài ra, đề nghị gợi ý không chỉ giúp người dùng lựa chọn các truy vấn chính xác cho<br />
ý định của họ, mà còn giúp họ có các truy vấn thuộc vào từ điển của hệ thống. Điều này sẽ<br />
giúp sự tự tin của các truy vấn cao hơn và các kết quả tìm kiếm chính xác hơn.<br />
<br />
<br />
<br />
<br />
Hình 14. Gợi ý từ khóa liên quan trong khung tìm kiếm.<br />
Hệ thống này cũng cung cấp tính năng đề<br />
xuất để giới thiệu các triệu chứng có liên<br />
quan hoặc thuộc bệnh khác, ví dụ như khi<br />
người sử dụng lựa chọn một số từ khóa tìm<br />
kiếm là "sốt" (fever), "đau đầu" (headache),<br />
và họ dừng lại để nghĩ cho tìm kiếm các từ<br />
khóa tiếp theo; lúc này hệ thống sẽ giới thiệu<br />
các triệu chứng liên quan với các triệu chứng<br />
bình chọn là "co giật" (convulsions). Các<br />
triệu chứng liên quan được khám phá từ các<br />
quy tắc quan hệ của các triệu chứng, và các<br />
triệu chứng liên quan được đặt hàng (trên<br />
xuống dưới) bởi sự tự tin của quy tắc của các<br />
triệu chứng liên quan.<br />
Khi người dùng thực hiện tìm kiếm thì hệ<br />
thống sẽ tìm bệnh tương ứng với những thuộc<br />
tính bệnh mà người dùng đã gõ vào, với<br />
những lựa chọn kết quả tìm kiếm như sau:<br />
- Dữ liệu hệ thống chọn ra bệnh có thuộc<br />
tính đang tìm kiếm, bệnh được sắp xếp theo<br />
số lượng đã xem và đánh giá đó, và nội dung<br />
của những bệnh này được cung cấp bởi<br />
những tài liệu trong hệ thống.<br />
- Dữ liệu bên ngoài, ứng với mỗi bệnh từ Hình 15. Hiển thị kết quả tìm kiếm bệnh.<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 167<br />
Công nghệ thông tin & Cơ sở toán học cho tin học<br />
<br />
dữ liệu hệ thống thì hệ thống sẽ tìm kiếm trên Google với từ khóa là tên bệnh, và lấy<br />
những kết quả (top 3) được đánh giá cao để gợi ý người dùng.<br />
Kết quả hiển thị từng khối cho mỗi bệnh, và được sắp xếp từ trái sang phải, từ trên<br />
xuống dưới. Mỗi khối bệnh được hiển thị như sau (hình 15):<br />
- Phần trên hiển thị ảnh đại diện của bệnh.<br />
- Phần giữa hiển thị tên bệnh, và số lượng người xem bệnh này.<br />
- Phần cuối hiển thị đánh giá của người dùng về nội dung bệnh.<br />
4. KẾT LUẬN VÀ HƯỚNG MỞ<br />
Trong bài báo này, chúng tối đã giới thiệu việc xây dựng hệ thống Web tìm kiếm ngữ<br />
nghĩa tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa<br />
Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, chúng tôi kế thừa và<br />
Việt hóa mạng tri thức về các bệnh tật Disease Ontology [5], đây là cơ sở cho việc hướng<br />
luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm.<br />
Từ đó, công cụ Web tìm kiếm ngữ nghĩa được xây dựng có khả năng tự tạo lập và cập nhật<br />
một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ liệu bệnh được cung cấp bởi<br />
chuyên gia và các nguồn đáng tin cậy khác. Từ đây, các facets và hệ thống phân cấp<br />
(categories) được đặc tả và sử dụng trong việc tương tác với người dùng nhằm điều hướng<br />
luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong quá trình tìm kiếm.<br />
Trong hướng nghiên cứu tiếp theo, chúng tôi sẽ tập trung vào việc hỗ trợ giao tác trực<br />
tuyến (interoperabiligy) để có thể kết nối Smart Doctor với các hệ thống liên kết. Đặc biệt,<br />
để đảm bảo mạng tri thức luôn được cấp nhập, chúng tôi sẽ xây dựng công cụ để đồng bộ<br />
hóa mạng tri thức bệnh đã được Việt hóa và hệ thống Disease Ontology [5].<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Dario Bonino, Fulvio Corno, Laura Farinetti, Alessio Bosca, “Ontology Driven<br />
Semantic Search”, WSEAS Transaction on Information Science and Application,<br />
Issue 6, Volume 1, December 2004, pp. 1597-1605.<br />
[2]. Denman, S., et al., “Searching for people using semantic soft biometric<br />
descriptions”. Pattern Recognition Letters, 2015. 68: p. 306-315.<br />
[3]. Guha, R., R. McCool, and E. Miller. “Semantic search”. in Proceedings of the 12th<br />
international conference on World Wide Web. 2003. ACM.<br />
[4]. Henrik Eriksso, “The semantic-document approach to combining documents and<br />
ontologies”, International Journal of Human-Computer Studies Volume 65, Issue 7,<br />
July 2007, Pages 624-639.<br />
[5]. Kibbe WA, Arze C, Felix V, Mitraka E, Bolton E, Fu G, Mungall CJ, Binder JX,<br />
Malone J, Vasant D, Parkinson H, Schriml LM. “Disease Ontology 2015 update: an<br />
expanded and updated database of human diseases for linking biomedical knowledge<br />
through disease data Nucleic Acids Research 2014”; Oct 27. pii: gku1011<br />
[6]. Ma, B., et al., “Public opinion analysis based on probabilistic topic modeling and<br />
deep learning”. Public opinion, 2016.<br />
[7]. Trong Hai Duong, Jo G.S., Jung J.J., Nguyen N.T. (2009): “Complexity Analysis of<br />
Ontology Integration Methodologies: A Comparative Study”. Journal of Universal<br />
Computer Science 15(4), 877-897.<br />
[8]. Trong Hai Duong, Jo G.S. (2010): “Collaborative Ontology Building by Reaching<br />
Consensus among Participants”. Information-An International Interdisciplinary<br />
Journal, 1557-1569.<br />
<br />
<br />
168 N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh … thông tin bệnh.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
[9]. https://en.wikipedia.org/wiki/Word2vec<br />
TÓM TẮT<br />
SMART DOCTOR – AN INTELLIGENT INTERACTIVE SYSTEM<br />
FOR SEARCHING AND RETRIEVING DISEASE INFORMATION<br />
Intelligent interactive system for searching and retrieving disease information,<br />
namely Smart Doctor, is studied and developed based on semantic search<br />
methodology. The system is also aimed by integrating concepts of expert system and<br />
of recommendation system in searching and retrieving disease documents.<br />
First, the disease knowledge network is built based on the OWL standard and is<br />
integrated from multiple sources. Afterwards, the search information is dynamically<br />
clustered according to the facets and categorized based on the semantic network<br />
and the user interaction. Hereafter, the intelligent interactive system Smart Doctor<br />
is built and presented as typical examples to prove our concepts in this paper.<br />
Keywords: Big Data, Smart doctor, Dynamic clustering, Facets.<br />
<br />
<br />
Nhận bài ngày 11 tháng 10 năm 2017<br />
Hoàn thiện ngày 08 tháng 11 năm 2017<br />
Chấp nhận đăng ngày 26 tháng 02 năm 2018<br />
<br />
<br />
Địa chỉ: 1 Trường Đại học Luật, Đại học Huế;<br />
2<br />
Trường Đại học Nguyễn Tất Thành;<br />
3<br />
Học viện Kỹ thuật quân sự.<br />
*<br />
Email: son_nguyenhong2002@yahoo.com.<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 169<br />