intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Xác định công dụng mới của thuốc dựa vào mô hình cục bộ hai chiều

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

16
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Xác định công dụng mới của thuốc dựa vào mô hình cục bộ hai chiều thực hiện xác định công dụng thuốc mới như một bài toán dự đoán quan hệ thuốc-bệnh. Về mặt thuật toán, bài toán này tương tự với bài toán dự đoán tương tác thuốc-đích.

Chủ đề:
Lưu

Nội dung Text: Xác định công dụng mới của thuốc dựa vào mô hình cục bộ hai chiều

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 XÁC ĐỊNH CÔNG DỤNG MỚI CỦA THUỐC DỰA VÀO MÔ HÌNH CỤC BỘ HAI CHIỀU Nguyễn Hằng Phương Trường Đại học Thủy lợi, email: phuongnh@tlu.edu.vn 1. GIỚI THIỆU CHUNG BLM trong dự đoán tương tác thuốc-đích [2], Trong thời gian gần đây, xác định công chúng tôi điều chỉnh thuật toán mô hình cục dụng thuốc mới (drug repositioning - DR), bộ [1] để thực hiện xác định công dụng thuốc hay là việc tìm kiếm chỉ định mới cho các mới. Cụ thể hơn, các quan hệ thuốc-bệnh đã thuốc đã và đang tồn tại hoặc cho các thuốc biết được biểu diễn thành một mạng song đang trong giai đoạn phát triển, nổi lên như phương với các đỉnh là thuốc hoặc bệnh, một hướng tiếp cận tiết kiệm cả thời gian và cạnh nối giữa một đỉnh thuốc và một đỉnh tiền bạc cho nhiệm vụ thiết kế thuốc mới. bệnh biểu thị mối liên hệ đã biết của chúng. Cùng với sự phát triển mạnh mẽ của dữ Sau đó, mô hình cục bộ được áp dụng để dự liệu liên quan đến thuốc và bệnh, nhiều đoán mối liên hệ giữa thuốc (dr) và bệnh (di) phương pháp xác định công dụng thuốc mới theo hai giai đoạn: i) cho trước thuốc (dr), khác nhau đã được đề xuất. Các phương pháp chúng tôi tính ra một điểm số thể hiện khả này được phân loại thành hai nhóm chính: i) năng sử dụng thuốc (dr) để điều trị bệnh (di) dựa vào mạng và ii) dựa vào học máy. nhờ sử dụng các mối liên hệ đã biết giữa Phần lớn các phương pháp DR có chung ý thuốc đó với các bệnh khác và độ tương đồng tưởng về việc sử dụng một mô hình toàn cục giữa các bệnh, ii) cho trước bệnh (di), tương duy nhất học từ toàn bộ mạng/ma trận liên tự, một điểm số thể hiện khả năng bệnh đó có kết thuốc-bệnh để dự đoán cho mọi loại thể được điều trị bằng thuốc (dr) được tính thuốc/bệnh. Tuy nhiên, việc sử dụng một mô toán dựa trên các mối liên hệ đã biết giữa hình chung để dự đoán cho nhiều thuốc/bệnh bệnh đó với các thuốc khác và độ tương đồng khác nhau được đặc trưng bởi các thông tin giữa các thuốc. Cuối cùng, các điểm số cục dược lý/sinh học khác nhau có thể không bộ này được tổng hợp thành một điểm số hiệu quả. Cho tới nay, các mô hình cục bộ đã cuối cùng cho biết liệu có tồn tại mối liên hệ được áp dụng thành công trong một số bài giữa thuốc và bệnh đang xét. Trong báo cáo toán y sinh khác như dự đoán cạnh liên kết này, mô hình cục bộ trên mạng hai chiều trong các mạng tương tác trao đổi chất và dùng trong xác định công dụng thuốc mới protein [1] và các mạng tương tác gene [5]. (hay BLMDR - Bipartite Local Models for Bên cạnh đó, phương pháp mô hình cục bộ Drug Repositioning) được so sánh với hai chiều (BLM), một dạng khác của mô hình phương pháp RLSDR [4], xác định công cục bộ, đã được đề xuất để dự đoán tương tác dụng thuốc mới dựa vào RLS (bình phương thuốc-đích mới trong mạng song phương tối thiểu có điều chỉnh - Regularized Least thuốc và đích [2]. Square) - một mô hình toàn cục điển hình. Trong báo cáo này, chúng tôi thực hiện Kết quả đánh giá hiệu quả dự đoán bằng xác định công dụng thuốc mới như một bài kiểm chứng chéo 10-fold trên bộ dữ liệu toán dự đoán quan hệ thuốc-bệnh. Về mặt chuẩn Fdataset [3] cho thấy phương pháp thuật toán, bài toán này tương tự với bài toán được đề xuất tốt hơn RLSDR (với giá trị dự đoán tương tác thuốc-đích. Do đó, lấy AUC trung bình là 0.832 đối với BLMDR và cảm hứng từ sự thành công của thuật toán 0.814 đối với RLSDR). 181
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 2. PHƯƠNG PHÁP NGHIÊN CỨU Việc dự đoán mối liên hệ của mỗi loại thuốc/bệnh với các bệnh/thuốc khác có thể 2.1. Bộ dữ liệu chuẩn được triển khai như một bài toán phân loại Trong báo cáo này, bộ dữ liệu được sử nhị phân bởi các mối liên hệ đã biết có thể dụng là Fdataset [3] có chứa 593 loại thuốc được biểu diễn như mẫu dương và các mối trong DrugBank, 313 bệnh trong cơ sở dữ liệu liên hệ còn lại (không có liên hệ hoặc mối OMIM và 1933 mối liên hệ đã biết giữa các liên hệ chưa được kiểm nghiệm) biểu diễn thuốc và bệnh này. Bộ dữ liệu Fdataset gồm như mẫu âm. Từ phía bệnh, mục tiêu của ta là có ba ma trận là: ma trận độ tương đồng của dự đoán xem một bệnh nhất định có quan hệ thuốc Sdr (m×m), ma trận độ tương đồng của với thuốc dri hay không dựa vào thông tin bệnh Sdi (n×n) và ma trận liên hệ Y  {0,1}m×n bệnh và các mối quan hệ đã biết giữa dri và biểu diễn mạng hai chiều gồm các mối liên hệ các bệnh. Tương tự, từ phía thuốc, mục tiêu đã biết giữa bệnh và thuốc. là dự đoán xem một thuốc nhất định có quan 2.2. Mô hình cục bộ hai chiều hệ với bệnh dij hay không dựa vào thông tin thuốc và các mối quan hệ đã biết giữa dij và Để tìm ra chỉ định thuốc mới, thay vì xây các bệnh. Trong báo cáo này, thông tin thuốc dụng một mô hình duy nhất dựa trên tất cả và bệnh đã được biểu diễn trong ma trận độ các mối liên hệ đã biết rồi sau đó sử dụng nó tương đồng thuốc Sdr và ma trận độ tương để dự đoán cho mọi thuốc/bệnh, chúng tôi đồng bệnh Sdi . Do đó, máy véc-tơ hỗ trợ xây dựng nhiều mô hình cục bộ sử dụng từng SVM, một mô hình phân loại dựa vào kernel phần thông tin đã biết về mối quan hệ thuốc - tiêu biểu, được lựa chọn làm bộ phân loại. Để bệnh. Nói cách khác, chúng tôi xây dựng các mô hình khác nhau cho từng thuốc/bệnh dựa có thể sử dụng các ma trận độ tương đồng trên phần thông tin đã biết của từng sẵn có làm đầu vào huấn luyện các mô hình thuốc/bệnh đó. Do đó, để dự đoán có hay SVM, chúng cần được biến đổi thành ma trận không có một cạnh nối eij giữa thuốc dri và kernel, cụ thể là Sdr và Sdi lần lượt chuyển bệnh dij xác định, BLMDR áp dụng cùng một thành kernel . Sau đó, đối với mỗi cặp thuốc thuật toán dự đoán hai lần cho cùng một cạnh và bệnh, hai mô hình dự đoán (một mô hình nhưng trên hai chiều ngược nhau, một dự cho bệnh và một cho thuốc) được xây dựng. đoán từ phía bệnh và một từ phía thuốc. Cụ Trong pha dự đoán, với một cặp thuốc thể hơn, chiến lược dự đoán của BLMDR đối bệnh dri -dij chưa xác định mối liên hệ, bệnh với một cạnh eij có thể được mô tả như sau: dij được dùng làm đầu vào của mô hình cho  Mô hình dự đoán cho bệnh được xây bệnh để rồi thu được điểm số yµ 1 . Tương tự, dựng dựa vào hiểu biết về mối quan hệ giữa thuốc dri được dùng làm đầu vào của mô thuốc dri và tất cả các bệnh (trừ bệnh dij ) hình cho thuốc để thu được điểm số . Điểm trong mạng quan hệ thuốc - bệnh. Mô hình số dự đoán cuối cùng của cặp thuốc-bệnh này này sau đó được sử dụng để dự đoán cạnh giữa bệnh dij và thuốc dri . được tích hợp thành $y  max  $y1 , $y 2  .  Mô hình dự đoán cho thuốc được xây dựng dựa vào hiểu biết về mối quan hệ giữa 3. KẾT QUẢ NGHIÊN CỨU bệnh dij và tất cả các thuốc (trừ thuốc dri ) Trong mục này, ta sẽ đánh giá hiệu suất của trong mạng quan hệ thuốc-bệnh. Mô hình này BLMDR trên bộ dữ liệu tiêu chuẩn đã trình sau đó được sử dụng để dự đoán cạnh giữa thuốc dri và bệnh dij . bày trước đây. Để việc đánh giá thuyết phục Sau hai dự đoán này, ta thu được hai điểm hơn, ta so sánh hiệu suất của phương pháp đề số độc lập cho cùng một cạnh. Bằng cách lấy xuất này với một phương pháp xác định công giá trị lớn nhất giữa hai điểm số này, ta có dụng mới của thuốc khác là RLSDR [4] trong được một điểm số dự đoán cuối cùng cho cùng điều kiện thử nghiệm. RLSDR dựa vào cạnh đó. phương pháp học bán giám sát bình phương 182
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2018. ISBN: 978-604-82-2548-3 tối thiểu chuẩn hóa để xếp hạng các bệnh ứng 4. KẾT LUẬN viên trong mạng không đồng nhất thuốc-bệnh Trong báo cáo này, chúng tôi đề xuất một để tìm ra công dụng mới của thuốc. Hiệu suất mô hình cục bộ hai chiều dùng trong xác định dự đoán của BLMDR và RLSDR được đánh công dụng thuốc mới (BLMDR). BLMDR sử giá bởi phương pháp kiểm chứng chéo 10- dụng các thông tin về quan hệ thuốc-bệnh đã fold. Tức là, các mối liên hệ đã biết và chưa biết, độ tương đồng thuốc và độ tương đồng biết trong ma trận liên hệ trong bộ dữ liệu bệnh xây dựng nên các mô hình cục bộ để dự Fdataset được chia ngẫu nhiên thành 10 phần đoán các quan hệ thuốc-bệnh mới. Kết quả so (fold). Trong mỗi lần thử nghiệm, một fold sánh hiệu quả dự đoán giữa phương pháp được lấy ra làm tập kiểm tra và 9 fold còn lại được đề xuất này với một phương pháp dựa làm tập huấn luyện. AUC (area under the trên mô hình toàn cục RLSDR chứng tỏ hiệu ROC curve) là thông số đánh giá độ nhạy và quả vượt trội của BLMDR. Trong báo cáo độ đặc hiệu của mô hình dự đoán được sử này, điểm số dự đoán cuối cùng cho từng cặp dụng để đánh giá hiệu quả dự đoán. Cụ thể, thuốc-bệnh được tích hợp bằng cách lựa chọn giá trị AUC càng gần 1 thì mô hình dự đoán giá trị lớn nhất trong hai điểm số độc lập. càng hiệu quả. Kết quả thử nghiệm cho thấy, Việc sử dụng các cách tích hợp khác có tính phương pháp BLMDR với giá trị AUC trung đến trọng số của thông tin thuốc và bệnh có bình 0.832 dự đoán tốt hơn RLSDR với giá trị thể cải thiện hiệu quả dự đoán. AUC trung bình 0.814. Các đường cong ROC đối với fold có hiệu quả dự đoán tốt nhất của 5. TÀI LIỆU THAM KHẢO cả hai phương pháp này được thể hiện trong Hình 2. Các kết quả này cho thấy rằng phương [1] Bleakley et.al. 2007. Supervised pháp được đề xuất dựa vào các mô hình cục reconstruction of biological networks with local models. Bioinformatics. p. i57-65. bộ cho mỗi thuốc/ bệnh vượt trội hơn phương [2] Bleakley, K., Y. Yamanishi. 2009. pháp dựa vào mô hình toàn cục trong việc dự Supervised prediction of drug-target đoán mối quan hệ thuốc - bệnh. interactions us ing bipartite local models. Bioinformatics. p. 2397-403. [3] Gottlieb et.al. 2011. PREDICT: a method for inferring novel drug indications with application to personalized medicine. Mol Syst Biol. p. 496. [4] Le, D.H., D. Nguyen-Ngoc. 2018. Drug Repositioning by Integrating Known Diseas e-Gene and Drug-Target Associations in a Semi-supervised Learning Model. Acta Biotheor. [5] Mordelet, F. và J.P. Vert. 2008. SIRENE: supervised inference of regulatory networks. Bioinformatics. p. i76-82. Hình 1. Đường cong ROC của BLMDR và RLSDR đối với Fdataset. Các đường cong ROC này được vẽ cho một fold xác định có giá trị AUC cao nhất trong 10 fold thử nghiệm 183
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
10=>1