intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Phân tích dữ liệu kinh tế và kinh doanh với tiếp cận học máy

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

8
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Phân tích dữ liệu kinh tế và kinh doanh với tiếp cận học máy giới thiệu cách tiếp cận học máy ứng dụng trong phân tích kinh tế và kinh doanh, tác giả muốn giới thiệu công cụ phân tích dữ liệu với cách tiếp cận hiện đại hiện nay, tiếp cận học máy đang được ứng dụng khá rộng rãi trong điều kiện phát triển công nghệ số.

Chủ đề:
Lưu

Nội dung Text: Phân tích dữ liệu kinh tế và kinh doanh với tiếp cận học máy

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 PHÂN TÍCH DỮ LIỆU KINH TẾ VÀ KINH DOANH VỚI TIẾP CẬN HỌC MÁY Bùi Thị Thu Hòa Trường Đại học Thủy lợi, email: thuhoa.ktcs@tlu.edu.vn 1. GIỚI THIỆU CHUNG tích truyền thống. Chính vì vậy, cách tiếp cận học máy sẽ giúp cho nhà phân tích có thể khai Với đặc điểm dữ liệu trong kinh tế và kinh thác các dạng dữ liệu phức tạp này với sự trợ doanh hiện nay rất đa dạng về số lượng, giúp của máy tính và các nền tảng hiện có chủng loại, tốc độ lớn... do đó đòi hỏi người (Einav và Levin, 2014; Varian, 2014; Bajari quản lý ngày càng phải xử lý, phân tích phức và cộng sự, 2015; Grimmer, 2015). tạp cũng như ra quyết định tức thì, tuy nhiên, Học máy được định nghĩa là quy trình máy với sự phát triển của công nghệ thông tin và sẽ tự động trích xuất các mẫu từ dữ liệu thành khoa học kỹ thuật đã giúp cho các nhà phân các tập để tập huấn và kiểm tra, trên cơ sở các tích kinh tế, kinh doanh, nhà quản lý có nhiều tập dữ liệu tập huấn sẽ xây dựng các mô hình công cụ hỗ trợ, giúp họ có khả năng phân tích để dự đoán thông qua các giải thuật và có sự tốt hơn, đặc biệt với tiếp cận của học máy kiểm tra với các tập dữ liệu kiểm tra để đánh (machine learning). Trong bài viết này, tác giá mức độ chính xác của mô hình. Trong giai giả giới thiệu cách tiếp cận học máy được sử đoạn tập huấn, nhà phân tích sẽ chọn dữ liệu dụng trong phân tích kinh tế, kinh doanh để đào tạo thích hợp, và hiển thị hệ thống với dữ hỗ trợ phân tích, ra quyết định. liệu. Khi hệ thống tiếp xúc với dữ liệu, nó sẽ 2. MỘT SỐ VẤN ĐỀ CƠ BẢN VỀ HỌC MÁY tự sửa đổi để hiệu chính sao cho chính xác hơn. Giai đoạn này là một phần quan trọng Để có được thông tin, các nhà phân tích của quá trình phát triển với hệ thống và nhà thường dựa trên tập dữ liệu khá nhỏ, hay được khoa học dữ liệu phải chọn tập dữ liệu phù gọi là mẫu, được thu thập ngẫu nhiên và đại hợp cho vấn đề đang giải quyết. Giai đoạn tập diện cho tổng thể nhằm nghiên cứu các mối huấn có thể có được lặp đi lặp lại nhiều lần, quan hệ với những giả thiết dựa trên các tùy thuộc vào kết quả của mô hình tập huấn và phương pháp thống kê truyền thống. Tuy khi đó nhà phân tích sẽ phải đánh giá mức độ nhiên, sự phát triển của công nghệ thông tin, chính xác và hiệu suất của hệ thống. với sự bùng nổ của mạng Internet như Internet Học máy bắt đầu với hướng dẫn của con vạn vật (IoT), kết hợp với sự phát triển cơ sở người và được giải quyết bằng các giải thuật hạ tầng công nghệ đã khiến cho khả năng truy thuật đã được thiết kế. Thông thường, có hai cập, thu thập, lưu trữ và xử lý dữ liệu khá lớn. tiếp cận cơ bản để thực hiện học máy là học có Hơn nữa với đặc điểm dữ liệu hiện nay được giám sát và không giám sát. Đối với học máy đặc trưng bởi khối lượng lớn, tốc độ truy cập, có giám sát thường áp dụng đối với những xử lý nhanh, dữ liệu đa dạng từ nhiều dạng thu dạng dữ liệu có gán nhãn cụ thể, nói cách khác, thập khác nhau như dạng số, hình ảnh, âm đầu ra của hệ thống hoặc các tập dữ liệu có thể thanh, ký tự… và độ xác thực của dữ liệu xác định cụ thể. Ngược lại, đối với học máy tương đối tốt. Đây chính là những đặc tính của không có giám sát thường áp dụng đối với hệ dữ liệu lớn, từ đó đòi hỏi cách tiếp cận trong thống phức tạp, với dạng dữ liệu phi cấu trúc, phân tích và xử lý số liệu khá phức tạp, và khó không biết gán nhãn cụ thể, khi đó máy sẽ học có thể thực hiện dựa trên cách tiếp cận phân cách xác định mẫu trong dữ liệu không được 378
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 gắn nhãn và tạo ra kết quả đầu ra. Đây là loại dữ liệu tập huấn sẽ xây dựng các mô hình phân thuật toán được sử dụng để rút ra bất kỳ suy tích và các kết quả được kiểm tra với các dữ luận có ý nghĩa nào từ các tập dữ liệu lớn. liệu kiểm tra nhằm đánh giá độ chính xác của Tiếp cận học máy đã được ứng dụng trong mô hình. Học máy được áp dụng trong phân nhiều lĩnh vực như kinh tế, y tế, du lịch, bảo tích hồi quy, phân nhóm khách hàng, dự báo… hiểm… tuy nhiên trong bài viết này tác giả Do hạn chế về khuôn khổ báo cáo, dưới đây tập trung chính những ứng dụng của tiếp cận tác giả trình bày kết quả một số ví dụ ứng học máy trong lĩnh vực kinh tế nhằm đáp ứng dụng tiếp cận học máy để phân nhóm khách các bài toán kinh tế, kinh doanh thực tế hiện hàng, dự báo… Ví dụ dưới đây mô tả vắn tắt nay các doanh nghiệp phải đối mặt. việc ứng dụng tiếp cận học máy để phân loại nhóm khách hàng của tổ chức tín dụng dựa 3. ỨNG DỤNG HỌC MÁY TRONG trên các đặc tính của khách hàng như độ tuổi, PHÂN TÍCH DỮ LIỆU KINH TẾ VÀ mức lương, các khoản vay… nhằm tìm hiểu KINH DOANH khả năng chi trả các khoản nợ cho tổ chức tín Học máy ngày càng được ứng dụng trong dụng dưới hai trạng thái (Có: 1 và Không: 0). phân tích kinh tế (März và các cộng sự, Trong trường hợp này biến mục tiêu dưới dạng 2016; Crane-Droesch,2017; Athey, 2019). Sự nhị phân là khả năng thanh toán các khoản nợ phát triển của thương mại điện tử hiện nay đã của khách hàng Có/Không. Học máy sẽ giúp thúc đẩy sự thay đổi trong mô hình quản lý, phân nhóm những đối tượng có khả năng kinh doanh và cụ thể như khả năng tiếp cận thanh toán dựa trên từng tiêu chí xem xét như với khách hàng, tìm hiểu thị trường, giao dịch thu nhập hay độ tuổi (Hình 1). Rõ ràng ví dụ thương mại ngày càng dễ dàng, đặc biệt thông này cho thấy là thu nhập càng cao thì khả năng qua Internet. Với lượng dữ liệu khổng lồ kết thanh toán các khoản tín dụng càng cao. Học hợp với sự hỗ trợ của học máy, các công ty máy cũng giúp cho nhà quản lý phân nhóm “chạy đua” nhau nhằm tạo ra những chiến từng đối tượng trên các tiêu chí nhất định, từ lược tiếp thị, truyền thông xã hội hiệu quả đó có thể theo dõi và quản lý từng nhóm khách nhằm mục đích cung cấp những trải nghiệm hàng với những chính sách phù hợp (Hình 2). cho khách hàng và hướng đến tìm kiếm các Học máy cũng giúp nhà phân tích dự báo khách hàng tiềm năng (Bajari và các cộng sự, (Hình 3) với độ chính xác của từng mô hình 2015). Hơn nữa, sự kết hợp giữa dữ liệu lớn được tập huấn (Hình 4). và học máy giúp các doanh nghiệp cũng hướng đến các giải pháp ứng dụng trí tuệ nhân tạo trong phân tích, tiếp thị, và dự báo kết quả kinh doanh một cách chính xác với độ tin cậy cao hơn so với phương pháp phân tích truyền thống. Những ứng dụng điển hình khi áp dụng tiếp cận học máy trong phân tích dữ liệu ví dụ trong lĩnh vực thương mại điện tử điển hình thường thấy như: - Tìm kiếm thông minh; - Phân loại sản phẩm và định giá; - Hướng đến khách hàng mục tiêu và phân khúc khách hàng; - Dự báo bán hàng và tiếp thị… Đối với cách phân tích dữ liệu theo tiếp cận học máy, từ dữ liệu nghiên cứu được tách ra thành hai phần dữ liệu để tập huấn (tranning Hình 1. Phân nhóm khách hàng về khả năng data) và dữ liệu để kiểm tra (testing data). Từ thanh toán dựa trên tiêu chí thu nhập 379
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 4. KẾT LUẬN Trong bài viết này, với mục đích giới thiệu cách tiếp cận học máy ứng dụng trong phân tích kinh tế và kinh doanh, tác giả muốn giới thiệu công cụ phân tích dữ liệu với cách tiếp cận hiện đại hiện nay, tiếp cận học máy đang được ứng dụng khá rộng rãi trong điều kiện phát triển công nghệ số. Cách tiếp cận học máy đã khắc phục được nhiều hạn chế của phân tích dữ liệu truyền thống đó là làm việc với dữ liệu lớn và loại bỏ được những hạn chế do ràng buộc vốn có khi thực hiện phân tích dữ liệu theo cách tiếp cận truyền thống nhằm mở rộng các kết quả phân tích cho người nghiên cứu, cũng như hỗ trợ thông tin cho nhà quản lý, kinh doanh và định hướng Hình 2. Phân nhóm đối tượng khác nhau ra quyết định có cơ sở trong điều kiện cơ sở (Nguồn: Tính toán của tác giả) dữ liệu ngày càng đa dạng cả về khối lượng và chủng loại như hiện nay. 5. TÀI LIỆU THAM KHẢO [1] Athey, S. (2019). The impact of machine learning on economics. In: Agrawal, A., Gans, J., and Goldfarb, A. (eds.), The Economics of Artificial Intelligence: An Agenda, University of Chicago Press (p. 507-547). [2] Bajari, P., Nekipelov, D., Ryan, S.P. and Yang, M. (2015). Machine learning methods for demand estimation. The American Economic Review 105: 481-485. Hình 3. Mô hình dự báo giá [3] Crane-Droesch, A. (2017). Technology diffusion, outcome variability, and social learning: evidence from a field experiment in Kenya . American Journal of Agricultural Economics 100: 955-974. [4] Einav, L. and Levin, J. (2014). Economics in the age of big data. Science 346: 1243089. [5] März, A., Klein, N., Kneib, T. and Musshoff, O. (2016). Analysing farmland rental rates using Bayesian geoadditive quantile regression. European Review of Agricultural Economics 43: 663-698. [6] Varian,H. R. (2014). Big Data: new tricks Hình 4. So sánh độ chính xác for econometrics. The Journal of Economic của phần kiểm tra và tập huấn Perspectives: A Journal of the American (Nguồn: Tính toán của tác giả) Economic Association 28: 3-2. 380
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2