intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Phân tích dữ liệu và ứng dụng phân tích dữ liệu cho doanh nghiệp

Chia sẻ: Liễu Yêu Yêu | Ngày: | Loại File: PDF | Số trang:8

23
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết "Phân tích dữ liệu và ứng dụng phân tích dữ liệu cho doanh nghiệp" tìm hiểu về ngành nghề phân tích dữ liệu, các số liệu cần phân tích, việc áp dụng phân tích dữ liệu trong kinh doanh cũng như tìm hiểu qua các công cụ phần mềm hỗ trợ cho các kỹ sư phân tích dữ liệu trong tương lai. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Phân tích dữ liệu và ứng dụng phân tích dữ liệu cho doanh nghiệp

  1. PHÂN TÍCH DỮ LIỆU VÀ ỨNG DỤNG PHÂN TÍCH DỮ LIỆU CHO DOANH NGHIỆP Nguyễn Quốc Thanh Khoa Công nghệ Thông tin. Trường Đại học Tài chính - Marketing Email: nqthanh@ufm.edu.vn Tóm tắt: Ngành nghề phân tích dữ liệu (Data Analytics) đang là một trong những nghề nóng nhất và phát triển nhanh trên toàn thế giới. Bài viết tìm hiểu về nghành nghề phân tích dữ liệu, các số liệu cần phân tích, việc áp dụng phân tích dữ liệu trong kinh doanh cũng như tìm hiểu qua các công cụ phần mềm hỗ trợ cho các kỹ sư phân tích dữ liệu trong tương lai. Từ khóa: data analytics, phân tích dữ liệu, công cụ phân tích dữ liệu 1. PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS) LÀ GÌ? Trước tiên, chúng ta cần làm rõ khái niệm về Data Analysis – phân tích dữ liệu là gì? Nói một cách ngắn gọn, phân tích dữ liệu là quá trình chọn lọc dữ liệu; rồi sau đó tìm kiếm, thu thập thông tin quan trọng và tổng hợp số liệu dựa trên số lượng lớn các thông tin hỗn độn. Bạn có thể hiểu theo cách đơn giản, đây là quá trình chuyển dữ liệu thô thành dữ liệu có thể dùng được và đưa đến kết luận. Quy trình phân tích dữ liệu giờ đây, được tự động hóa thành quy trình và thuật toán để chuyển từ số liệu thô thành dữ liệu dùng được. Kỹ thuật phân tích giúp chúng ta tổng hợp dữ liệu và đưa đến kết luận cuối cùng. Thông tin này có thể sử dụng để tối ưu hóa các quy trình và tăng hiệu quả tổng thể của doanh nghiệp trong việc quản lý toàn bộ hệ thống. Ví dụ: hình bên dưới là một mẫu báo cáo dữ liệu về bán hàng trên facebook, khi được công cụ A1 Analytics phân tích và cho ra kết quả là những số liệu trực quan được thể hiện bằng đồ thị 35
  2. Hình 1: Báo cáo dữ liệu trên facebook sử dụng công cụ A1 Analytics 2. KHẢ NĂNG ỨNG DỤNG CỦA PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS) Phân tích dự đoán Phân tích dự đoán là phân tích dữ liệu hiện tại để dự báo và tránh các tình huống có vấn đề trước. Các nhà sản xuất rất quan tâm đến việc giám sát hoạt động của công ty và hiệu suất cao của nó. Tìm cách tốt nhất có thể để xử lý các vấn đề có lỗi, khắc phục khó khăn hoặc ngăn chặn chúng xảy ra là những cơ hội tuyệt vời cho các nhà sản xuất sử dụng phân tích dự đoán. Việc thực hiện phân tích dự đoán cho phép xử lý tổn thất (sản xuất thừa, thời gian nhàn rỗi, hậu cần, hàng tồn kho, …). Do đó, hãy tập trung vào các giải pháp khả thi do phân tích dự đoán mang lại. Dự đoán lỗi và bảo trì phòng ngừa Cả hai mô hình dự đoán này đều nhằm mục đích dự báo thời điểm khi thiết bị không thực hiện được nhiệm vụ. Kết quả là, mục tiêu thứ cấp có thể đạt được – để ngăn chặn những thất bại này xảy ra hoặc ít nhất là để giảm số lượng của chúng. Điều này trở nên khả thi với nhiều kỹ thuật dự đoán. Bảo trì phòng ngừa thường được áp dụng cho các thiết bị vẫn đang hoạt động để giảm khả năng hỏng hóc của nó. Có hai loại bảo trì phòng ngừa chính: dựa trên thời gian và dựa trên việc sử dụng. Sức mạnh lớn nhất của bào trì phòng ngừa là lập kế hoạch. Có trong tay những dự đoán liên quan đến những rắc rối trong tương lai với thiết bị, nhà sản xuất có thể lên kế hoạch nghỉ ngơi hoặc ngừng hoạt động để sửa 36
  3. chữa. Việc nghỉ như vậy thường được thực hiện để tránh sự chậm trễ và thất bại đáng kể, thường được gây ra bởi các vấn đề quan trọng hơn có thể phát sinh. Dự báo nhu cầu và quản lý hàng tồn kho Dự báo nhu cầu (demand forecast) là một quá trình phức tạp liên quan đến phân tích dữ liệu và công việc lớn của kế toán viên và chuyên gia. Hơn nữa, nó dường như có mối quan hệ mạnh mẽ với quản lý hàng tồn kho. Một thực tế đơn giản có thể giải thích mối liên hệ này – dự báo nhu cầu sử dụng dữ liệu của chuỗi cung ứng. Có rất nhiều lợi ích của việc dự báo nhu cầu cho các nhà sản xuất. Trước hết, nó mang lại cơ hội kiểm soát hàng tồn kho tốt hơn và giảm nhu cầu lưu trữ một lượng đáng kể các sản phẩm vô dụng. Bên cạnh đó, phần mềm quản lý hàng tồn kho trực tuyến giúp thu thập dữ liệu có thể được sử dụng nhiều để phân tích thêm. Một yếu tố quan trọng hơn là đầu vào dữ liệu cho dự báo nhu cầu có thể được cập nhật liên tục. Do đó, dự báo có liên quan có thể được thực hiện. Lợi ích bổ sung nằm ở việc cải thiện mối quan hệ giữa nhà cung cấp và nhà sản xuất, vì cả hai đều có thể điều tiết hiệu quả cổ phiếu và quy trình cung ứng của họ. Dự báo nhu cầu và quản lý hàng tồn kho có tính đến nhiều yếu tố, trong đó có các yếu tố bên ngoài như nền kinh tế hoặc thị trường, nguồn nguyên liệu thôi, … Bằng cách này, chúng ta có thể có được cái nhìn phức tạp hơn về hiệu quả kinh doanh sản xuất của mình và lập kế hoạch thêm. Tối ưu hóa giá thành sản xuất Sản xuất và bán sản phẩm liên quan đến việc tính đến nhiều yếu tố và tiêu chí ảnh hưởng đến giá sản phẩm. Tất cả các yếu tố bắt đầu với giá ban đầu của nguyên liệu thô và đến chi phí phân phối đóng góp vào giá sản phẩm cuối cùng. Và điều gì xảy ra khi khách hàng thấy mức giá này quá cao hoặc quá thấp? Tối ưu hóa giá là quá trình tìm giá tốt nhất có thể cho cả nhà sản xuất và khách hàng, không quá cao và không quá thấp. Các giải pháp tối ưu hóa giá hiện đại có thể tăng lợi nhuận của bạn một cách hiệu quả. Các công cụ này tổng hợp và phân tích giá cả và dữ liệu chi phí cả từ các nguồn nội bộ và các đối thủ cạnh tranh của bạn và rút ra các biến thể giá tối ưu hóa. Trong điều kiện thị trường cạnh tranh cao và thay đổi nhu cầu của khách hàng, tối ưu hóa giá cả trở thành bắt buộc và phát triển thành một quá trình liên tục. Phân tích bảo hành Các nhà sản xuất OEM đang chi một khoản tiền đáng kể mỗi năm cho việc hỗ trợ yêu cầu bảo hành. Yêu cầu bảo hành tiết lộ thông tin có giá trị về chất lượng và độ tin cậy của 37
  4. sản phẩm. Chúng giúp tiết lộ những cảnh báo sớm hoặc khiếm khuyến của sản phẩm. Sử dụng dữ liệu này, nhà sản xuất có thể cải tiến các sản phẩm hiện có hoặc phát triển những sản phẩm mới, hiệu quả và tốt hơn. Các giải pháp phân tích bảo hành hiện đại giúp các nhà sản xuất xử lý khối lượng lớn dữ liệu liên quan đến bảo hành từ nhiều nguồn khác nhau và áp dụng kiến thức này để khám phá các vấn đề bảo hành đang gia tăng và lý do xảy ra. Robot hóa Robot đang thay đổi bộ mặt sản xuất. Ngày nay, đó là một nguyên nhân phổ biến để sử dụng robot thực hiện các nhiệm vụ thông thường và những thứ có thể gây khó khăn hoặc nguy hiểm cho con người. Các nhà sản xuất có xu hướng đầu tự ngày càng nhiều tiền vào việc robot hóa các doanh nghiệp của họ mỗi năm. Các mô hình robot được hỗ trợ bởi trí tuệ nhân tạo (Artificial Intelligent) giúp đáp ứng nhu cầu ngày càng tăng. Hơn nữa, robot công nghiệp phần lớn góp phần tăng chất lượng sản phẩm. Hàng năm, các mô hình nâng cấp robot đến khu vực sản xuất để cách mạng hóa dây chuyền sản xuất. Và hiện tại, robot sản xuất đang có giá cả phải chăng cho các doanh nghiệp hơn bao giờ hết. Phát triển sản phẩm Dữ liệu lớn đã mang lại cơ hội lớn cho các công ty sản xuất liên quan đến phát triển sản phẩm. Các nhà sản xuất sử dụng lợi thế của dữ liệu lớn để hiểu khách hàng hơn, đáp ứng nhu cầu của khách hàng và cả nhu cầu của họ. Do đó, dữ liệu có thể được sử dụng để phát triển các sản phẩm mới hoặc để cải thiện các sản phẩm hiện có. Sử dụng dữ liệu lớn để phát triển sản phẩm, các nhà sản xuất có thể thiết kế một sản phẩm với giá trị khách hàng tăng lên và giảm thiểu rủi ro liên quan đến việc giới thiệu sản phẩm mới ra thị trường. Những hiểu biết có thể hành động được tính đến trong khi lập mô hình và lập kế hoạch. Dữ liệu này có thể tăng cường quá trình ra quyết định. Ngoài ra, các công cụ quản lý dữ liệu được áp dụng rộng rãi để tối ưu hóa các khía cạnh hoạt động của chuỗi phân phối. Xử lý phản hồi của khách hàng và cung cấp dữ liệu này cho các nhà tiếp thị sản phẩm có thể đóng góp vào giai đoạn tạo ý tưởng. Do đó, một sản phẩm mới sẽ hữu ích hơn cho khách hàng và có lợi hơn cho các nhà sản xuất có thể được phát triển. Ứng dụng thị giác máy tính Các công nghệ hỗ trợ trí tuệ nhân tạo và các ứng dụng thị giác máy tính đã tìm thấy việc sử dụng chúng trong sản xuất ở giai đoạn kiểm soát chất lượng. Về mặt này, nhận dạng đối tượng và phát hiện, phân loại đối tượng được chứng minh là rất hiệu quả. Thông thường, 38
  5. giám sát kiểm soát chất lượng được thực hiện bởi mọi người. Tuy nhiên, hiện nay người ta thường dựa vào thị giác máy tính hơn là thị giác con người. Các hệ thống giám sát này thường bao gồm phần cứng và phần mềm máy tính, máy ảnh và ánh sáng để chụp ảnh. Sau đó, những hình ảnh này được so sánh với các tiêu chuẩn để xác định sự khác biệt. Trong số các lợi thế chính của các ứng dụng là: kiểm soát chất lượng cao được cải thiện, giảm chi phí lao động, khả năng xử lý tốc độ cao, khả năng hoạt động liên tục 24/7. Quản lý rủi ro chuỗi cung ứng Chuỗi cung ứng luôn luôn phức tạp và không thể đoán trước. Rủi ro luôn là một phần của qui trình sản xuất và phân phối sản phẩm. Sử dụng phân tích dữ liệu lớn để quản lý rủi ro chuỗi cung ứng có thể khá có lợi cho các nhà sản xuất. Với sự trợ giúp của phân tích dữ liệu, các công ty có thể dự đoán sự chậm trễ tiềm ẩn và tính toán xác suất của các vấn đề có lỗi. Các công ty sử dụng kết quả của phân tích dữ liệu để xác định các nhà cung cấp dự phòng và phát triển các kế hoạch dự phòng. Để theo kịp xu hướng thay đổi liên tục, việc áp dụng phân tích dữ liệu thời gian thực là rất cần thiết. Dự đoán và quản lý rủi ro có thể xảy ra là rất quan trọng cho hoạt động của một doanh nghiệp sản xuất thành công. Trở lại thị trường Marketing & Sale tại Việt Nam trong mấy năm qua, một mặt thổi phồng quá mức về Big Data, Machine Learning (trong khi ứng dụng trong thực tế rất hạn chế), một mặt bị chán nản bởi nạn mua bán thông tin (rồi spam sms, email, messenger tràn lan)….Tuy nhiên có nhiều doanh nghiệp đã ứng dụng Data Analytics rất thành công và tạo ra tăng trưởng vượt bậc. Ví dụ: The Coffee House hiểu rất rõ hành vi của tất cả khách hàng bằng cách thu thập dữ liệu giao dịch tại quán, app, đặt hàng online… từ đó đưa ra các chiến dịch marketing/sale cá nhân hoá cho từng nhóm khách, từng sản phẩm và từng thời điểm. Ví dụ sáng nay, Bình Thạnh âm u như sắp đổ mưa thì sẽ cần code gì cho thật “chill” và push tới nhóm nào trên app để ra được lượng đặt hàng tốt nhất. Việc đó dĩ nhiên không thể tự ngồi đoán.. 3. HIỂU PHÂN TÍCH DỮ LIỆU NHƯ THẾ NÀO? Đây là thuật ngữ rộng bao gồm nhiều loại phân tích khác nhau. Bất kỳ thông tin nào cũng cần kỹ thuật phân tích dữ liệu để có được cái nhìn sâu sắc và sử dụng để cải thiện kết quả kinh doanh. Ví dụ: Các xí nghiệp sản xuất thường phải dùng cách phân tích thủ công để kiểm tra các hoạt động của một dây chuyền sản xuất, lên lịch sản xuất, thống kê số lượng hàng, kiểm tra hết hàng, sản xuất hàng mới, thì giờ đây các dữ liệu sẽ được công cụ phân 39
  6. tích làm toàn bộ, từ việc thống kê đến lên kế hoạch tiếp theo. Tóm lại, quá trình phân tích luôn cần đến cho dù bạn đang làm lĩnh vực gì. Đặc điểm chung bạn phải tuân thủ theo các bước: Bước đầu tiên, xác định các yêu cầu dữ liệu hoặc cách để phân loại nhóm. Dữ liệu có thể được phân tách theo độ tuổi, nhân khẩu học, thu nhập hoặc giới tính. Giá trị dữ liệu có thể là số hoặc nhóm được phân chia. Bước thứ hai, là quá trình thu thập dữ liệu. Bạn có thể thực hiện bước này từ nhiều nguồn khác nhau như: mạng internet, picture, video, môi trường xung quanh, hoặc thông qua nhân sự. Sau khi dữ liệu được thu thập, bạn phải tổ chức để tổng hợp và phân tích. Thực hiện trên một bảng tính hoặc một dạng phần mềm khác có thể lấy dữ liệu thống kê. Bước cuối cùng, kiểm tra lại toàn bộ số liệu đã được phân tích. Điều này có nghĩa là nó được kiểm tra và đảm bảo không có sự trùng lặp hoặc lỗi không đầy đủ. Bước này giúp bạn sửa lại lỗi trước khi đi đến bước phân tích cuối cùng và ra quyết định. 4. CÁC LOẠI SỐ LIỆU CẦN PHÂN TÍCH Dữ liệu phân tích được chia thành bốn loại cơ bản sau: Descriptive analytics (phân tích mô tả): Đây là quá trình phân tích dựa trên khoảng thời gian nhất định. Dựa trên số lượt xem trang, Doanh số tháng này… Diagnostic analytics (phân tích chẩn đoán): Tập trung vào phân tích chuyên sâu, tại sao nó xảy ra. Điều này liên quan đến đầu vào dữ liệu và một vài giả thuyết. Thời tiết có ảnh hưởng đến doanh số bán bia không? Chiến dịch tiếp thị có ảnh hưởng đến doanh số không? Predictive analytics (phân tích dự báo): Dự đoán điều gì xảy ra trong tương lai. Điều đó có gây ảnh hưởng tới doanh số cuối cùng? Có bao nhiêu mô hình dự báo kết quả? Prescriptive analytics (phân tích chuẩn đoán): Giúp bạn đưa đến kết luận quá trình hoạt động có đang thực sự hiệu quả. Một số lĩnh vực đã áp dụng phân tích dữ liệu bao gồm ngành bán hàng, du lịch và khách sạn, bất động sản… nơi công việc chồng chéo mà không thể tổng hợp và xử lý nhanh chóng. Thu thập dữ liệu khách hàng và tìm ra vấn đề để từ đó tìm ra cách khắc phục và đưa đến kết luận cuối cùng. Các nhà bán lẻ thu thập và phân tích giúp họ xu hướng thị trường, giới thiệu sản phẩm và đề ra các chiến dịch mới tăng trưởng lợi nhuận. 40
  7. 5. CÔNG CỤ CHO CÁC NHÀ PHÂN TÍCH DỮ LIỆU Lập trình R Lập trình R là một công cụ rất mạnh cho học máy, thống kê và phân tích dữ liệu. Nó là một ngôn ngữ lập trình và bạn hoàn toàn có thể phân tích dữ liệu với R. Ngôn ngữ R là một platform-independent do đó chúng ta có thể sử dụng nó cho bất kỳ hệ điều hành nào. Việc cài đặt R cũng miễn phí vì thế chúng ta có thể sử dụng mà không cần phải mua bản quyền. Tableau Tableau là công cụ thực hiện các nghiệp vụ phân tích một cách nhanh chóng, đơn giản và trực quan dành cho tất cả mọi người. Đối với các phòng ban nghiệp vụ, để sử dụng dữ liệu để định hướng các hoạt động kinh doanh phải cần một môi trường có thể phân tích và xử lý dưới dạng đồ họa. Tuy nhiên nhiều trường hợp, để làm được điều đó thì cần phải có kỹ năng và kiến thức lập trình, nên có rất nhiều yêu cầu phân tích, report gửi đến phòng IT hoặc phòng ban chuyên môn. Các yêu cầu đó dù có được gửi sớm đi chăng nữa cũng không thể thực hiện phân tích được thực hiện ngay vì còn liên quan đến vấn đề nhân lực và thời gian, do vậy có thể dẫn đến sự chậm trễ của các hoạt động (quyết định) kinh doanh. Mặt khác, Nếu chỉ report bằng excel dựa trên các ký tự và con số thì sẽ rất khó để đưa ra cái nhìn trực quan. Hiện tại thì có rất nhiều tool phân tích dữ liệu được gọi là giải pháp BI (Business Intelligence). Trong đó Tableau là một công cụ BI được nhiều người trong và ngoài nước Nhật sử dụng. Python Python là một ngôn ngữ lập trình scripting phổ biến và hết sức thú vị. Nó không phải ngôn ngữ có tốc độ thực thi nhanh như Assembly, C, C ++ … Nó được chọn làm ngôn ngữ lập trình đầu tiên để dạy cho những người chưa biết lập trình hoặc thanh thiếu niên. Google, Microsoft, và nhiều tập đoàn, công ty tin học sử dụng để vận hành hệ thống dịch vụ của mình. Các nhà nghiên cứu khóa học, nhà phân tích dữ liệu lớn cũng thích sử dụng Python cho công việc của mình, vì nó được việc, không màu mè, học nhanh, dùng luôn. SAS Đây là một trong những bộ chương trình chuyên dụng phục vụ cho xử lý và phân tích số liệu thống kê rất thông dụng trên thế giới. SAS rất mạnh trong lĩnh vực quản lý dữ liệu, 41
  8. cho phép người sử dụng thao tác dữ liệu hầu như với mọi cách có thể. SAS cũng đưa vào thủ tục Proc sql cho phép thực hiện mọi câu hỏi Sql (Structured query language) trên file dữ liệu. Excel Excel nằm trong bộ công cụ văn phòng Microsoft Office gồm nhiều phần mềm hỗ trợ viết văn bản, thuyết trình, quản lý email hay bảng tính như Excel. Phần mềm này giúp tạo ra các bảng tính, cùng các tính năng, công cụ hỗ trợ người dùng tính toán dữ liệu nhanh, chính xác với số lượng hàng triệu ô tính. RapidMiner Rapidminer được biết đến là mã nguồn mở, áp dụng trên môi trường Machine learning và Data mining và sử dụng ngôn ngữ lập trình Java. Được sử dụng theo mô hình Client/Server với máy chủ là on-premise hoặc public cloud/ private cloud. Các nhà nghiên cứu thị trường, các công ty lớn thường dùng RapidMiner, vì nó tiện dụng, dễ dùng, không cần biết đến đầu ra Output mà có thể cho ra khuôn mẫu theo thẻ Label hoặc Target. 5. KẾT LUẬN Trong lĩnh vực sản xuất đang thực hiện những thay đổi đáng kể do sự phát triển của các công nghệ và sự xuất hiện của các giải pháp máy học và trí tuệ nhân tạo. Bài viết đã cung cấp một số ví dụ sinh động về trường hợp sử dụng khoa học dữ liệu cho sản xuất cùng với những lợi ích mà chúng mang lại cho các doanh nghiệp. Cùng với dự báo rủi ro, nhu cầu và yêu cầu của thị trường, phân tích dữ liệu có thể giúp theo kịp các tiêu chuẩn chất lượng cao và số liệu chất lượng. Hơn nữa, việc kết hợp các kỹ thuật dữ liệu thông minh vào sản xuất có thể giúp dự báo các tổn thất hoặc sự cố không mong muốn. Dữ liệu lớn có thể giúp đạt được nhiều mục tiêu kinh doanh được đặt ra bởi các nhà sản xuất đã mất rất ít thời gian và tiền bạc hơn bao giờ hết. TÀI LIỆU THAM KHẢO [1] Smart Factory Marketing, Một số ứng dụng của phân tích dữ liệu trong sản xuất và công nghiệp, smartfactoryvn.com, 2021. [2] Intel Tecnologies, Advanced Data Analytics: Making Your Business Smarter, intel.vn. [3] https://en.wikipedia.org/wiki/Analytics 42
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
5=>2