BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
---------------
LÊ VĂN PHÚ
ỨNG DỤNG BIG DATA PHÂN TÍCH LỖ HỔNG TÍN DỤNG
CHO VAY VÀ GIẢI PHÁP HẠN CHẾ: TRƯỜNG HỢP CỦA
NGÂN HÀNG TMCP SÀI GÒN (SCB)
LUẬN VĂN THẠC SĨ KINH TẾ
Thành Phố Hồ Chí Minh – Năm 2020
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
---------------
LÊ VĂN PHÚ
ỨNG DỤNG BIG DATA PHÂN TÍCH LỖ HỔNG TÍN DỤNG
CHO VAY VÀ GIẢI PHÁP HẠN CHẾ: TRƯỜNG HỢP CỦA
NGÂN HÀNG TMCP SÀI GÒN (SCB)
Chuyên ngành: Quản trị kinh doanh
( Hệ điều hành cao cấp )
Mã số: 8340101
LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. TỪ VĂN BÌNH
Thành Phố Hồ Chí Minh – Năm 2020
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu khoa học độc lập của riêng tôi. Các số
liệu sử dụng phân tích trong luận án có nguồn gốc rõ ràng, đã công bố theo đúng quy định.
Các kết quả nghiên cứu trong luận án do tôi tự tìm hiểu, phân tích một cách trung thực,
khách quan và phù hợp với thực tiễn của Việt Nam. Các kết quả này chưa từng được công
bố trong bất kỳ nghiên cứu nào khác.
Người thực hiện đề tài
MỤC LỤC
TRANG PHỤ BÌA
LỜI CAM ĐOAN
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG BIỂU
DANH MỤC CÁC BIỂU ĐỒ
TÓM TẮT
ABSTRACT
MỞ ĐẦU ............................................................................................................................ 1
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU .................... 1
1.1. Lý do chọn đề tài .......................................................................................................... 1
1.2. Mục tiêu nghiên cứu ..................................................................................................... 2
1.3. Phương pháp nghiên cứu .............................................................................................. 3
1.3.1. Đối với số liệu phục vụ nghiên cứu .......................................................................... 3
1.3.2. Các khái niệm tiếp cận trong nghiên cứu .................................................................. 6
1.3.3. Phạm vi nghiên cứu của luận văn ............................................................................. 7
1.3.4. Kết cấu của luận văn ................................................................................................. 7
CHƯƠNG 2: CƠ SỞ LÝ LUẬN ...................................................................................... 8
2.1. Big Data ....................................................................................................................... 8
2.2. Các ứng dụng của big data trong lĩnh vực ngân hàng ................................................ 14
2.3. Khai phá dữ liệu (Data Mining) ................................................................................. 19
2.4. Hành vi tiêu dùng ....................................................................................................... 20
2.4.1. Định nghĩa ............................................................................................................... 20
2.4.2. Hành vi tiêu dùng dựa trên phương pháp RFM ...................................................... 23
2.5. Mô hình đề xuất cho nghiên cứu ................................................................................ 24
CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ PHÂN TÍCH DỮ LIỆU ................................................................................................................................. 28
A. BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SCB ............................................... 28
3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng .................................. 28
3.1.1. Big data ................................................................................................................... 28
3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng .................................................. 29
3.2. Ứng dụng big data tại Ngân hàng TMCP Sài Gòn (SCB) ......................................... 36
3.2.1. Giới thiệu về SCB ................................................................................................... 36
B. PHÂN TÍCH DỮ LIỆU BIG DATA ......................................................................... 37
4.1. Số liệu phục vụ nghiên cứu ........................................................................................ 37
4.2. Thông tin giao dịch khách hàng ................................................................................. 37
4.2.1. Đối với khách hàng tham gia dịch vụ vay ............................................................... 37
4.2.2. Thông tin khách hàng sử dụng thẻ .......................................................................... 41
4.2.3. Phân tích mô hình gian lận Fraud trong kinh doanh ............................................... 44
4.2.4. Thông tin giao dịch phân theo gian lận ................................................................... 52
CHƯƠNG 4: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC ...................................... 54
A. KẾT LUẬN ................................................................................................................ 54
B. CÁC GIẢI PHÁP HẠN CHẾ LỖ HỔNG VÀ GIAN LẬN TRONG KINH DOANH ............................................................................................................................ 56
C. PHÁT TRIỂN CÁC DỊCH VỤ CHO VAY ............................................................... 58
TÀI LIỆU THAM KHẢO
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Từ viết tắt Nguyên nghĩa
SCB Ngân hàng Thương Mại Cổ Phần Sài Gòn
RFM Recency, Frequency, Monatery
DANH MỤC CÁC BẢNG BIỂU
Table 1.1: Information of variables concerned ................................................................... 4
Bảng 2.1. Các bước trong quá trình khai phá dữ liệu ....................................................... 19
Bảng 2.4. Bảng mô tả điểm theo RFM ............................................................................. 24
Bảng 4.1: Loại thẻ sử dụng của khách hàng theo nghề nghiệp ......................................... 43
Bảng 4.2: Thông tin các trường trong mô hình ................................................................. 45
Bảng 4.3: Thông tin các trường trong mô hình theo hành vi giao dịch ............................ 48
Bảng 4.4: Kết quả gian lận xét từ 2 mô hình gian lận ....................................................... 51
DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 2.5: Tiến trình tiếp cận phục vụ mô hình fraud ................................................... 25
Biểu đồ 4.1: Thông tin giới tính khách hàng .................................................................... 38
Biểu đồ 4.2: Thông tin trình độ học vấn ........................................................................... 38
Biểu đồ 4.3: Nghề nghiệp của khách hàng ........................................................................ 39
Biểu đồ 4.4: Loại khách hàng sử dụng dịch vụ tại ngân hàng .......................................... 40
Biểu đồ 4.5: Thời gian tham gia dịch vụ của .................................................................... 40
Biểu đồ 4.6: Thời gian tham gia dịch vụ theo loại khách hàng ........................................ 41
Biểu đồ 4.7: Các loại thẻ được sử dụng bởi khách hàng................................................... 42
Biểu đồ 4.8: Thu nhập bình quân của khách hàng theo loại thẻ sử dụng ......................... 43
Biểu đồ 4.9: Kết quả từ thuật toán C5.0 ............................................................................ 46
Biểu đồ 4.10: Đánh giá mô hình dựa trên nhóm Training/Đào tạo và Testing/Kiểm định .................................................................................................................................... 46
Biểu đồ 4.11: Kết quả gian lận xét trên hồ sơ gốc ban đầu............................................... 47
Biểu đồ 4.12: Kết quả từ thuật toán C5.0 của bước 2 ....................................................... 49
Biểu đồ 4.13: Kết quả gian lận xét trên hồ sơ gốc ban đầu............................................... 50
Biểu đồ 4.14: Kết quả Gian lận được xác định từ kết hợp hai mô hình............................ 52
Biểu đồ 4.14: Hạn mức sử dụng theo nhóm khách hàng .................................................. 52
Biểu đồ 4.15: Nhóm khách hàng xếp loại theo ................................................................ 53
TÓM TẮT
Thông qua nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong
hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ được
thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng đang tham gia
giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có thời gian tham giao
dịch vụ từ trên 12 tháng trở lên. Điều đó cho kết quả dự báo sẽ chính xác hơn.
Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách
hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía. Do
vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên và cấp thẩm
quyền phê duyệt sản phẩm đó. Các lỗ hổng trong phân tích có thể bao gồm những nội dung
tóm tắt trong các điểm chính như sau:
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng,
nhưng nhân viên tiếp nhận & cấp thẩm quyền cao nhất, không phát hiện hồ sơ rủi ro.
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho Ngân
hàng, kế hợp với nhân viên tiếp nhận thông đồng, cấp thẩm quyền cao nhất không phát
hiện hồ sơ rủi ro.
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, kế
hợp với lảnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông đồng, phát hiện
ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách hàng & lãnh đạo cấp thẩm quyền
phê duyệt sản phẩm đó. …vv
Nghiên cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào
số liệu thực tế của một ngân hàng thương mại. Kết quả nghiên cứu có một đóng góp cực
kỳ quan trọng cho việc xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía
nhân viên của công ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.
ABSTRACT
The use of Big data in analyzing and identifying credit frauds is a novelty of this study,
through the application of C5.0 algorithm on 2.572 customers who were transacting with
the Sai Gon Joint Stock Commercial Bank (“SCB”). The customers selected for the study
had transaction histories of more than 12 months, which allows for more accurate
forecasts.
However, we also acknowledge that the criteria to evaluate a customer’s credit
applications are developed by the bank through a process that incorporates inputs from
multiple parties. Therefore, in the event a credit application is misevaluated, it is partially
the responsibilities of the staff and approving authority. In summary, the gaps in credit
evaluation may include the following:
- The customer commits fraud in the credit application submitted to the bank, but the
receiving staff and the highest authority do not detect the credit risk.
- The customer commits fraud in the credit application submitted to the bank, with the
collusion of the receiving staff, but the highest authority does not detect the credit risk.
- The customer commits fraud in the credit application submitted to the bank, but the
highest authority assesses a low credit risk and connives at the red flags, approving the
application.
This study is a practical succession, based on which the Fraud model is applied to the
actual data of a commercial bank. The results of which make a tremendously important
contribution to the development of solutions to mitigate the fraud risks attributed to the
bank’s employees and its customers. Suggested solutions are outlined in the next section.
1
MỞ ĐẦU
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU
1.1. Lý do chọn đề tài
Nhu cầu ngày càng cao của khách hàng là bài toán thách thức cần lời giải đáp của
doanh nghiệp nói chung và ngành ngân hàng nói riêng. Điều này đòi hỏi ngân hàng
hay doanh nghiệp phải thay đổi chiến lược phát triển theo hướng đa dạng hóa tiện ích
của các dòng sản phẩm, dịch vụ và chú trọng công tác chăm sóc khách hàng. Thực
tiễn chỉ ra rằng nguồn dữ liệu hiện hữu của một tổ chức kinh doanh là một tài nguyên
quan trọng, việc phân tích nguồn tài nguyên này phần nào giúp việc đơn giản hóa quá
trình giám sát và tìm hiểu nhu cầu khách hàng một cách hiệu quả. Với nguồn dữ liệu
lớn sẵn có, cụ thể là nguồn số liệu từ big data (tạm dịch là dữ liệu lớn), các ngân hàng
có thể tự khai thác thông tin để tiếp tục theo dõi hành vi tiêu dùng của khách hàng
trong tương lai, từ đó đưa ra chiến lược, chính sách phù hợp. Quá trình theo dõi đánh
giá hồ sơ khách hàng dựa vào thông tin hiện có hoặc đặc điểm khách hàng sẽ giúp
ngân hàng giảm thiểu được rủi ro đến mức nhỏ nhất. Điều này góp phần trong khai
thác hiệu quả đối tượng khách hang, đảm bảo vị thế cạnh tranh trên thị trường.
Gần đây ngân hàng SCB không ngừng nỗ lực trong việc đẩy mạnh phát triển công
nghệ số, nâng cao chất lượng dịch vụ, đa dạng hóa sản phẩm với tính bảo mật cao,
cung cấp các giải pháp tài chính hiệu quả, chuyên nghiệp hóa công tác chăm sóc
khách hàng. Bên cạnh những cơ hội phát triển, ngân hàng cũng phải đối mặt với nhiều
bài toán thách thức của thị trường. Mức độ cạnh tranh ngày càng gay gắt giữa các
ngân hàng là một trong những thách thức đầu tiên và đầy khó khăn mà không SCB
phải tìm cách giải quyết. Đặc biệt, sự liên kết và sát nhập giữa Ngân hàng ngoại với
Ngân hàng nội đã và đang gây thêm nhiều khó khăn hơn trong việc cạnh tranh, bởi
sự liên kết này sẽ chiếm ưu thế hơn với sản phẩm dịch vụ có chất lượng cao, kinh
nghiệm chuyên nghiệp, năng lực quản trị tốt và mạng lưới toàn cầu cùng sự am hiểu
đặc thù kinh tế tại địa phương. Hai là, nhu cầu của khách hàng ngày một tăng cao,
đòi hỏi Ngân hàng phải đáp ứng thường xuyên việc tối ưu hóa các sản phẩm dịch vụ,
2
nâng cao chất lượng dịch vụ, quy trình, thủ tục đơn giải, nhanh chóng và hướng về
mục tiêu chất lượng trong kinh doanh.
Trong những năm gần đây, SCB đã chi ra một khoảng không nhỏ đầu tư hệ thống lưu
trữ dữ liệu. Đến thời điểm hiện tại, nguồn dữ liệu lưu trữ trong các data warehouse
đã trở thành một nguồn big data. Tuy nhiên việc khai phá dữ liệu từ nguồn big data
đang là bài toán không dễ cho các bộ phận có liên quan. Điều này sẽ dễ dẫn đến tài
nguyên về dữ liệu được đầu tư không phục vụ lợi ích lớn. Thực tế, một khi nguồn dữ
liệu big data được khai thác tốt, là một lợi thế trong nâng cao chất lượng cạnh tranh,
giảm chi phí đáng kể trong phân tích hành vi khách hàng.
Để ngân hàng hiểu hơn về hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách
hàng, việc phân tích hành vi khách hàng từ nguồn dữ liệu big data là cực kỳ quan
trọng. Điều này không những góp phần vào việc xác định lại phân khúc thị trường để
ngân hàng có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ
hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn
chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới. Đây là
lý do nghiên cứu của đề tài sẽ hướng đến chủ đề “Ứng dụng big data phân tích lỗ
hổng tín dụng cho vay và giải pháp hạn chế: trường hợp của ngân hàng TMCP Sài
Gòn”. Đề tài này có một tiếp cận mới trên nguồn dữ liệu big data giúp việc phân tích
lỗ hổng trong xét duyệt hồ sơ đánh giá cho vay khách hàng, còn giúp công ty định vị
lại những giải pháp gắn với hành vi đang kỳ vọng của khách hàng hạn chế những rủi
ro trong tín dụng.
1.2. Mục tiêu nghiên cứu
- Đánh giá đặc điểm tiếp cận vốn vay của khách hàng
- Phân tích những lỗ hổng trong việc thực hiện xét duyệt hồ sơ cho vay
- Phân tích hành vi tham gia giao dịch hướng đến xây dựng những giải pháp phù
hợp giúp chăm sóc khách hàng hiệu quả, hạn chế rủi ro trong tín dụng.
3
1.3. Phương pháp nghiên cứu
1.3.1. Đối với số liệu phục vụ nghiên cứu
Nguồn dữ liệu phục vụ nghiên cứu luận văn được trích xuất từ nguồn Big Data của
ngân hàng. Nguồn này được chứa trong các hệ thống lưu trữ của SCB. Việc xuất dữ
liệu được thực hiện từ bộ phân IT, của CRM (hệ thống thu thập và quản lý thông tin
khách hàng), của kho dữ liệu (data warehouse) và portal...Nguồn thông tin này đã ghi
lại những lịch sử giao dịch của khách hàng trong thời gian qua. Mặc dù số liệu không
thuộc dạng khảo sát, tuy nhiên việc sử dụng nguồn dữ liệu Big Data này được xem
như là một xu hướng mới trong việc nghiên cứu các vấn đề kinh tế trong kỷ nguyên
công nghệ thông tin phát triển. Nguồn tài nguyên từ Big Data phản ánh một cách
trung thực nhất về hành vi và lịch sử tiêu dùng của khách hàng theo thời gian. Qua
đó, kết quả của quá trình nghiên cứu sẽ mang độ tin cậy cao hơn. Tuy nhiên, nguồn
tài nguyên này được cung cấp từ phía Ngân hàng nên cần có tính bảo mật cao, vì thế
nghiên cứu này tác giả đề xuất phần dữ liệu sẽ không được công bố rộng rãi.
Số liệu được trích xuất có nhiều nguồn khác nhau, bộ phận chăm sóc khách hàng, bộ
phận cho vay, khách hàng thẻ, khách hàng tiền gửi. Tuy nhiên trong nghiên cứu, số
liệu cho vay sẽ được tập trung. Để hạn chế những thông tin nhiễu, các khách hàng
được chọn đưa vào nghiên cứu có thời gian tham gia dịch vụ trên 12 tháng. Thời gian
nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/1/2019 đến
ngày 31/12/2019. Thời gian đưa vào nghiên cứu mỗi mã khách hàng có nhiều dòng
thông tin, nói cách khác mỗi một dòng là một giao dịch của khách hàng. Việc xác
định số lần giao dịch của mỗi khách hàng dựa vào mã khách hàng thống kê từ hệ
thống báo cáo. Các đối tượng khách hàng trong nghiên cứu là khách hàng có tham
gia giao dịch trong thời gian nghiên cứu trên, công cụ được sử dụng hỗ trợ phục vụ
phân tích là SPSS Modeler 18.
Kết quả thống kê nhanh vể số liệu phục vụ cho luận văn này có số dòng 128.290
dòng, tương đương với 3.572 khách hàng. Số lượng 25 biến/field được trích ra từ dữ
4
liệu big data được đưa vào nghiên cứu. Thông tin các biến và giá trị thang đo có thể
được thấy ở bảng 1.1.
Table 1.1: Information of variables concerned
Định nghĩa Thang đo Tên các biến/ trường
1. CIF ID Khách hàng
2. Branch ID của chi nhánh
3. No.document ID của tài liệu KH
4. Type of customer Loại khách hàng vay Biến định danh
+ Khách hàng tín dụng thẻ
+ Khách hàng cá nhân
+ Khách hàng kinh doannh gia đình
5. Access date Ngày đăng ký dịch vụ của khách hàng Ngày
6. Approved date Ngày hồ sơ vay được duyệt Ngày
7. Document score Điểm hồ sơ vay do nhân viên đánh giá Biến liên tục
8. Gender Giới tính khách hàng Biến định danh
9. Age Tuổi của khách hàng Giá trị liên tục
10. Education Trình độ học vấn của khách hàng Biến định danh
11. Community Hành vi quan hệ cộng đồng Biến định danh
+ Có danh tiếng/Prestige
+ Tốt/good engough
+ Không biết/unknown
12. Marital status Biến định danh
Tình trạng gia đình: Độc thân/ Single và kết hôn/ married
13. Job position Vị trí công việc Biến định danh
+ Công nhân/worker
+ Nhân viên văn phòng/Office staff
+Quản lý/Manager
+Giám đốc/Director
14. Houseownership Tình trạng sở hữu nhà Biến định danh
+ Nhà riêng/Owned house
5
+ Nhà thuê/Rented house
+ Ở với cha mẹ/Stayed with parents’ house
15. Usage Thông tin sử dụng dịch vụ của NH Biến định danh
+Chỉ sử dụng dịch vụ từ SCB/ only loan services from SCB bank
+Sử dụng dịch vụ vay từ SCB > ngân hàng khác/loan services from SCB bank > another bank
+Sử dụng dịch vụ vay từ SCB = NH khác/loan services from SCB bank = another bank
+Sử dụng dịch vụ vay từ SCB< NH khác/loan services from SCB < another bank
+ Không sử dụng dịch vụ vay từ SCB/No loan services from SCB
16. Type of product Hình thức cho vay Biến định danh
17. Type of card Biến định danh Loại thẻ sử dụng: Thẻ chính và thẻ phụ/Type of card: Main and non-main
18. Level of card Giá trị của mức thẻ/Value of card level Liên tục
19. Balance account account measured in Liên tục Balance Vietnamese currency (VND)
20. Fee Biến định danh Phí hàng năm (Có/Không)/Annual fee (Yes/No)
21. Card_date Date Ngày cấp thẻ/Date to issue the bank card
22. No.Card Series number Số tài khoản thẻ/Account number of card
23. Ncard_Date thẻ mới/Date to Date Ngày công nhận approve the new card
24. Workingyear Liên tục
tác/làm việc của Số năm công kH/Number of years of customers working
25. NetIncome Liên tục Thu nhập ròng bình quân theo tháng (đồng/tháng)
6
Nguồn: Tổng hợp từ big data
1.3.2. Các khái niệm tiếp cận trong nghiên cứu
Mô hình Fraud còn được dịch là mô hình gian lận, có chức năng hỗ giúp tìm ra những
gian lận hoặc lỗ hổng trong hoạt động kinh doanh, trong đó lĩnh vực cho vay không
là ngoại lệ. Điển hình trong lĩnh vực thế chấp, mô hình gian lận đã giúp việc phát hiện
những nhân viên sử dụng chuyên môn hoặc thẩm quyền của mình để tạo ra một gian
lận cá nhân.
Thuật toán khám phá những lỗ hổng trong kinh doanh có nhiều phương pháp, trong
đó có thể kể đến mô nhánh/cây quyết định, điển hình thuật toán C5.0. Đây là mô hình
kế thừa thuật toán cây quyết định dựa trên nền tảng kết quả nghiên cứu của (Hunt &
Krivanek, 1966). Đặc điểm chính của C5.0 hướng đến khái phá dữ liệu theo phân lớp
dữ liệu dựa trên cây quyết định hiệu quả và phổ biến. Phương pháp này giúp xây dựng
một kế hoạch nhằm đạt được mục tiêu mong muốn và giúp dự báo hành vi của khách
hàng, trong dự báo về hành vi gian lận.
Phân tích lòng trung thành của khách hàng đối với dịch vụ. (Doğan, Ayçin, & Bulut,
2018) sử dụng khái niệm của RFM để xác định mức độ lòng trung thành của khách
hàng dựa vào 3 chỉ số: R, F, M. Trong đó, R là Recency, tức là thời gian mua hàng
gần nhất tính đến thời điểm nghiên cứu. F là Frequency là tần suất giao dịch của
khách hàng trong thời gian mà nghiên cứu đang thực hiện của 12 tháng, tần suất giao
dịch hoặc mua hàng sẽ được tính toán. M là Monetary tức đo lường tổng giá trị mà
khách hàng thực hiện giao dịch trong khoảng thời gian nghiên cứu. Tượng tự,
(Khajvand & Tarokh, 2011) đã sử dụng mô hình RFM như nêu trên để hướng đến
phân phúc thị trường trong lĩnh vực ngân hàng bán lẻ và đo lường nhóm khách hàng
có đóng góp lớn nhất.
Xuất phát từ các nhận định trên, nghiên cứu của luận văn này, phương pháp tiếp cận
trong phân tích sẽ áp dụng vào mô hình của (Khajvand & Tarokh, 2011) để tính RFM,
từ cơ sở đó, các bước hướng đến phân khúc thị trường sẽ được thực hiện để xác định
các nhóm khách hàng khách biệt về sự đóng góp cho ngân hàng từ thấp đến cao.
7
1.3.3. Phạm vi nghiên cứu của luận văn
Dữ liệu được trích xuất chọn ra khách hàng thuộc khu vực Thành phố Hồ Chí Minh.
Mô hình nghiên cứu dựa trên kiến thức chuyên gia của cá nhân, đang là lãnh đạo của
phòng giao dịch tại một quận của thành phố. Đề tài không sử dụng phương pháp định
tính, tuy nhiên trong quá trình nghiên cứu, có sự ủng hộ của các phòng ban và của
lãnh đạo cao hơn. Kết quả nghiên cứu này sẽ là một khởi đầu để xem xét mức độ hiệu
quả trong nghiên cứu giúp cho việc nghiên cứu mở rộng trong thời gian tới.
Việc nghiên cứu sự gian lận trong kinh doanh hàm ý sẽ tập trung vào gian lận có thể
xuất phát từ nhân viên trong xét duyệt hồ sơ, hoặc do khách hàng chủ động khai báo
hồ sơ không chính xác để đạt được mục tiêu trong giao dịch. Cơ sở khám phá gian
lận trong kinh doanh sẽ là cơ sở để xây dựng giải pháp khắc phục gian lận từ phía
nhân viên và từ phía khách hàng.
1.3.4. Kết cấu của luận văn
Luận văn được chia làm 4 chương, với các nội dung sau:
Chương 1: Giới thiệu tổng quan về đề tài nghiên cứu
Chương 2: Cơ sở lý luận
Chương 3: Ứng dụng của Big data tại SCB và kết quả phân tích
Chương 4: Kết luận và giải pháp
8
CHƯƠNG 2: CƠ SỞ LÝ LUẬN
2.1. Big Data
Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc.
Các hoạt động được tạo lập trong hệ thống đều được big data ghi lại. Đối với hoạt
động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong
suốt thời gian giao dịch. Một khi dữ liệu được lưu trữ, bản ghi ngày càng phong phú,
đa dạng hơn theo thời gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử
dụng trong việc truy vấn thông tin để phát triển chiến lược kinh doanh, hay tạo lập
môi trường quản lý chuyên nghiệp.
Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân
hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh
trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng
đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản lý doanh
nghiệp.
Big Data đóng vai trò quan trọng trong việc truy xuất dữ liệu và hỗ trợ con người đưa
ra quyết định tốt hơn với cơ hội thành công cao hơn nhiều.
Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data
Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động
vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết
các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin,
dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh,
bộ phận của tổ chức. Tuy nhiên, khi các ngân hàng ngày càng mở rộng dịch vụ, các
tiện ích, hay áp dụng công nghệ trong việc phát triển phân khúc thị trường, thu hút
thêm khách hàng thì song song họ cũng phải xây dựng một hệ thống hạ tầng để thu
thập dữ liệu và tiến hành phân tích và xác định giải pháp cải thiện hiệu quả kinh
doanh. Theo một số chuyên gia dự đoán số lượng dữ liệu tăng lên gấp bảy lần trước
9
năm 2020 (so với năm 2016). Big data là bước tiến lớn đối với sự phát triển của ngành
ngân hàng.
Ngày nay, hầu hết các tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm (Banking,
Financial services and Insurance (BFSI)) đang nỗ lực để áp dụng một cách tiếp cận
mới theo hướng khai thác dữ liệu để phát triển và đổi mới các dịch vụ mà họ cung
cấp cho khách hàng. Giống như hầu hết các ngành công nghiệp khác, phân tích dữ
liệu lớn (Big data analytics) sẽ là một sự thay đổi lớn quan trọng trong cuộc chiến
giữa các tổ chức cùng ngành.
Mặc dù nhiều tổ chức BFSI đang thay đổi cách thức khai thác dữ liệu bằng cách thu
thập một khối lượng dữ liệu khổng lồ và tiến hành phân tích, nhưng đó chỉ là những
bước tổng quát, những bước riêng lẻ ở từng giai đoạn trong quy trình khai thác Big
data. Trong tất cả trường hợp, các dự án Big data được hình thành đều hướng đến
mục tiêu ban đầu là trả lời cho câu hỏi: “Những dữ liệu này có thể giúp chúng ta giải
quyết các vấn đề kinh doanh như thế nào?”
Khi khối lượng khách hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả năng
cung cấp dịch vụ của từng tổ chức. Thực tiễn cho thấy việc phân tích dữ liệu hiện tại
đã đơn giản hóa quá trình theo dõi và đánh giá khách hàng tín dụng của các ngân
hàng và các tổ chức tài chính, dựa trên khối lượng lớn dữ liệu như thông tin, hồ sơ cá
nhân và các thông tin bảo mật khác. Nhưng với sự giúp đỡ của Big data, các ngân
hàng có thể khai thác để liên tục theo dõi hành vi của khách hàng trong thời gian thực,
xác định được các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc đưa ra giải
pháp. Quá trình đánh giá hồ sơ khách hàng trong thời gian thực sẽ dần thúc đẩy hiệu
suất hoạt động và lợi nhuận, từ đó đẩy mạnh phát triển tổ chức hơn nữa.
Theo Forbes, 87% các công ty cho rằng Big data sẽ tạo ra những thay đổi lớn cho các
ngành công nghiệp của họ đến cuối thập kỷ thứ 2 của thế kỷ 21. Thậm chí nhiều công
ty còn nghĩ rằng nếu không có một chiến lược Big data cụ thể và hiệu quả sẽ khiến
họ tụt lại phía sau trong thời đại công nghệ 4.0 ngày nay.
10
Có rất nhiều nguồn dữ liệu Big data trong hầu hết ở các ngành và lĩnh vực khác nhau,
không riêng ở lĩnh vực tài chính, thương mại, bán lẻ, bảo hiểm, mà nó còn rất được
quan tâm ở lĩnh vực ngân hàng. Mọi tương tác, mọi giao dịch của khách hàng tại ngân
hàng đều tạo ra các bản ghi điện tử, các bản sao lưu được lưu lại theo quy định pháp
luật, và các giao dịch tại các trụ ATM ở các địa điểm khác nhau cũng được lưu thông
tin tại ngân hàng. Nhờ phân tích Big data, các công ty dịch vụ tài chính không còn
lưu trữ dữ liệu theo yêu cầu bắt buộc như ngày xưa nhưng giờ đây họ đang tích cực,
chủ động hơn trong việc khai thác để có được những kết quả mà dựa vào đó đưa ra
được các giải pháp cải thiện hoạt động, gia tăng lợi nhuận của tổ chức.
Ngoài ra, các công ty cũng không chờ đợi một khoảng thời gian dài mới có thể phân
tích các dữ liệu lịch sử, dữ liệu quá khứ. Hầu hết các phân tích Big data được thực
hiện chủ yếu xảy ra trong thời gian thực nhằm thúc đẩy việc đưa ra các quyết định
chiến lược một cách nhanh chóng.
Tóm lại, Big data chính là nguồn lực quan trọng, mang tính chất nòng cốt tạo ra lợi
thế cạnh tranh ở bất kỳ một tổ chức tài chính nào đặc biệt khi việc nắm bắt nhu cầu
của người tiêu dùng ngày càng phức tạp mặc dù đã thuận tiện hơn, dễ dàng hơn nhờ
sự phát triển vượt bậc của công nghệ, kỹ thuật. Big data không chỉ đem lại các cái
nhìn mới, sự sáng tạo trong quá trình đổi mới từng loại hình dịch vụ đến khách hàng
mà còn đảm bảo hiệu quả kinh doanh với rủi ro, chi phí được tối ưu nhất
Việc xác định các mảng dịch vụ, các bộ phận, các chức năng trong tổ chức tài chính,
nơi mà Big data có thể được xem xét nhằm mục đích khai thác một cách hiệu quả
nhất dựa vào sự kết hợp giữa các kiến thức, mô hình kinh doanh và khả năng áp dụng
phần mềm công nghệ sẽ tạo ra cơ hội cạnh tranh cho chính tổ chức đó.
Tùy vào mục đích, cơ cấu, nguồn lực, khả năng khác nhau ở mỗi tổ chức mà sẽ có
nhiều trường hợp ứng dụng Big data khác nhau, mang tính chất đặc thù, riêng biệt.
Dưới đây là các trường hợp sử dụng phổ biến nhất – được chúng tôi nghiên cứu và
chọn lọc – mà các ngân hàng và công ty dịch vụ tài chính đang thực hiện để tìm kiếm
các giá trị ẩn sâu bên trong quá trình phân tích Big data.
11
Các ứng dụng của Big data trong lĩnh vực BankingPhân tích các thói quen chi tiêu của khách hàng
Các ngân hàng có khả năng truy cập trực tiếp nguồn thông tin, dữ liệu lịch sử dồi dào
liên quan đến các thói quen, hành vi chi tiêu của khách hàng. Các ngân hàng còn nắm
thông tin về số tiền một khách hàng được trả bao nhiêu ví dụ như mức lương cụ thể
trong bất kỳ tháng nào, số tiền được chuyển vào tài khoản tiết kiệm, số tiền đã được
thanh toán đến các công ty cung cấp tiện ích (ví dụ công ty điện lực, công ty cung cấp
dịch vụ internet,..), thời gian khách hàng sử dụng dịch vụ của ngân hàng, v.v. Điều
này cung cấp cơ sở, cơ hội để các ngân hàng tiếp cận và phân tích dữ liệu sâu hơn.
Áp dụng các chức năng sàng lọc thông tin (filter function) ví dụ như khi lọc ra thời
điểm dịp lễ hay mùa lễ và điều kiện kinh tế vĩ mô (ví dụ tình hình lạm phát, tỷ lệ thất
nghiệp,..) mà nhân viên ngân hàng có thể hiểu được nguyên nhân tác động làm mức
lương của khách hàng tăng hay giảm và khả năng chi tiêu của khách hàng thay đổi
như thế nào. Đây là một trong những yếu tố nền tảng cho quá trình đánh giá rủi ro,
sàng lọc, thẩm định hồ sơ cho vay, đánh giá khả năng thế chấp và cung cấp nhiều sản
phẩm tài chính khác (cross-selling) đến khách hàng như bảo hiểm.
Các ngân hàng được hưởng lợi rất nhiều nếu biết được thông tin khách hàng rút tiền
mặt - tất cả số tiền có được vào ngày trả lương - hoặc nếu họ muốn giữ tiền lại trên
thẻ tín dụng (credit card)/ thẻ ghi nợ (debit card). Tận dụng điều đó, ngân hàng có
thể tiếp cận khách hàng, mở rộng dịch vụ với các đề nghị, thu hút khách hàng đầu tư
vào các khoản vay ngắn hạn với tỷ lệ thanh toán cao và lãi suất thích hợp, v.v.
Phân khúc khách hàng và xem xét (thẩm định) hồ sơ
Một khi các phân tích ban đầu về thói quen chi tiêu của khách hàng cùng với xác định
các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên (ví dụ khách hàng
muốn gửi tiết kiệm hay muốn đầu tư vào các khoản vay) được hoàn tất thì các ngân
hàng sẽ có được một database (cơ sở dữ liệu) phục vụ cho quá trình phân khúc, phân
loại khách hàng một cách phù hợp dựa vào thông tin và hồ sơ khách hàng cung cấp.
Những khách hàng nào chi tiêu dễ dàng thoải mái, các nhà đầu tư nào thận trọng kỹ
lưỡng, khách hàng nào thanh toán các khoản nợ nhanh chóng, khách hàng nào mới
12
bắt đầu trả nợ khi sắp đáo hạn, thời gian khách hàng sử dụng dịch vụ của ngân hàng
để đo lường lòng trung thành… Biết được hồ sơ cá nhân của tất cả khách hàng giúp
ngân hàng đánh giá chi tiêu và thu nhập dự kiến trong tháng tới và lập kế hoạch chi
tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi ích cho chính khách hàng.
Big Data sẽ cung cấp cho các ngân hàng những hiểu biết, kiến thức chuyên môn sâu
về thói quen và mô hình chi tiêu của khách hàng, đơn giản hóa những nhiệm vụ xác
định nhu cầu và mong muốn của họ. Bằng cách có thể theo dõi từng giao dịch của
khách hàng, các ngân hàng sẽ có thể phân loại khách hàng dựa trên các thông số khác
nhau, bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng dịch
vụ, thói quen chi tiêu khi dùng thẻ tín dụng hoặc thậm chí là giá trị tài sản ròng (net
worth – thu nhập cộng với giá trị tài sản của khách hàng trừ đi các khoản nợ).
Lợi ích mà phân khúc khách hàng đem lại là nó cho phép các ngân hàng nhắm mục
tiêu khách hàng tốt hơn với các chiến dịch tiếp thị có liên quan được thiết kế để đáp
ứng chính xác nhu cầu của khách hàng.
Phân tích dữ liệu Big Data tăng khả năng cho các công ty, tổ chức BFSI nắm được
nhu cầu tìm ẩn bên trong từng khách hàng (customer insights) từ đó tạo được phân
khúc khách hàng. Tuy nhiên việc thu thập và đánh giá thông tin khách hàng đòi hỏi
sự đầu tư vào cơ sở hạ tầng của tổ chức cũng như đầu tư vào mạng lưới liên kết giữa
mọi nhân viên thuộc các phòng ban, bộ phận chức năng của tổ chức với công nghệ,
phần mềm kỹ thuật tiên tiến phục vụ quá trình khai thác Big Data.
Bán kèm thêm các dịch vụ khác (service cross-selling)
Dựa vào database mà ngân hàng có thể thu hút thêm, hay giữ chân khách hàng bằng
cách giới thiệu thêm các dịch vụ khác. Ví dụ ngân hàng có thể giới thiệu các khoản
đầu tư có lãi suất hấp dẫn đến các khách hàng có lượng tiền nhàn rỗi hoặc những nhà
đâu tư lúc nào cũng luôn thận trọng, cân nhắc trong việc ra quyết định đầu tư. Hoặc
ngân hàng có đề xuất các vay ngắn hạn cho các khách hàng có thói quen chi tiêu
“thoải mái” cho nhu cầu tiêu dùng hàng ngày của họ hoặc những khách hàng đang
gặp khó khăn trong việc thanh toán nợ cũ. Phân tích một cách chính xác về hồ sơ cá
13
nhân của khách hàng, ngân hàng có thể bán kèm các dịch vụ khác quả hơn và thu hút
khách hàng tốt hơn với các ưu đãi được “cá nhân hóa” tập trung chính xác vào nhu
cầu khách hiệu quả hơn, từ đó tăng doanh thu cho công ty.
Xây dựng hệ thống thu thập các phản hồi khách hàng (feedback) và phân tích chúng
Khách hàng có thể để lại phản hồi sau mỗi lần giao dịch hay mỗi lần nhận được tư
vấn từ trung tâm hỗ trợ chăm sóc khách hàng (customer call center) hoặc thông qua
các biểu mẫu phản hồi, nhưng thường xuyên ( hay có thể nói nhiều khả năng) chia sẻ
ý kiến thông qua các phương tiện truyền thông xã hội (social media) hơn ví dụ
Facebook, Zalo,... Các công cụ Big Data có thể tìm kiếm chọn lọc thông qua các
thông tin, feedback công khai trên các social media và thu thập tất cả những dữ liệu
đề cập về thương hiệu của ngân hàng để có thể phản hồi nhanh chóng và đầy đủ đến
khách hàng. Ngoài ra cũng hỗ trợ ngăn chặn các tin đồn thất thiệt ảnh hưởng đến hoạt
động kinh doanh và niềm tin nơi khách hàng ví dụ như vụ ngân hàng Agribank vướng
phải tin đồn phá sản trong hồi đầu tháng 11, 2018 vừa qua.
Khi khách hàng cảm thấy ngân hàng lắng nghe, đánh giá cao ý kiến và thực hiện
những cải tiến, thay đổi theo yêu cầu của họ thì sự trung thành dành cho thương hiệu
sẽ gia tăng, hơn nữa cải thiện hình ảnh của ngân hàng. Để có cái nhìn tổng quát, một
cái nhìn 360 độ về khách hàng các ngân hàng cần xây dựng một trung tâm dữ liệu -
trung tâm lưu trữ tất cả sự tương tác của khách hàng với thương hiệu bao gồm dữ liệu
cá nhân cơ bản, lịch sử giao dịch, lịch sử duyệt web, dịch vụ, v.v. Hiện tại để hỗ trợ
các tổ chức trong việc phân
Trên đây mới là những ứng dụng của Big Data trong lĩnh vực Banking nhắm đến mục
đích phân khúc khách hàng gia tăng thêm lượng khách hàng sử dụng dịch vụ tại các
ngân hàng (bao gồm cả khách hàng cũ và khách hàng mới) bằng cách phân tích dữ
liệu (feedback và hồ sơ cá nhân của khách hàng) để tiếp thu ý kiến, xác định được
nhu cầu, thói quen chi tiêu của khách hàng để đáp ứng một cách phù hợp.
Ở phần tiếp theo chúng tôi sẽ phân tích về các ứng dụng của Big Data trong việc
hướng đến marketing từng khách hàng (personlized marketing), thay đổi cách thức
14
cung cấp dịch vụ sao cho phù hợp. Đặc biệt là đảm bảo hiệu quả hoạt động, giảm
thiểu rủi ro bằng cách phát hiện, ngăn chặn các gian lận trong giao dịch tài chính,
2.2. Các ứng dụng của big data trong lĩnh vực ngân hàng
Marketing theo hướng cá nhân hóa (personalized marketing)
Sau khi có được phân khúc khách hàng thì các ngân hàng cần tận dụng để
personalized marketing để nhắm mục tiêu khách hàng dựa trên hiểu biết về thói quen
chi tiêu cá nhân của họ. Ngoài việc thu thập dữ liệu về lịch sử giao dịch của khách
hàng, các công ty dịch vụ tài chính hay ngân hàng cũng có thể kết hợp dữ liệu phi cấu
trúc (unstructured data) – một dạng dữ liệu Big Data – lấy được từ mạng xã hội hay
social media ví dụ như hồ sơ của khách hàng trên Facebook,.. để có được một bức
tranh đầy đủ hơn về nhu cầu của khách hàng dựa trên các phân tích về tâm lý, mong
muốn khách hàng ở mọi thời điểm. Mặt khác, dữ liệu của khách hàng ở các nền tảng
social media hay các ứng dụng xã hội thông minh khác sẽ giúp ngân hàng phân tích
được các rủi ro có thể xảy ra mà xem xét có nên cung cấp các khoản vay hay không
ngoài việc thẩm định hồ sơ như thông thường.
Sau khi phân tích và nắm được nhu cầu cụ thể và riêng biệt của mỗi khách hàng, các
tổ chức nên tiếp tục phân khúc sâu hơn nữa và cung cấp các giải pháp, kế hoạch
marketing phù hợp để từ đó có được tỷ lệ phản hồi, tỷ lệ chuyển đổi cao hơn từ mỗi
khách hàng. Ví dụ các ngân hàng sử dụng công cụ e-mail marketing để gửi đến khách
hàng các thông tin mới nhất về những dịch vụ cho vay ngắn hạn với lãi suất vừa phải,
hay gửi tiết kiệm với lãi suất hấp dẫn, hoặc các chương trình ưu đãi khác,…Việc tạo
ra các sản phẩm dịch vụ cung cấp cho từng phân khúc khách hàng, hay thậm chí từng
khách hàng cụ thể sẽ giúp các ngân hàng xây dựng hình ảnh thương hiệu và tạo dựng
một mối quan hệ tốt ở từng khách hàng.
Không chỉ riêng ở lĩnh vực ngân hàng, Big Data còn hỗ trợ marketing ở hầu hết mọi
lĩnh vực khác nhau nếu các công ty biết được tầm quan trọng và có được một tầm
nhìn chiến lược nghiêm túc trong việc khai thác Big Data. Theo McKinsey, việc sử
15
dụng dữ liệu để đưa ra quyết định marketing tốt hơn có thể tăng năng suất tiếp thị,
thu hút khách hàng thêm 15-20% ngoài các giải pháp marketing thông thường.
Thay đổi cách thức cung cấp dịch vụ đến khách hàng
Hệ thống Big Data có thể là một hệ thống phức tạp liên kết giữa nhiều bộ phận chức
năng khác nhau, nhưng công việc của nó là đơn giản hóa các nhiệm vụ trong một tổ
chức. Bất cứ khi nào một tên khách hàng hoặc số tài khoản được nhập vào hệ thống,
hệ thống Big Data sẽ hỗ trợ sàng lọc tất cả dữ liệu và chỉ truyền đi hay cung cấp các
dữ liệu được yêu cầu để phục vụ cho quá trình phân tích. Điều này sẽ cho phép các
ngân hàng tối ưu hóa quy trình làm việc và tiết kiệm cả thời gian và chi phí. Big Data
cũng sẽ cho phép các tổ chức xác định và khắc phục các vấn đề, trước khi chúng ảnh
hưởng đến khách hàng của họ.
Đôi khi khách hàng cũng có thể là nguồn gốc của một vấn đề. Ví dụ, các nhà đầu tư
có thể đưa ra quyết định, nhưng sau đó thay đổi ý định của họ tại một thời điểm trong
tương lai. Big Data sẽ giúp ngân hàng thay đổi phương thức cung cấp dịch vụ của họ
theo cách mà những khách hàng sẽ không thể “đi ngược lại” với cam kết ban đầu của
họ. Big Data cho phép ngành ngân hàng theo dõi hạn mức cho vay và thẻ tín dụng
của khách hàng, đảm bảo rằng họ không chi tiêu quá mức quy định. Cách cung cấp
dịch vụ thay đổi như thế nào còn phụ thuộc vào quy mô hoạt động, tính chất đặc thù
của loại hình dịch vụ, cơ sở hạ tầng,..của tổ chức ngân hàng đó.
Big Data chỉ đưa ra kết quả là thông tin ví dụ như những khách hàng nào có khả năng
không thanh toán được nợ, hay những khách hàng có khả năng rời dịch vụ (churn
risk) và nhiệm vụ của từng ngân hàng là suy nghĩ ra giải pháp để khắc phục ví dụ
theo dõi “sát sao” và thông tin liên tục về thời hạn trả nợ đến các khách hàng có thói
quen chậm trễ trong việc thanh toán lãi,…
Nói tóm lại, mục đích đầu tiên trong việc ứng dụng của Big Data đã được đề cập sẽ
tập trung hướng đến phân khúc khách hàng, cải tiến dịch vụ, marketing tăng doanh
số, lợi nhuận dựa trên toàn bộ thông tin về khách hàng mà tổ chức ngân hàng có được
– chính là dữ liệu Big Data cần được phân tích. Những dữ liệu có thể bao gồm:
16
- Hồ sơ tín dụng của khách hàng
- Thông tin về kỳ hạn vay của khách hàng (ngắn hạn, trung hạn hay dài hạn)
- Mức cấp tín dụng theo từng thời hạn (ngắn hạn, trung hạn hay dài hạn)
- Cơ cấu các loại hình dịch vụ theo số lượng khách hàng đăng ký và mức cấp
tín dụng.
- Thời gian tham gia dịch vụ ví dụ trong 1 năm, từ 1 đến 3 năm hoặc trên 3
năm,..
- V.v ….
Ngoài gia tăng lợi nhuận, mở rộng cung cấp dịch vụ đến các khách hàng tiềm năng,
các ngân hàng cũng có thể dựa vào database đã thu thập để kiểm soát rủi ro, các gian
lận tín dụng, đảm bảo hiệu quả hoạt động của tổ chức.
Phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật (Fraud identification)
Một trong những vấn đề lớn nhất mà ngành ngân hàng phải đối mặt là gian lận, tội
phạm trong tín dụng. Big Data sẽ cho phép các ngân hàng đảm bảo rằng không có
giao dịch trái phép nào được thực hiện, cung cấp mức độ an toàn, nâng cao tiêu chuẩn
bảo mật của toàn bộ ngành.
Nhờ vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân hàng sẽ
có thể xác định hay nhận được cảnh báo nếu có điều gì bất thường xảy ra trong quá
trình hoạt động, cung cấp dịch vụ đến khách hàng. Ví dụ nếu một nhà đầu tư hay
khách hàng thường thanh toán chi tiêu cho sinh hoạt hằng ngày hoặc để tiền trong tài
khoản gửi tiết kiệm lấy lãi, nhưng trong một ngày lại cố gắng rút toàn bộ số tiền từ
tài khoản của mình qua máy ATM, điều này có nghĩa là thẻ có thể đã bị mất cắp và
sử dụng bởi chính những kẻ cắp. Nhân viên ngân hàng sẽ gọi điện đến chủ tài khoản
hoặc thông báo đến khách hàng bằng bất kỳ hình thức nào để xác minh lại giao dịch
đó một cách rõ hơn: giao dịch hợp pháp khách hàng thực hiện hay giao dịch trái phép
bởi tội phạm lừa đảo, tội phạm đã trộm được thẻ mà khách hàng không biết? Cứ thế,
việc phân tích dữ liệu giao dịch lịch sử và làm cơ sở để kiểm tra tính hợp pháp, an
17
toàn bảo mật của các giao dịch hiện tại sẽ giảm thiểu được hành vi vi phạm pháp luật
có thể xảy ra.
Các ngân hàng và tổ chức tài chính khai thác Big Data để phân biệt giữa các giao dịch
là hành vi phạm tội với các giao dịch hợp pháp bằng cách áp dụng các thuật toán phân
tích dữ liệu (data analytics models) và “học máy” (machine learning). Các hệ thống
phân tích sẽ tự động phát hiện, trích xuất các giao dịch bất hợp pháp ở thời gian thực
và đề xuất các hành động ngay lập tức, chẳng hạn như chặn các giao dịch bất thường,
ngăn chặn hành vi lừa đảo trước khi nó xảy ra đảm bảo lợi ích của khách hàng và lợi
nhuận của chính ngân hàng.
Kiểm soát rủi ro (Risk management), tuân thủ luật pháp và minh bạch trong báo
cáo tài chính (Compliance and Reporting)
Ngoài phát hiện các hành vi phạm tội, bảo vệ lợi ích người tiêu dùng, các ngân hàng
có thể ứng dụng Big Data đo lường, kiểm soát rủi ro khi thực hiện các giao dịch bằng
cổ phiếu với những nhà đầu tư và kiểm tra hồ sơ vay của khách hàng. Dĩ nhiên tất cả
phải dựa trên sự phân tích có kết quả từ mọi dữ liệu lịch sử liên quan. Các thuật toán
Big Data còn giúp giải quyết các vấn đề về tuân thủ quy định pháp luật về kế toán,
kiểm toán và báo cáo tài chính minh bạch nhằm hợp lý hoá các hoạt động của tổ chức
từ đó giảm được chi phí quản lý.
Các tổ chức ngân hàng và tài chính hoạt động trong một khung pháp lý rất nghiêm
ngặt, đòi hỏi mức độ cao nhất trong kiểm soát minh bạch các hoạt động tài chính,
tuân thủ các điều luật và báo cáo đầy đủ chi tiết đến các cơ quan nhà nước, chính phủ.
Ở Việt Nam, các ngân hàng và tổ chức tín dụng phải tuân thủ toàn bộ Luật Ngân hàng
trong đó có Đạo luật về Luật Ngân hàng Nhà nước Việt Nam và Luật Các Tổ chức
tín dụng. Ở Mỹ thì có Đạo luật Dodd – Frank, được ban hành sau cuộc khủng hoảng
tài chính năm 2008, yêu cầu giám sát các giao dịch và tài liệu chi tiết về mọi giao
dịch xảy ra ở bất kỳ tổ chức tài chính nào. Việc phát hiện sớm hành vi gian lận của
khách hàng là cực kỳ quan trọng. Hệ thống Big Data thu thập và lưu trữ dữ liệu trong
một cơ sở dữ liệu có quy mô lớn giúp ngân hàng quản lý, tiến hành phân tích một
18
cách nhanh nhất bằng cách sử dụng các phần mềm, thuật toán chuyên dụng. Và khi
phát hiện một số lượng lớn rủi ro có thể xảy ra, ngân hàng sẽ dễ dàng kiểm soát. Big
Data đóng một vai trò to lớn trong quá trình tích hợp các chức năng của các bộ phận,
phòng ban và yêu cầu xử lý dữ liệu của ngân hàng vào một hệ thống trung tâm duy
nhất. Qua đó hỗ trợ kiểm soát, ngăn chặn vấn đề mất dữ liệu, giảm thiểu rủi ro và
gian lận.
Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân
viên
Quá tập trung vào gia tăng lợi nhuận mà nhiều ngân hàng lại thường quên đi một ứng
dụng tiềm năng của Big Data mà có thể có tác động rất lớn đến quá trình phát triển
kinh doanh. Đó chính là nâng cao năng suất làm việc của nhân viên. Hệ thống Big
Data hỗ trợ thu thập, phân tích, đánh giá, truyền tải dữ liệu về hiệu quả làm việc của
nhân viên. Kết quả phân tích sẽ giúp các nhà lãnh đạo có cái nhìn về tình hình, thực
trạng làm việc hiện tại của nhân viên mình như những nhân viên nào đang có thành
tích tốt nhất, những nhân viên nào không đạt được chỉ tiêu, và đặc biệt là xem xét
mức độ hài lòng của nhân viên về môi trường làm việc, phúc lợi,.. của ngân hàng
dành cho họ. Các công cụ của Big Data khai thác toàn bộ dữ liệu đều ở thời gian thực,
do đó lúc giải pháp được đưa ra sẽ mang tính khả thi cao, và tạo nên những sự thay
đổi nhanh chóng.
Ngoài ra các ngân hàng có thể đo lường nhiều thứ không chỉ mỗi hiệu suất làm việc
của cá nhân, mà còn tinh thần đồng đội, sự tương tác giữa các phòng ban và văn hóa
tổng thể của công ty. Nhân viên sẽ giảm thời gian dành cho các công việc mang tính
thủ công gồm nhiều quy trình phức tạp bằng cách dựa vào hệ thống Big Data gồm
các phần mềm đã được lập trình sẵn để giải quyết các công việc ấy một cách nhanh
chóng và chính xác. Từ đó nhân viên dành nhiều thời gian cho các công việc, nhiệm
vụ khó hơn, cấp bách hơn từ cấp trên giao xuống.
19
2.3. Khai phá dữ liệu (Data Mining)
Theo báo cáo của Markets and Markets thị trường Data Mining dự báo sẽ tăng từ
591,2 triệu USD năm 2018 lên 1.039 triệu USD trong năm 2023. Đây chính là minh
chứng cho thấy xu hướng tiếp cận Data mining phục vụ cho khai thác giá trị từ dữ
liệu ở các công ty trên toàn cầu ngày càng mạnh mẽ.
Khai phá dữ liệu là một tập hợp, một hệ thống các phương pháp tính toán, thuật toán
được áp dụng cho các cơ sở dữ liệu lớn và phức tạp, mục đích loại bỏ các chi tiết
ngẫu nhiên, chi tiết ngoại lệ, khám phá các mẫu, mô hình, quy luật tìm ẩn, các thông
tin có giá trị trong bộ dữ liệu. Khai phá dữ liệu là thành quả công nghệ tiên tiến ngày
ngay, là quá trình khám phá các kiến thức vô giá bằng cách phân tích khối lượng lớn
dữ liệu đồng thời lưu trữ chúng ở nhiều cơ sở dữ liệu khác nhau (Data-Flair).
Qui trình khai phá dữ liệu sẽ được thực hiện qua 2 quá trình: chuẩn bị dữ liệu (data
preparation) và khai phá dữ liệu (data mining) và 7 bước được mô tả chi tiết trong
bảng 2.1.
Bảng 2.1. Các bước trong quá trình khai phá dữ liệu
Bước Chức năng Diễn giải
1 Làm sạch dữ liệu Loại bỏ các dữ liệu nhiễu và dữ liệu không liên quan,
(Cleaning) không đầy đủ thông tin
2 Tích hợp dữ liệu Tổng hợp và lưu trữ dữ liệu từ nhiều nguồn khác nhau
(Integration) trong một hệ cơ sở dữ liệu
3 Lựa chọn dữ liệu Chọn ra những dữ liệu liên quan, có giá trị phân tích
(Selection)
4 Chuyển đổi dữ liệu Chuyển đổi và hợp nhất dữ liệu theo các loại biến, định
(Transformation) dạng khác nhau để phù hợp và dễ dàng cho việc phân
tích.
5 Khai phá dữ liệu Xây dựng các thuật toán, phương pháp, các model
(Data mining) phân tích khác nhau nhằm mục đích phát hiện, trích
20
xuất các thông tin hữu ích, giá trị tiềm năng từ những
mẫu dữ liệu.
6 Đánh giá mẫu dữ liệu Xác định mức độ chính xác, khả năng đem lại giá trị
(Evaluation) thực sự và triển khai thực tế không.
7 Trình bày kết quả thu Thể hiện kết quả bằng các công cụ trực quan hóa, sử
được dụng đồ thị, bảng, biểu đồ để diễn giải kết quả đến
(Knowledge) người xem
Khai phá dữ liệu là một trong những lợi thế các công ty trong ngành sản xuất, kinh
doanh, marketing nếu họ biết cách ứng dụng hợp lý để tăng cường hiệu quả hoạt
động. Các lợi ích cơ bản của khai phá dữ liệu như sau: hỗ trợ ra quyết định tự động,
hỗ trợ đưa ra dự báo chính xác, hỗ trợ giảm thiểu chi phí và hỗ trợ khả năng thấu hiểu
khách hàng. Đồng thời việc khai phá dữ liệu cũng được ứng dụng rộng rãi trong nhiều
lĩnh vực kinh doanh và ngành nghề và được phân theo từng chức năng nhiệm vụ.
2.4. Hành vi tiêu dùng
2.4.1. Định nghĩa
Hành vi người tiêu dùng là loại hình nghiên cứu hướng đến các đối tượng là cá nhân
hoặc tổ chức và cách mà các đối tượng chủ thể trên quyết định lựa chọn và sử dụng
sản phẩm, dịch vụ để thỏa mãn nhu cầu của bản thân, cũng như sự tác động của quá
trình đưa ra quyết định đó tới tâm lý số đông người tiêu dùng và xã hội. Những tác
nhân gây ảnh hưởng tới hành vi tiêu dùng chủ yếu là các tác động nội tại và ngoại vi
(Solomon, 2004). Điều này có thể do con người muốn trốn thoát khỏi guồng công
việc thường nhật, cải thiện chất lượng sống, tự thưởng công sức (Danziger, 2004a),
đẩy mạnh niềm tin vào bản thân, tìm kiếm trải nghiệm đáng nhớ, trở nên đặc biệt và
độc nhất (Danziger, 2004b), thể hiện cá tính, thể hiện địa vị xã hội hoặc đáp ứng các
nhu cầu tâm lý (Nia và Judith, 2000).
21
Có nhiều công trình nghiên cứu của nhiều tác giả xoay quanh chủ đề hành vi tiêu
dùng, một cách tổng quát có thể phân tích hành vi người tiêu dùng theo hai trường
phái chính: một là trường phái kinh tế (economic man) hay được gọi là trường phái
dựa vào lí trí (rational school) và hai là trường phái dựa vào cảm xúc (emotional
school).
Trường phái kinh tế cho rằng việc người tiêu dùng đưa ra quyết định dựa vào lí trí để
đáp ứng nhu cầu tối đa hóa giá trị sử dụng đối với sản phẩm dịch vụ. Để làm được
điều này, người tiêu dùng phải trải qua một quá trình nhận thức bao gồm các giai
đoạn: xác định những thuộc tính ưu việt của sản phẩm, thu thập thông tin và thực hiện
đánh giá các thuộc tính của các thương hiệu cạnh tranh trên thị trường nhằm đưa ra
lựa chọn thương hiệu tốt nhất. Trường phái này chỉ phù hợp cho những sản phẩm mà
đối tượng người tiêu dùng tập trung duy nhất vào những lợi ích chức năng sản phẩm.
Quan điểm theo trường phái lí trí này bỏ qua lợi ích mang tính cảm xúc, thứ đóng vai
trò rất quan trọng trong việc tiêu dùng một số sản phẩm nhất định, mà điển hình là
các sản phẩm xa xỉ phẩm.
Khác với trường phái theo lí trí, trường phái cảm xúc lại nhận định rằng, yếu tố tác
động đến hành vi người tiêu dùng cơ bản đó chính là cảm xúc. Theo quan điểm này,
người tiêu dùng ra đưa quyết định hoàn toàn dựa trên các tiêu chuẩn mang tính chất
chủ quan của chủ thể như thị hiếu, niềm tin, ham muốn hay đơn giản chỉ là thích thú
thể hiện cá tính của mình.
Bên cạnh những lí thuyết cơ bản về hành vi tiêu dùng, chúng ta cũng cần phải bàn
thêm khái niệm phân khúc thị trường một khái niệm tuy không mới nhưng lại có ý
nghĩa quan trọng trong thực tiễn kinh doanh của các tổ chức tài chính. Phân khúc thị
trường được hiểu đơn giản là chia “chiếc bánh thị trường” của một sản phẩm hay dịch
vụ nào đó thành nhiều nhóm nhỏ, gọi tắt là các phân khúc, đảm bảo rằng trong cùng
một phân khúc thì có hành vi tiêu dùng của các khách hàng tương tự nhau và mang
tính khác biệt so với khách hàng của những phân khúc còn lại. Phân khúc thị trường
đóng vai trò hết sức rất quan trọng trong việc xây dựng chiến lược marketing mục
22
tiêu để tối đa hóa lợi nhuận. Đây là khâu đầu tiên phải thực hiện để xác định đâu là
thị trường mục tiêu cần tập trung nguồn lực để khai thác. Một điểm cần lưu ý, người
phân tích marketing chỉ đóng vai trò nhận dạng phân khúc và tiến hành phân tích
nguồn lực sẵn có của đơn vị chọn ra phân khúc phù hợp để thực hiện chiến lược kinh
doanh chứ không phải là người tạo ra bất kỳ phân khúc nào.
Phân tích dữ liệu có thể bao gồm cả phân tích dữ liệu thăm dò (dùng trong trường
hợp xác định các mẫu cần phân tích và mối quan hệ trong dữ liệu) và phân tích dữ
liệu xác nhận (thông qua việc áp dụng các kĩ thuật dùng trong thống kê để tìm ra giả
thiết về một bộ dữ liệu nào đó có đúng hay không).
Theo cách tiếp cận khác thì phân tích dữ liệu được chia thành 2 dạng: phân tích dữ
liệu định lượng (hay còn gọi là phân tích dữ liệu số, và các biến trong dữ liệu có thể
so sánh theo thống kê) so với phân tích dữ liệu định tính (chỉ tập trung vào các dữ
liệu không phải là dữ liệu số như video, hình ảnh và văn bản).
Trong thực tế, dữ liệu lớn và phân tích có thể được áp dụng trong nhiều lĩnh vực khác
nhau mà điển hình là lĩnh vực kinh doanh và với nhiều trường hợp sử dụng cụ thể
khác nhau. Sau đây là vài ví dụ:
Phân tích khách hàng: Các công ty có thể truy xuất thông tin dữ liệu giao dịch của
khách hàng để phân tích xu hướng nhu cầu của khách hàng thông qua đó nâng cao
tính năng sản phẩm dịch vụ, cải thiện tỉ lệ chuyển đổi và quan trọng là giữ khách hàng
tốt hơn.
Phân tích hoạt động: Nâng cao hiệu quả hoạt động sản xuất kinh doanh và tối ưu
hóa nguồn lực (tài sản) của công ty là mục tiêu của tất cả công ty. Phân tích big data
có thể giúp doanh nghiệp vận hành một cách hiệu quả hơn và cải thiện hiệu suất lao
dộng góp phần gia tăng lợi nhuận.
Phòng chống gian lận: Dựa vào dữ liệu lịch sử giao dịch khách hàng tham gia dịch
vụ tín dụng ở ngân hàng và dựa vào các mô hình, các thuật toán, chúng ta sẽ khám
phá ra những lổ hỗng trong kinh doanh, cũng như xác định các hoạt động mang tính
23
chất khả nghi giúp chỉ ra hành vi gian lận. Kết quả phân tích như vừa được nêu, có
một đống góp lơn giúp các tổ chức kinh doanh ngăn chặn kịp thời những gian lận từ
phía khách hàng và từ phía nhân viên hướng đến giảm thiểu rủi ro.
2.4.2. Hành vi tiêu dùng dựa trên phương pháp RFM
Trong thị trường cạnh tranh hiện nay, khách hàng được xem là một trong những ưu
tiên lớn nhất của công ty. Để tạo ra sự trung thành và giữ chân khách hàng, các công
ty cần xác định mối quan hệ khách hàng của họ dựa trên một số kỹ thuật RFM được
viết tắt từ Recency, Frequency, Monetary, ý nghĩa của từ yếu tố như sau: (i) Recency
là thời gian giao dịch gần nhất của khách hàng tính đến thời điểm nghiên cứu. Đây là
chỉ số quan trọng để xác định thời gian tham gia giao dịch tại ngân hàng. Điều này sẽ
giúp ngân hàng xác định được đâu là khách hàng mới và đâu là khách hàng cũ; (ii)
Frequency là chỉ số xác định số tần suất giao dịch trong lĩnh vực ngân hàng của suốt
thời gian nghiên cứu. Ví dụ trong nghiên cứu này, thời gian số liệu nghiên cứu là 12
tháng, tổng số lần giao dịch của khách hàng đến ngân hàng sẽ được xác định trong
trường hợp này. Những đối tượng khách hàng thường xuyên đến giao dịch sẽ là những
đối tượng có khả năng nhiều nhất trở thành hệ khách hàng trung thành ở mức cao
trong tương lai. Thông tin này một phần nào đó cũng sẽ xác định được sự hài lòng
của khách hàng đối với dịch vụ của đơn vị kinh doanh; (iii) Monetary là tổng giá trị
số dư của khách hàng tại ngân hàng trong thời gian nghiên cứu. Qua đó, công ty sẽ
có thông tin dữ liệu để phân loại mức dư nợ hoặc số dư nợ của khách hàng. Điều này
là cơ sở giúp ngân hàng xây dựng những chương trình, giải pháp chiến lược sản phẩm
hoặc dịch vụ phù hợp theo khả năng thanh toán hoặc chi trả của khách hàng.
Wu & Lin (2005) đã chứng minh rằng giá trị của R và F càng cao, khách hàng càng
có thể giúp việc đo lường về hành vi sử dụng dịch vụ của khách hàng tại ngân hàng.
Ngoài ra, giá trị M càng cao, khách hàng càng có thể được xem rằng, đánh giá giá trị
giao dịch của khách hàng để hướng đến nhóm khách hàng ở tầm cỡ hoặc qui mô giao
dịch.
24
Tất cả các khách hàng được phân tích dựa vào 3 tiêu chí: thời gian giao dịch gần nhất
(R), tần suất giao dịch (F) và giá trị giao dịch (M), các tiêu chí được đánh giá theo
thang điểm từ 1 năm đến 5 sẽ đóng góp vào việc thực hiện phân khúc thị trường. Chi
tiết phân khúc khách hàng theo RFM được mô tả chi tiết theo bảng 2.3.
Bảng 2.4. Bảng mô tả điểm theo RFM
Điểm Nhóm Recency (R) Frequency (F) Monetary (M)
1 Rất thấp Rất thấp Rất thấp
2 Rời dịch vụ (không chắc chắn) Nguy cơ Thấp Thấp Thấp
3 Thông thường Bình thường Bình thường Bình thường
4 Tiềm năng Cao Cao Cao
5 Tốt nhất Rất cao Rất cao Rất cao
Nguồn: Wu & Lin (2005)
2.5. Mô hình đề xuất cho nghiên cứu
Mô hình Fraud được gọi là mô hình gian lận, mô hình này được xem xét dựa trên sự
tham gia các thông tin về hồ sơ tham gia dịch vụ của khách hàng tại ngân hàng, thông
tin giao dịch và lịch sử giao dịch vủa khách hàng khi đến tham gia. Như được chỉ ra
ở biểu đồ 2.1 (Eshghi & Kargari, 2019), chuỗi tiếp cận để đi vào phân tích tính gian
lận sẽ bao gồm về xu hướng các đặc điểm mới bao gồm về số lượng tham gia giao
dịch, thời gian và khoảng thời gian. Tiếp theo đó là các mức độ về thông tin cá nhân,
chủ tài khoản và các thông tin về đặc điểm được xét duyệt khi tham gia giao dịch, ví
dụ: tài sản nhà, chức vụ công việc, trình độ học vấn. Kế đến là các hoạt động tham
gia, ví dụ tham gia giao dịch vay, thẻ tín dụng, gia hạn. Sau cùng là thời gian có thể
được đo lường đánh giá theo ngày trong tuần, hay ngày trong tháng, tuần trong tháng,
ngày trong năm, tuần trong năm, tháng trong năm, tháng trong vụ mùa, và tổng thể.
25
Biểu đồ 2.1: Tiến trình tiếp cận phục vụ mô hình fraud
Mức độ
Xu hướng của đặc điểm mới
Hoạt động kinh doanh/dịch vụ
Các kênh tham gia
Thời kỳ của giao dịch khách hàng
Cá nhân
Tổng thể
Kênh loại 1
Ngày trong tuần
Kinh doanh 1
Chủ thời khoản
Kênh loại# …
Ngày trong tháng
Thời gian
Tổng thể chung
Tuần trong tháng
Khoảng thời gian
Kinh doanh# … Kinh doanh thứ n
Kênh loại thứ n
Ngày trong năm
Tuần trong năm
Tổng các hoạt động
Tổng thể các kênh
Tháng trong năm
Tháng mùa vụ
Tổng thể
Nguồn: (Eshghi & Kargari, 2019)
Xuất phát từ việc ứng dụng mô hình gian lận Fraud, thuật toán được áp dụng trong
nghiên cứu này là công cụ C5.0 có trong phần mềm IBM SPSS-MODLER. Việc sử
dụng phương pháp này được sự hướng dẫn của và hỗ trợ của giáo viên hướng dẫn.
Thuật toán C5.0, được xem là thuật toán phân lớp dữ liệu dựa trên cây quyết định của
thông tin giao dịch khách hàng. Thuật toán này có cơ chế sinh cây quyết định hiệu
quả và chặt chẽ bằng việc sử dụng mức độ lựa chọn thuộc tính tốt nhất là information-
gain. Các cơ chế xử lý với giá trị lỗi, thiếu và chống “quá vừa” dữ liệu với cơ chế cắt
tỉa cây để tạo nên sức mạnh. Mô hình C5.0 còn giúp cho việc dự báo dựa trên thông
tin ban đầu của khách hàng, hoặc thông tin hành vi giao dịch theo thời gian. Mô hình
Fraud được thực hiện qua thành 3 bước.
Bước 1: Xác định sự gian lận của việc đánh giá hồ sơ ban đầu do khách hàng cung
cấp. Việc xếp hạng này được chia làm 3 mức: TỐT, VỪA, XẤU. Các thông tin được
xếp hạng được dựa vào thông tin hồ sơ của ứng viên tiếp cận ngân hàng cho vay vốn,
26
tham gia dịch vụ thẻ, hoặc gia hạn dịch vụ sử dụng. Thông tin bao gồm: Thu nhập
bình quân/tháng, tài sản nhà ở, loại khách hàng (cũ, mới), quan hệ cộng đồng, học
vấn, chức vụ lãnh đạo và gia cảnh. Với nguồn thông tin vừa nêu, hồ sơ của khách
hàng sẽ được đánh giá xếp hạng (RANK_HOSO) được xem như là trường mục tiêu
(target field).
Việc gian lận này có thể xảy ra các trường hơp: (i) Hồ sơ xấu được đánh giá thành
tốt, lỗi này có thể do nhân viên trực tiếp gian lận trong quá trình đánh giá hồ sơ, hoặc
do khách hàng cố tình gian lận trong khai báo; (ii) Hồ sơ tốt được đánh giá thành
xấu, điều này có thể do sự gian lận của nhân viên trực tiếp thẩm định hồ sơ, điều này
xảy ra có thể do nhân viên thẩm định có thành ý không tốt đối với khách hàng tham
gia giao dịch nên tâm đánh giá có sự lệch so với thực tế; (iii) Hồ sơ vừa được đánh
giá thành tốt hoặc xấu, điều này có thể do gian lận xuất phát từ nhân viên trong ngân
hàng tham gia trực tiếp thẩm định hồ sơ.
Bước 2: Xác định sự gian lận sau khi khách hàng đã được tham gia dịch vụ trên 12
tháng. Hành vi tham gia này thông qua lịch sử giao dịch được đánh giá dựa vào các
chỉ số thuộc RFM. Cụ thể dựa vào lần dịch vụ gần nhất (Recency)- Tần suất tham gia
giao dịch (Frequency)- Tổng số tiền/số dư tài khoàn tham gia giao dịch (Monetary)
của khách hàng. Ba thông số trên hợp thành RFM để xác định lòng trung thành của
khách hàng một khi RFM càng lớn và ngược lại một khi RFM càng nhỏ cho thấy sự
xa rời hoặc có khả năng rời dịch vụ của khách hàng càng nhiều. Như vậy sự gian lận
có thể từ hồ sơ ban đầu được đánh giá xấu, nhưng sau 12 tháng lịch sử giao dịch,
khách hàng này không như đánh giá ban đầu, tức là sau 12 tháng giao dịch, hành vi
biểu hiện tốt. Điều này có thể là do gian lận của nhân viên trực tiếp thẩm định từ ban
đầu. Trường hợp sau 12 tháng tham gia giao dịch, khách hàng được đánh giá có hồ
sơ rất tốt từ ban đầu, nhưng lại cho RFM nhỏ, tức là lòng trung thành rất thấp, điều
này cho thấy, có sự gian lận về khai báo hồ sơ của khách hàng, để cố tình tìm được
ưu đãi trong giao dịch, hoặc do nhân viên thẩm định chủ động đánh điểm tốt. Đồng
thời trong bước này, có kết hợp với số dư của khách hàng tham gia giao dịch. Tuy
27
nhiên cũng có những trường hợp ngược lại, ban đầu hồ sơ được xếp hạng không cao,
nhưng sau quá trình giao dịch trên 12 tháng, kết quả cho RFM cao, điều này cho thấy,
khách hàng đã chịu một sự thiệt thòi trong thẩm định của nhân viên thẩm định. Điều
này cũng có thể do khách hàng không được lòng nhân viên nên vì thế kết quả xếp
hạng thấp ban đầu.
Bước 3: Từ kết quả của bước 1 và bước 2, bước 3 này sẽ giúp xác định nhóm có tính
gian lận thật sự dựa vào 2 bước trước đó. Một khi khách hàng được xếp vào nhóm
gian lận ở bước 1 và gian lận ở bước 2, khách hàng sẽ được đưa vào nhóm có tính
gian lận cảnh báo cao. Ngược lại những nhóm khách hàng không thuộc nhóm gian
lận ở bước 1 và bước 2, nhóm này sẽ được xem là quá trình đánh giá đúng khách
hàng tham gia dịch vụ, không có sự gian lận xảy ra kể cả trong hồ sơ và trong lịch sử
giao dịch.
Tóm lại: Việc sử dụng mô hình gian lận Fraud sẽ góp phần mang đến hai thông điệp
quan trọng, trong đó có thể giúp cho việc xác định tính gian lận thuộc phía nhân viên
gân hàng, hoặc tính gian lận thuộc vào nhóm khách hàng. Một khi các thông tin này
được xác định, các giải pháp kịp thời vô cùng quan trọng vì làm chặn đứng những rủi
ro trong tương lai. Góp phần cũng cố trong quản lý tốt hơn và thẩm định hồ sơ đúng
với đối tượng khách hàng.
28
CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ
PHÂN TÍCH DỮ LIỆU
A. BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SCB
3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng
3.1.1. Big data
Đã có nhiều công trình nghiên cứu rất thành công trong việc sử dụng Big Data để
phân tích mức độ tiêu dùng của khách hàng. Tuy nhiên, điểm chung của các nghiên
cứu này đều chỉ ra rằng Big Data luôn cho phép tổ chức kinh doanh thao tác quản lý
các tập dữ liệu cực kỳ lớn và phức tạp mà không một ứng dụng xử lý dữ liệu truyền
thống nào có thể hỗ trợ.
Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc.
Các hoạt động được tạo lập trong hệ thống đều được Big Data ghi lại. Đối với hoạt
động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong
suốt thời gian giao dịch, dữ liệu này sẽ ngày càng phong phú, đa dạng hơn theo thời
gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử dụng trong việc truy vấn
thông tin để phát triển chiến lược kinh doanh, hay tạo lập môi trường quản lý chuyên
nghiệp.
Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân
hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh
trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng
đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản lý doanh
nghiệp và xác định sự gian lận trong kinh doanh, trong đó gian lận từ phía nhân viên
và từ phía khách hàng. Vô hình chung, Big Data đóng vai trò quan trọng trong việc
truy xuất dữ liệu và hỗ trợ con người đưa ra quyết định tốt hơn với cơ hội thành công
cao hơn nhiều.
29
3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng
Nguồn dữ liệu Big Data đều có hầu hết trong các lĩnh vực kinh tế xã hội, lĩnh vực
ngân hàng và dịch vụ tài chính. Mọi giao dịch của khách hàng tại ngân hàng đều tạo
ra hồ sơ điện tử, các bản sao lưu được lưu theo quy định của pháp luật. Nhờ phân tích
ưu việt của Big Data, các dịch vụ tài chính của các công ty không còn lưu trữ dữ liệu
theo yêu cầu bắt buộc như trước đây mà giờ họ chủ động hơn trong việc trích xuất dữ
liệu để từ đó xây dựng giải pháp chiến lược cải thiện hoạt động, tăng lợi nhuận cho
tổ chức.
Nói tóm lại, Big Data là một nguồn tài nguyên quan trọng và cần thiết trong giai đoạn
hội nhập ngày nay, bởi cốt lõi của Big Data là nền tảng tạo ra lợi thế cạnh tranh trong
bất kỳ một tổ chức tài chính nào không chỉ riêng ngân hàng. Bằng việc phân tích xử
lý nguồn dữ liệu này giúp nhà lãnh đạo nắm bắt và dự đoán được nhu cầu thay đổi
tiêu dùng của khách hàng như thế nào để từ đó đưa ra những chiến lược phù hợp. Dữ
liệu lớn sẽ không chỉ mang lại diện mạo hoàn toàn mới cho doanh nghiệp, mà hơn
thế nữa nó còn tạo ra một quy trình đổi mới cho từng loại dịch vụ đáp ứng nhu cầu
ngày càng đa dạng của khách hàng góp phần thúc đẩy phát triển doanh nghiệp, đảm
bảo lợi nhuận ngày càng tăng đồng thời cũng tối thiểu hóa các rủi ro và tiết kiệm chi
phí.
Xét hệ quy chiếu gồm 3 yếu tố: sản phẩm dịch vụ, bộ phận chăm sóc khách hàng,
chức năng điều hành trong các tổ chức kinh doanh về mảng tài chínnh – dịch vụ, thì
Big Data có thể được xem như là một công cụ khai thác hiệu quả nhất trong việc xây
dựng chiến lược dựa trên sự tổ hợp các thành phần: kiến thức, mô hình kinh doanh
và khả năng áp dụng công nghệ để tạo ra cơ hội cạnh tranh cho tổ chức. Với từng
mục đích cụ thể cũng như việc xử lý nguồn tài nguyên Big Data khác nhau của các
tổ chức khác nhau, sẽ đem lại nhiều trường hợp ứng dụng dữ liệu lớn khác nhau, đặc
biệt và mang tính chất chuyên biệt. Dưới đây là những ví dụ minh họa các trường hợp
phổ biến và mảng dịch vụ tài chính ngân hàng được ra làm mẫu nghiên cứu để tìm và
phát triển các giá trị ẩn sâu bên trong ứng dựng phân tích Dữ liệu lớn.
30
Ngân hàng có khả năng truy cập trực tiếp và tiếp cận thông tin một cách dễ dàng, các
dữ liệu lịch sử liên quan đến thói quen và hành vi chi tiêu của khách hàng. Ngân hàng
cũng nắm giữ các thông tin tài chính của khách hàng: tiền lương chuyển khoản cụ thể
mỗi tháng, tiền gửi tiết kiệm tại các tổ chức tín dụng, hay các chi phí sinh hoạt liên
quan đến công ty cung ứng dịch vụ tiện ích (điện, nước, dịch vụ internet...) khi khách
hàng sử dụng các sản phẩm dịch vụ ngân hàng... Điều này cung cấp cơ sở và cơ hội
để các ngân hàng có thể truy cập và phân tích dữ liệu một cách chuyên sâu hơn phục
vụ từng mục đích nhu cầu cụ thể. Bằng cách áp dụng chức năng sàng lọc thông tin về
thời gian, điều kiện kinh tế vĩ mô (thất nghiệp, lạm phát, cung cầu thị trương…) thì
người phân tích sẽ càng hiểu rõ hơn nhu cầu chi tiêu tăng/giảm của khách hàng xuất
phát từ đâu. Đây là một trong bước đầu tiên cũng như là những yếu tố cơ bản cho
trong quá trình đánh giá rủi ro, sàng lọc tổng thể thông tin từ đó đánh giá khả năng
vay vốn (tài chính, tài sản) của khách hàng và hơn hết là xây dựng chiến lược bán
chéo sản phẩm, tối ưu hóa tiện ích cho khách hàng.
Việc tiếp cận thông tin ban đầu với khách hàng hết sức quan trọng trong việc tìm hiểu
nhu cầu, tạo lập thông tin để từ đó thiết lập sản phẩm dịch vụ phù hợp với khách hàng
dựa trên các thông tin và tài liệu được cung cấp trong quá trình trao đổi. Big Data sẽ
là kho dữ liệu cung cấp cho ngân hàng các thông tin cá nhân và lịch sử giao dịch của
khách hàng để từ đó có sơ sở trong việc phân loại khách hàng dựa trên các thông số
khác nhau, bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng
dịch vụ.
Lợi ích mang lại của việc xác định phân khúc khách hàng là cho phép các ngân hàng
xây dựng các chiến dịch tiếp thị phù hợp để đáp ứng nhu cầu chính xác của khách
hàng. Tuy nhiên, việc thu thập và đánh giá thông tin các yêu cầu cần có sự đầu tư
chỉnh chu vào cơ sở hạ tầng của doanh nghiệp cũng như đầu tư vào mạng lưới kết nối
giữa tất cả nhân viên của các bộ phận, phòng ban chức năng đồng thời chú trọng tân
tiến công nghệ, phần mềm kỹ thuật tốt để thuận lợi cho quá trình khai thác Dữ liệu
lớn.
31
Tùy vào mục đích, cơ cấu, nguồn lực, khả năng khác nhau ở mỗi tổ chức mà sẽ có
nhiều trường hợp ứng dụng big data khác nhau, mang tính chất đặc thù, riêng biệt.
Phân tích các thói quen chi tiêu của khách hàng
Các ngân hàng có khả năng truy cập trực tiếp nguồn thông tin, dữ liệu lịch sử dồi dào
liên quan đến các thói quen, hành vi chi tiêu của khách hàng. Các ngân hàng còn nắm
thông tin về số tiền một khách hàng được trả bao nhiêu ví dụ như mức lương cụ thể
trong bất kỳ tháng nào, số tiền được chuyển vào tài khoản tiết kiệm, số tiền đã được
thanh toán đến các công ty thanh toán tiện ích (điện lực, nước, internet…) thời gian
sử dụng dịch vụ của ngân hàng…Điều này cung cấp cơ sở, cơ hội để các ngân hàng
tiếp cận và phân tích dữ liệu sâu hơn. Áp dụng các chức năng sàng lọc thông tin (filter
function) mà nhân viên ngân hàng có thể hiểu được nguyên nhân tác động làm mức
lương của khách hàng tăng hay giảm và khả năng chi tiêu của khách hàng thay đổi
như thế nào. Đây là một trong những yếu tố nền tảng cho quá trình đánh giá rủi ro,
sàng lọc, thẩm định hồ sơ cho vay, đánh giá khả năng thế chấp và cung cấp nhiều sản
phẩm tài chính khác (cross-selling) đến khách hàng như bảo hiểm.
Các ngân hàng được hưởng lợi rất nhiều nếu biết được thông tin khách hàng rút tiền
mặt – tất cả số tiền có được vào ngày trả lương hoặc nếu muốn giữ tiền lại trên thẻ
tín dụng/thẻ ghi nợ. Tận dụng điều đó, ngân hàng có thể tiếp cận khách hàng, mở
rộng dịch vụ, thu hút khách hàng đầu tư vào các khoản vay ngắn hạn với tỷ lệ thanh
toán cao và lãi suất thích hợp.
Phân khúc khách hàng và thẩm định hồ sơ
Một khi các phân tích ban đầu về các thói quen chi tiêu của khách hàng cùng với xác
định các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên, ví dụ khách hàng
muốn gửi tiền tiết kiệm hay muốn đầu tư vào vào các khoản vay) được hoàn tất thì
các ngân hàng sẽ có được một cơ sở dữ liệu (database) phục vụ cho quá trình phân
khúc phân loại khách hàng một cách phù hợp dựa vào thông tin và hồ sơ khách hàng
cung cấp. Những khách hàng nào chi tiêu dễ dàng thoải mái, các nhà đầu tư nào thận
32
trọng kỹ lưỡng, khách hàng nào thanh toán các khoản nợ nhanh chóng, khách hàng
nào bắt đầu trả nợ khi sắp đáo hạn, thời gian khách hàng vào sử dụng dịch vụ của
ngân hàng để đo lường lòng trung thành…biết được hồ sơ cá nhân của tất cả khách
hàng giúp ngân hàng đánh giá chi tiêu và thu nhập dự kiến trong tháng tới và lập kế
hoạch chi tiết để đảm bảo lợi nhuận cho chính tổ chức là lợi nhuận cho chính khách
hàng.
Big data sẽ cung cấp cho các ngân hàng những hiểu biết kiến thức chuyên môn sâu
về thói quen và mô hình chi tiêu khách hàng, đơn giản hóa những nhiệm vụ xác định
nhu cầu và mong muốn của họ. Bằng cách có thể theo dõi từng giao dịch của khách
hàng, các ngân hàng sẽ có thể phân loại khách hàng dựa trên các thông số khác nhau,
bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng dịch vụ,
thói quen chi tiêu khi dùng thẻ tín dụng hoặc thậm chí là giá trị tài sản ròng.
Lợi ích mà phân khúc khách hàng mang lại là nó cho phép các ngân hàng nhắm mục
tiêu khách hàng tốt hơn với các chiến dịch tiếp thị có liên quan được thiết kế để đáp
ứng chính xác nhu cầu của khách hàng.
Việc phân tích dữ liệu big data tăng khả năng cho các công ty, nắm được nhu cầu
tiềm ẩn bên trong của từng khách hàng từ đó tạo được phân khúc thị trường. Tuy
nhiên việc thu thập và đánh giá thông tin khách hàng đòi hỏi sự đầu tư vào cơ sở hạ
tầng của tổ chức cũng như đầu tư vào mạng lưới liên kết giữa các nhân mọi phòng
ban, bộ phận chức năng của tổ chức với công nghệ, phần mềm kỹ thuật tiên tiến phục
vụ quá trình khai thác big data.
Bán kèm thêm các dịch khác (cross-selling)
Dựa trên cơ sở dữ liệu của Big Data mà các ngân hàng có thể thu hút hoặc giữ chân
khách hàng bằng cách phát triển các dòng sản phẩm mới đa tiện ích hoặc cải thiện
chính sách chăm sóc khách hàng. Ngân hàng có thể đưa ra nhiều sự lựa chọn cho
khách hàng chẳng hạn: giới thiệu các khoản đầu tư với lãi suất hấp dẫn cho phân khúc
khách hàng tiền gửi, đang nhàn rỗi vốn. Hoặc ngân hàng cũng có thể đưa ra các gói
33
tín dụng ngắn hạn cho phân khúc khách hàng có thói quen chi tiêu "thoải mái" cho
nhu cầu tiêu dùng phục vụ nhu cầu đời sống hàng ngày của họ hoặc phân khúc khách
hàng kẹt vốn trong việc thanh toán các khoản đầu tư nhà, xe khi dòng thu nhập chưa
về kịp. Việc phân tích chính xác thông tin dữ liệu hồ sơ của khách hàng sẽ giúp ngân
hàng có thể xây dựng chiến lược marketing bán chéo các sản phẩm dịch vụ khác hiệu
quả hơn và thu hút nhiều khách hàng hơn từ đó góp phần tăng doanh thu cho doanh
nghiệp.
Xây dựng hệ thống thu thập các phản hồi của khách hàng (feedback) và phân
tích chúng
Xây dựng hệ thống ghi nhận phản hồi từ khách hàng sau mỗi lần khác hàng sử dụng
sản phẩm dịch vu: phản hồi trực tiếp tại quầy hay đường dây nóng của Trung tâm
dịch vụ khách hàng, phản hồi qua thư điện tử, hòm thư góp ý hoặc qua fanpage của
ngân hàng thông qua uứng dụng mạng xã hội (facebook, zalo...). Các công cụ phân
tích của Big Data có thể tìm kiếm để sàng lọc thông và thu thập tất cả dữ liệu được
đề cập tới thương hiệu của ngân hàng để có thể phản hồi một cách nhanh chóng và
đầy đủ cho khách hàng. Đồng thời, công cụ này cũng hỗ trợ trong việc ngăn chặn
những tin đồn ảnh hưởng đến hoạt động kinh doanh và niềm tin của khách hàng vào
ngân hàng, thực trạng này cũng đã xảy ra tại một số ngân hàng Việt Nam hiện nay.
Với tâm lý của một khách hàng nghĩ rằng nếu ngân hàng sẵn sàng lắng nghe khách
hàng và đánh giá cao những ý tưởng đóng góp vào việc phát triển cải tiến sản phẩm
dịch vụ tốt hơn thì không lý do nào mà khách hàng có thể từ bỏ để đến một điểm giao
dịch khác. Muốn được như vậy, điều đầu tiên là phải thể hiện được tinh thần “luôn
luôn lắng nghe và luôn luôn thấu hiểu khách hàng” thông qua việc thiết lập xây dựng
một trung tâm dữ liệu - trung tâm này sẽ lưu trữ tất cả các tương tác của khách hàng
với các thương hiệu bao gồm cơ sở dữ liệu riêng tư, lịch sử giao dịch... với mục đích
là hỗ trợ phát triển chiến lược để đáp ứng những gì khách hàng đang mong muốn để
gia tăng lòng trung thành của khách hàng đối với doanh nghiệp.
34
Marketing theo hướng cá nhân hóa
Khi phân khúc khách hàng đã được xác định từ việc phân tích dữ liệu lớn, các ngân
hàng có thể xây dựng chính sách marketing theo hướng cá nhân hóa để nhắm vào
đúng nhu cầu và mục tiêu khách hàng cần dựa trên sự phân tích về thói quen chi tiêu
cá nhân của họ thông qua lịch sử giao dịch. Ngoài ra, để đảm bảo dữ liệu về lịch sử
giao dịch của khách hàng, ngân hàng cần kết hợp dữ liệu không có cấu trúc - một
dạng dữ liệu Big Data được thu thập từ các ứng dụng mạng xã hội như hồ sơ thông
tin khách hàng trên Facebook, Zalo .. để hoàn thiện hơn bức tranh toàn cảnh thể hiện
nhu cầu của khách hàng dựa trên phân tích tâm lý nhu cầu khác nhau của khách hàng
tại các thời điểm khác nhau. Mặt khác, dữ liệu của khách hàng trong các phương tiện
xã hội nền tảng hay thông qua các ứng dụng xã hội thông minh khác sẽ phần nào giúp
các ngân hàng phân tích được các rủi ro có thể xảy ra, từ đó có thể đưa ra quyết định
nên cho vay hay không ngoài việc nhìn nhận và đánh giá hồ sơ như cách truyền thống
bây giờ.
Sau khi phân tích và dự đoán được nhu cầu cụ thể của từng đối tượng khách hàng,
dựa trên cơ sở dữ liệu đó ngân hàng đưa ra các giải pháp, kế hoạch tiếp thị phù hợp
để từ đó tăng cơ hội đồng ý sử dụng dịch vụ ngân hàng từ khách hàng. Có nhiều cách
tiếp thị khác nhau, chẳng hạn các ngân hàng có thể tiếp thị qua e-mail để gửi cho
khách hàng những thông tin ưu đãi mới nhất về các dịch vụ cho vay ngắn hạn với lãi
suất cạnh tranh trên thị trường hoặc tiền gửi với lãi suất hấp dẫn hay các chương trình
dự thưởng đặc biệt...Việc tạo ra các sản phẩm và dịch vụ phù hợp cho từng phân khúc
khách hàng cụ thể sẽ giúp các ngân hàng nâng cao hình ảnh thương hiệu và tạo dựng
mối quan hệ tốt đối với khách hàng.
Thay đổi cách thức cung cấp dịch vụ đến khách hàng.
Hệ thống Dữ liệu lớn được xem là một hệ thống phức tạp liên kết với nhiều bộ phận
có các chức năng khác nhau, nhưng công việc chính của nó là giúp nhà điều hành có
thể đưa ra các quyết định dễ dàng hơn trên cơ sở phân tích các thông tin được cập
nhật từ hệ thống. Bất cứ khi nào thông tin giao dịch của khách hàng được nhập vào
35
hệ thống, hệ thống Dữ liệu lớn sẽ hỗ trợ sàng lọc tất cả dữ liệu và truyền tải hoặc cung
cấp dữ liệu cần thiết để phục vụ nhu cầu phân tích quy trình. Công cụ Big Data cho
phép các ngân hàng tối ưu hóa trong quy trình làm việc và tiết kiệm cả thời gian lẫn
các chi phí phát sinh. Đồng thời dữ liệu lớn cũng cho phép các tổ chức tài chính xác
định và khắc phục sự cố trước khi chúng ảnh hưởng đến khách hàng của họ.
Với thời đại công nghệ 4.0 hiện nay, các ngân hàng ngày nay có hàng nghìn cách để
tìm hiểu nhu cầu của khách hàng. Nhưng với công cụ phân tích của Big Data cho
phép người dùng khai thác tối ưu hơn nguồn tài nguyên thông tin sẵn có để phục vụ
nhu cầu phát triển kinh doanh doanh nghiệp. Muốn làm được điều này, đội ngũ nhân
viên ngân hàng cần được đào tạo kỹ năng phân tích và khai thác dữ liệu tốt. Điều này
sẽ tạo ra một giải pháp khả thi, ngay thời điểm hiện tại hoặc trong tương lai gần. Hiện
tại, các ngân hàng có nguồn vốn lớn đã có những kế hoạch rõ ràng để đầu tư hệ thống
dữ liệu lớn và nghiên cứu cách phân tích hiệu quả nguồn tài nguyên từ hệ thống Dữ
liệu lớn này. Từ việc hiểu được nhu cầu của khách hàng thông qua kết quả phân tích
hành vi người tiêu dùng, các ngân hàng cần phải tổ chức nhiều hơn các hoạt động nội
bộ, cải thiện dịch vụ kịp thời và kiểm soát chi phí hoạt động tốt nhất hoặc đưa ra giải
pháp tài chính đa tính năng cho khách hàng nhằm giữ chân khách hàng và thu lợi
nhuận cho doanh nghiệp.
Phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật
Dựa vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân hàng sẽ
có thể xác định hay nhận định được cảnh báo những bất thường xảy ra trong quá trình
hoạt động, cung cấp dịch vụ cho khách hàng. Big data sẽ cho phép các ngân hàng
đảm bảo rằng không có giao dịch trái phép nào được thực hiện, cung cấp mức độ an
toàn, nâng cao tiêu chuẩn bảo mật của toàn bộ ngành.
Kiểm soát rủi ro, minh bạch báo cáo
Ngoài việc phát hiện và ngăn chặn hành vi lừa đảo, vi phạm để bảo vệ lợi ích nguời
tiêu dùng các ngân hàng có thể ứng dụng Big data để đo lường, kiểm soát rủi ro khi
36
thực hiện các giao dịch. Các thuật toán big data còn giúp giải quyết các vấn đề về
tuân thủ quy định pháp luật và kế toán, kiểm toán và báo cáo tài chính minh bạch
nhằm hợp lý hóa các hoạt động của tổ chức từ đó giảm được chi phí quản lý.
3.2. Ứng dụng big data tại Ngân hàng TMCP Sài Gòn (SCB)
3.2.1. Giới thiệu về SCB
Ngân hàng TMCP Sài Gòn (SCB) được Thống đốc NHNN chính thức cấp Giấy phép
số 283/GP-NHNN về việc thành lập và hoạt động Ngân hàng TMCP Sài Gòn (SCB)
vào ngày 26/12/2011 trên cơ sở hợp nhất tự nguyện 3 ngân hàng: Ngân hàng TMCP
Sài Gòn (SCB), Ngân hàng TMCP Đệ Nhất (Ficombank), Ngân hàng TMCP Việt
Nam Tín Nghĩa (TinNghiaBank). Ngân hàng TMCP Sài Gòn (Ngân hàng hợp nhất)
chính thức đi vào hoạt động từ ngày 01/01/2012.
Trên cơ sở thừa kế những thế mạnh vốn có của 3 ngân hàng, cùng sự quyết tâm của
Hội đồng Quản trị, Ban điều hành, toàn thể CBNV, đặc biệt là sự tin tưởng và ủng hộ
của Quý Khách hàng, Cổ đông, đến nay, Ngân hàng TMCP Sài Gòn – SCB đã không
ngừng lớn mạnh, vươn lên vị thế Top 5 ngân hàng TMCP có quy mô lớn nhất Việt
Nam với tổng tài sản hơn 566.834 tỷ đồng, vốn điều lệ hơn 15.231 tỷ đồng tính đến
31/12/2019. Với 239 điểm giao dịch, hiện nay mạng lưới hoạt động của SCB đang
phủ rộng khắp 28 tỉnh/thành thuộc các vùng kinh tế trọng điểm của cả nước, cùng đội
ngũ nhân sự hơn 6.700 người. Tiềm lực tài chính vững mạnh, tốc độ tăng trưởng
nhanh, công nghệ hiện đại, danh mục các sản phẩm đa dạng cùng chất lượng dịch vụ
không ngừng được nâng cao, đây chính là nền tảng để SCB phát triển mạnh mẽ theo
định hướng trở thành ngân hàng bán lẻ - đa năng - hiện đại hàng đầu Việt Nam. Bên
cạnh cung cấp các giải pháp tài chính trọn gói, đáp ứng mọi nhu cầu của Khách hàng,
SCB tự hào mang lại giá trị và đảm bảo quyền lợi thiết thực cho Đối tác, Cổ đông;
cũng như xây dựng chế độ phúc lợi và môi trường làm việc tốt nhất cho đội ngũ
CBNV.
37
Với Tầm nhìn, Sứ mệnh và Giá trị cốt lõi đã được xác lập, trong quá trình hoạt động
kinh doanh SCB luôn trung thành với những cam kết giá trị bền vững. Trong năm
2019 SCB đã đạt được một số thành tựu sau: Ngân hàng bán lẻ sáng tạo nhất Việt
Nam, Ngân hàng đầu tư tốt nhất Việt Nam, Ngân hàng có các hoạt động vận hành
giao dịch thẻ tại nước ngoài tốt nhất năm 2019, Ngân hàng có dịch vụ khách hàng tốt
nhất Việt Nam, Ngân hàng có sản phẩm dịch vụ sáng tạo tiêu biểu, Ngân hàng xuất
sắt về ngoại hối Việt Nam, Ngân hàng bán lẻ tốt nhất Việt Nam, Top 10 Ngân hàng
TMCP uy tín,….
B. PHÂN TÍCH DỮ LIỆU BIG DATA
4.1. Số liệu phục vụ nghiên cứu
Như đã trình bày ở chương 1, số liệu phục vụ nghiên cứu cho đề tài được trích xuất
từ nguồn kho dữ liệu data warehouse của ngân hàng. Thời gian nghiên cứu của dữ
liệu là 12 tháng tính từ ngày 01/1/2019 đến ngày 31/12/2019. Khách hàng trong
nghiên cứu là các khách hàng hiện đang tham gia giao dịch tại SCB và có thời gian
tham gia dịch vụ trên 12 tháng, việc chọn này giúp loại bỏ những thông tin không
chính xác đối với những khách hàng có thời gian giao dịch dưới một năm, điều này
có thể làm nhiễm kết quả nghiên cứu. Số khách hàng trong nghiên cứu là khách hàng
đang tham gia giao dịch tại một phòng giao dịch của quận.
4.2. Thông tin giao dịch khách hàng
4.2.1. Đối với khách hàng tham gia dịch vụ vay
Kết quả thống kê mô tả trong nghiên cứu, giới tính khách hàng dường như không
khác biệt nhiều, theo biểu đồ 4.1, nam chiếm 55% và nữ chiếm 45% trong tổng số
khách hàng trong nghiên cứu. Điều này cho thấy, người nữ hiện tại đã có một vai trò
lớn hơn trong xã hội, có nguồn thu nhập, tự chủ tham gia dịch vụ, cũng như tự có tài
khoản ngân hàng cá nhân tại SCB.
Xét về trình độ học vấn, khách hàng có trình độ đại học chiếm 67% (hình 4.2), sau
đại học 7% (thạc sĩ và tiến sĩ). Thông tin này phần nào cho thấy, khách hàng tham
38
gia dịch vụ có một nhận thức nhất định, điều này cũng sẽ cho thấy mức độ thu nhập
ở chừng mực nào đó có thể được dự báo về mức thu nhập ổn định hơn. Kết quả này
sẽ là một thông điệp để các nhà làm chiến lược kinh doanh, marketing luôn có một
cẩn trọng trong nhận định sự hiểu biến, kiến thức đánh giá của khách hàng về chất
lượng dịch vụ của ngân hàng.
Nữ 45%
Nam 55%
Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.1: Thông tin giới tính khách hàng
Thạc sĩ 6%
Đại học 67%
Tiến sĩ 1%
Trung cấp 13%
Cao đẳng 13%
Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.2: Thông tin trình độ học vấn
39
Xét trên gốc độ nghề nghiệp, biểu đồ 4.3 đã thông tin, số khách hàng có vị trí lãnh
đạo cấp tầm trung và giám đốc chiếm 43.2%, nhân viên văn phòng chiếm 29%, công
nhân 27.6%. Tỷ lệ khách hàng thuộc nhóm đã hưu chiếm một tỷ lệ rất nhỏ 0.2%. Do
vậy, từ sau mục này, nghiên cứu sẽ chỉ tập trung vào vị trí việc làm của 4 nhóm: Giám
đốc, quản lý cấp trung, nhân viên văn phòng, và công nhân.
Biểu đồ 4.3: Nghề nghiệp của khách hàng
Hưu 0,2%
Giám đốc 22,0%
Công nhân 27,6%
Quản lý tầm trung 21,2%
Nhâ viên VP 29,0%
Nguồn: Số liệu big data của Ngân hàng
Xét trên loại khách hàng đang tham gia giao dịch tại ngân hàng nghiên cứu, số khách
hàng tiếp cận hướng đến giao dịch vay vốn tiêu dùng cá nhân chiếm 63%, khách hàng
tiếp cận thực hiện giao dịch thẻ tín dụng chiếm 34% và 3% nhóm khách hàng còn lại
tham gia vay vốn phục vụ kinh doanh gia đình (biểu đồ 4.4)
40
KH Hộ kinh doanh 3%
KH tiêu dùng cá nhân 63%
KH thẻ tín dụng 34%
Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.4: Loại khách hàng sử dụng dịch vụ tại ngân hàng
Như đã nêu trong số liệu được trích ra, số khách hàng trong nghiên cứu phải có thời
gian tham gia dịch vụ (length of stay) trên 12 tháng trở lên. Nếu phân thời gian tham
gia dịch vụ thành các nhóm thời gian, biểu đồ 4.5 cho thấy tỷ lệ số khách hàng có
thời gian tham gia giao dịch từ >12 – 31 tháng chiếm 37.5%, kế đến >31 – 45 tháng
chiếm 20.7% (biểu đồ 4.5).
Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.5: Thời gian tham gia dịch vụ của
Nếu kết hợp thời gian tham gia dịch vụ và loại khách hàng tham gia dịch vụ, biểu đồ
4.6 cho thấy đa số khách hàng có thời gian tham gia dịch vụ >12-31 tháng, số khách
hàng vay tiêu dùng cá nhân chiếm tỷ lệ lớn nhất, trong khi đó nhóm khách hàng có
thời gian tham gia dịch vụ >31 tháng đến 45 tháng có số lượng khách hàng thẻ tín
41
dụng. Điều này phần nào cho thấy số khách hàng sử dụng thẻ tín dụng có thời gian
gắn kết với SCB khá lâu trên 3 năm.
Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.6: Thời gian tham gia dịch vụ theo loại khách hàng
4.2.2. Thông tin khách hàng sử dụng thẻ
Có nhiều loại thẻ được sử dụng bởi khách hàng trong nghiên cứu. Như kết quả ở biểu
đồ 4.7, có 7 loại thẻ chính được khách hàng quan tâm và sử dụng phổ biến nhất, điển
hình VG (Visa Gold), VC (Visa Classis), MG (Master Gold), MS (Master Standard),
VP (Visa Platinum), VV (Viva Violet Card), và VA (Visa Auto Card), trong đó VG
và VC là hai loại thẻ được khách hàng sử dụng phổ biến nhất chiếm 46.55%. Kết quả
này, phần nào khẳng định VG và VC có tính năng công dụng và lợi ích hơn những
thẻ khác nên được khách hàng quan tâm nhiều hơn, trong khi đó thẻ VA có tỷ lệ sử
dụng thấp nhất 3.4%.
42
Nguồn: Số liệu big data của Ngân hàng
Ghi chú tên các loại thẻ: VG: VC: MG: MS: VP: VV: VA: OTHER:
VISA GOLD VISA CLASSIS MASTER GOLD MASTER STANDARD VISA PLATINUM VISA VIOLET CARD VISA AUTO CARD JP = JCB Platinum; JC = JCB Standard; JETSTAR = JCB Credit Jetstar; JG = JCB Gold; VB = Visa Business; MW = Master One World; PB = Master Passbook Card EEFA = UAFA Card.
Biểu đồ 4.7: Các loại thẻ được sử dụng bởi khách hàng
Loại thẻ sử dụng theo nghề nghiệp và thu nhập của khách hàng
Như được nêu trước đó, thẻ VG (Visa Gold) và VC (Visa Classics) được quan tâm
nhiều nhất bởi người sử dụng, trong đó nhóm giám đốc và nhóm công nhân sử dụng
nhiều VG với tỷ lệ sử dụng lần lượt 36.9% và 30.6% (bảng 4.1), trong khi đó nhân
viên văn phòng và công nhân quan tâm nhiều loại thẻ VC với tỷ lệ sử dụng lần lượt
là 37.23% và 35.07%.
Kết quả từ biểu đồ 4.8 cho thấy thu nhập bình quân trong tháng của khách sử dụng
VG và VC ở mức cao vừa phải. Trường hợp này, nhóm khách hàng sử dụng VG có
thu nhập 87.9 triệu đồng/tháng và của VC là 64.8 triệu đồng/tháng. Trong khi đó
nhóm khách hàng sử dụng loại thẻ VP có thu nhập cao nhất 347.5 triệu đồng/tháng,
những nhóm khách hàng nay chỉ chiếm 9% mà thôi.
43
Bảng 4.1: Loại thẻ sử dụng của khách hàng theo nghề nghiệp
Giám đốc
Nhân viên
Công nhân
Tổng
Loại thẻ MG
MS
1 0.23 20.00 0.03 0
OTHER
VA
VC
VG
VP
VV
178 41.78 20.53 5.05 35 8.77 4.04 0.99 85 22.97 9.80 2.41 8 6.67 0.92 0.23 59 7.50 6.81 1.67 316 36.96 36.45 8.96 165 50.46 19.03 4.68 21 8.64 2.42 0.60 867 24.58 100 24.58
Quản lý Hưu 104 24.41 12.95 2.95 112 28.07 13.95 3.18 90 24.32 11.21 2.55 25 20.83 3.11 0.71 157 19.95 19.55 4.45 190 22.22 23.66 5.39 62 18.96 7.72 1.76 63 25.93 7.85 1.79 803 22.77 100 22.77
32 7.51 3.43 0.91 214 0.00 53.63 0.00 22.94 6.07 0.00 129 1 0.27 34.86 20.00 13.83 3.66 0.03 45 0 0.00 37.50 4.82 0.00 1.28 0.00 293 2 0.25 37.23 40.00 31.40 8.31 0.06 91 1 0.12 10.64 9.75 20.00 2.58 0.03 0 9 2.75 0.00 0.96 0.00 0.26 0.00 120 0 0.00 49.38 0.00 12.86 3.40 0.00 933 5 0.14 26.45 100 100 0.14 26.45
111 26.06 12.08 3.15 38 9.52 4.13 1.08 65 17.57 7.07 1.84 42 35.00 4.57 1.19 276 35.07 30.03 7.83 257 30.06 27.97 7.29 91 27.83 9.90 2.58 39 16.05 4.24 1.11 919 26.06 100 26.06
426 100.00 12.08 12.08 399 100.00 11.31 11.31 370 100.00 10.49 10.49 120 100.00 3.40 3.40 787 100.00 22.31 22.31 855 100.00 24.24 24.24 327 100.00 9.27 9.27 243 100.00 6.89 6.89 3527 100 100 100
Diễn giải Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Total Count Row % Column % Total % Nguồn: Số liệu big data của Ngân hàng
Biểu đồ 4.8: Thu nhập bình quân của khách hàng theo loại thẻ sử dụng
Nguồn: Số liệu big data của Ngân hàng
44
4.2.3. Phân tích mô hình gian lận Fraud trong kinh doanh
Việc phân tích mô hình Fraud là dựa vào các nghiên cứu (Hunt & Krivanek, 1966).
Sẽ có ba bước được triển khai trong phân tích. Thứ nhất, phân tích sự gian lận dựa
trên hồ sơ đề xuất ban đầu tham gia dịch vụ tại ngân hàng SCB như được nêu ở
chương trước đó. Thứ hai, phân tích sự gian lận để tìm ra lỗi của việc đánh giá hồ sơ
ban đầu của khách hàng tham gia dịch vụ và đối chiếu với lịch sử tham gia giao dịch
của khách hàng. Khách hàng được đưa vào phân tích là khách hàng hiện đang tham
gia giao dịch tại SCB và có thời gian tham gia dịch vụ trên 12 tháng. Thứ ba là bước
kết hợp kết quả dự báo của bước 1 và bước 2, trên cơ sở đó đề xuất tập khách hàng
thuộc nhóm có gian lận trong bước 1 và bước 2.
a. Phân tích mô hình fraud dựa vào hồ sơ từ ban đầu
Các thông tin được chọn phục vụ cho mô hình Fraud gồm các thông tin được nêu
trong bảng 4.9. Trong đó, RANK_HOSO được xem là trường mục tiêu (target field),
trường này là kết quả của việc xếp hạng hồ sơ sau khi được thẩm định. Sau đó, trường
này sẽ được dự báo dựa trên các thông tin ban đầu hồ sơ được xét duyệt của 5,232
khách hàng. Thông tin của từng trường với thang đo như được nêu trong bảng. Thuật
toán ứng dụng để dự báo hành vi gian lận Fraud là phương pháp C5.0 thông qua phần
mềm IBM SPSS MOLDER.
45
STT Tên các trường 1.
RANK_HOSO
Định nghĩa trường Hồ sơ được xếp loại từ ban đầu
2.
NETINCOME
Thu nhập sau thuế
3.
TAISAN
Tài sản nhà ở
4.
LOAI_HOSO
Hồ sơ khách hàng
5.
QUANHE_CONGDONG Qua hệ cộng đồng
6.
HOC_VAN
Học vấn
7.
VITRI_CONGTAC
Chức vụ công việc
lý cấp
8.
GIA_CANH
Gia cảnh
Bảng 4.2: Thông tin các trường trong mô hình
Giá trị đo lường Trường mục tiêu (target field): TỐT/HIGH (68,0%); TRUNG BÌNH/AVERAGE (24,3%); THẤP (7,7%) Triệu đồng/tháng: Min= 5 triệu đồng; Max = 44.1 tỷ đồng; Trung bình = 119,9 triệu đồng Nhà sở hữu (78,4%; Ở cùng cha mẹ (16,0%); Nhà thuê (5,6%) Khách hàng mới (43,5%); Khách hàng cũ (22,3%); Khách hàng phát hành mới (17,9%); Khách hàng gia hạn/đánh giá lại (16,3%) Có uy tín (49,1%); Bình thường (13,7%); Unknown/không biết (37,3%) Đại học (68,0%); Trung cấp (11,5%); Thạc sĩ (6,9%); Cao đẳng (6,5%); Cao đẳng (5,9%); Tiến sĩ (1.3%); Không có thông tin (5,9%). Nhân viên văn phòng (24,48%); Công nhân (26,06%); Giám đốc (24,52%); Quản trung (22,795); Hưu (0.145) Thịnh vượng (41,7%); Bình thường (21,5%); Không rõ (36,8%)
Kết quả dự báo như chỉ ra ở biểu đồ 4.9 cho thấy thu nhập sau thuế (NETINCOME)
được xem có tầm quan trọng lớn nhất trong xếp loại hồ sơ, kế đến là giá trị tài sản
nhà ở của khách hàng, phần kế còn lại là nhóm khách hàng thuộc nhóm khách hàng
cũ hoặc mới, quan hệ cộng đồng, học vấn, vị trí công tác và gia cảnh.
Mô hình được dự báo giữa trên nhóm đào tạo Training (60% số quan sát) và nhóm
kiểm định (Testing) (40% số quan sát). Kết quả giữa hai nhóm cho thấy không có sự
khác biệt về tỷ lệ chính xác (Correct) trên 78%. Điều này cho thấy phương pháp được
chấp nhận để bước tiếp theo xác định nhóm gian lận.
46
Biểu đồ 4.9: Kết quả từ thuật toán C5.0
Biểu đồ 4.10: Đánh giá mô hình dựa trên nhóm Training/Đào tạo và Testing/Kiểm định
Như đã trình bày trước đó, trường mục tiêu là RANK_HOSO có ba nhóm và kết quả
dự báo từ C5.0 sẽ cho trường mục tiêu dự báo là $C_RANK_HOSO. So sánh giữa
hồ sơ được đánh giá ban đầu và sau khi dự báo, kết quả như được chỉ ra ở biểu đồ
4.11. Có 3 nhóm như được nêu trong biểu đồ 4.11. Mỗi nhóm có định nghĩa như sau:
47
(1) F1_F- : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá cao
(HIGH), nhưng sau khi dự báo hồ sơ này được thuật toán xếp loại lại hồ sơ thuộc
nhóm thấp (LOW) hoặc nhóm trung bình (AVER). Tương tự, hồ sơ ban đầu được
đánh giá mức trung bình (AVER) nhưng kết quả thuật toán cho rằng nhóm hồ hơ
này thuộc vào nhóm thấp (LOW). Trong trường hợp này, kết quả thống kê từ dự
báo chỉ ra Nhóm gian lận F- chiếm 2,4%.
(2) F1_F+ : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá thấp
(LOW) nhưng sau khi dự báo hồ sơ này được thuật toán xếp hồ sơ thuộc vào nhóm
trung bình (AVER) hoặc nhóm cao (HIGH). Tương tự hồ sơ ban đầu được xếp
hạng mức trung bình (AVER) nhưng được thuật cho kết quả dự báo nhóm này
thuộc nhóm đánh giá hồ sơ thấp (HIGH). Trong trường hợp này, kết quả thống kê
từ dự báo Nhóm gian lận F+ chiếm tỷ lệ 19,3%.
(3) F1_F0 : là nhóm không gian lận, hồ sơ ban đầu được xếp loại như thế nào, sẽ cho
kết quả dự báo như thế đó. Điển hình, ban đầu hồ sơ được xếp loại cao (HIGH) sau
khi dự báo cũng cho kết quả cao (HIGH), tương tự ban đầu được xếp loại thấp
(LOW) sau dự báo cho kết quả thấp (LOW). Trường hợp này, kết quả thống kê từ
dự báo Nhóm này chiếm tỷ lệ 78,3%.
Như vậy kết quả cho thông điệp có sự gian lận trong đánh giá hồ sơ chiếm 21,7% (bao
gồm F1_F- và F1_F+). Điều này có thể là do chủ đích của người tham gia trực tiếp thẩm
định hồ sơ khi thực hiện xếp loại. Việc xác định lại nhân viên hoặc ai tham gia trực tiếp
thẩm định hồ sơ là không khó, vì hệ thống có ghi nhận từng nhân viên trong trách nhiệm
thẩm định. Hoặc chúng ta có thể xem lại đặc điểm nhận khẩu học nằm trong nhóm có nguy
cơ gian lận.
Biểu đồ 4.11: Kết quả gian lận xét trên hồ sơ gốc ban đầu
48
Nguồn: Kết quả phân tích
b. Phân tích mô hình Fraud dựa vào lịch sử tham gia giao dịch.
Tương tự như mô hình gian lận Fraud ở bước 1, mô hình Fraud bước 2 hướng đến xác định gian lận sau khi khách hàng đã có hành vi giao dịch trên 12 tháng tại ngân hàng. Trường hợp này, RANK_HOSO cũng được xem là trường mục tiêu (target field), các trường hỗ trợ cho dự báo bao gồm lịch sử giao dịch: Số dư bình quân trong 12 tháng, Thời gian giao dịch gần nhất (R), tần suất giao dịch (F), giá trị giao dịch (M), lịch sử giao dịch của ngân hàng SCB so với các giao dịch với ngân hàng khác trong cùng thời gian nghiên cứu. Như ở bảng 4.3, lịch sử giao dịch của khách hàng đối với SCB so với các ngân hàng khác (đối thủ) thông tin như sau: (i) Không sử dụng dịch vụ ngân hàng SCB trước đó (DV NH SCB) trước đó (3,2%); (ii) Sử dụng dịch vụ ngân hàng SCB (DV NH SCB) (66,9%); (iii) Sử dụng DV NH SCB < NH khác (1.1%); (iv) Sử dụng DV NH SCB = NH khác (11.2%); (v) Sử dụng DV NH SCB > NH khác (17.6%). Tương tự, thuật toán ứng dụng để dự báo hành vi gian lận Fraud là phương pháp C5.0 thông qua phần mềm IBM SPSS MOLDER.
STT Tên các trường 1. RANK_HOSO
Định nghĩa trường Hồ sơ được xếp loại từ ban đầu
2.
DU_NO_BQ
Dư nợ của khách hàng
3.
RECENCY
4.
FREQUENCY
Thời gian giao dịch gần nhất Tần suất giao dịch
5.
MONETARY
Giá trị/Số dư giao dịch
6.
Bảng 4.3: Thông tin các trường trong mô hình theo hành vi giao dịch
Giá trị đo lường Trường mục tiêu (target field): TỐT/HIGH (68,0%); TRUNG BÌNH/AVERAGE (24,3%); THẤP (7,7%) Triệu đồng/tháng: Min= 5 triệu đồng; Max = 44.1 tỷ đồng; Trung bình = 119,9 triệu đồng Thứ bậc: 1= rất xa; 2 = xa; 3= vừa phải; 4=gần; 5 = rất gần Thứ bậc: 1= Rất ít; 2 = ít; 3 = vừa phải; 4= thường xuyên; 5 = Rất thường xuyên Thứ bậc: 1 = rất thấp; 2 = thấp; 3 = vừa phải; 4 = cao; 5= rất cao - Không sử dụng DV NH SCB trước
đó = 3,2%
SUDUNG_NHKHAC Thông tin khách hàng sử dụng dịch vụ ngân hàng SCB và ngân hàng khác.
- Sử dụng DV NH SCB = 66,9% - Sử dụng DV NH SCB < NH khác =
1.1%
- Sử dụng DV NH SCB = NH khác =
11.2%
- Sử dụng DV NH SCB > NH khác =
17,6%
49
Kết quả cho thấy thời gian giao dịch gần nhất (RECENCY) có tầm quan trọng lớn
nhất trong mô hình, kế đó là số dư nợ bình quân (DU_NO_BQ) trong thời gian giao
dịch, tần suất giao dịch (FREQUENCY), có sử dụng dịch vụ ngân hàng SCB và ngân
hàng khác (SUDUNG_NHKHAC) (biểu đồ 4.12).
Biểu đồ 4.12: Kết quả từ thuật toán C5.0 của bước 2
Tương tự thuật toán ở bước 1, RANK_HOSO là trường mục tiêu sẽ cho ra kết quả dự
báo của ba nhóm như ở biểu đồ 13, và kết quả dự báo từ C5.0 sẽ cho trường mục tiêu
dự báo là $C_RANK_HOSO. So sánh giữa hồ sơ được đánh giá ban đầu và sau khi
dự báo, kết quả như được chỉ ra ở biểu đồ 4.13. Mỗi nhóm có định nghĩa như sau:
(1) F2_F- : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá cao
(HIGH), nhưng sau khi dự báo dựa vào lịch sử giao dịch thông tin hồ sơ dự
báo được thuật toán xếp nhóm đánh giá thấp (LOW) hoặc nhóm trung bình
(AVER). Tương tự, hồ sơ ban đầu được đánh giá mức trung bình (AVER)
nhưng kết quả thuật toán cho rằng nhóm hồ hơ này thuộc vào nhóm thấp
(LOW). Như vậy theo trường hợp trên, kết quả dự báo cho thấy nhóm F2_F-
là nhóm gian lận của lịch sử so với hồ sơ ban đầu chiếm 2,2%.
50
(2) F2_F+ : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá thấp
(LOW) nhưng sau khi dự báo dựa vào lịch sử giao dịch của khách hàng, nhóm
này được xếp vào nhóm trung bình (AVER) hoặc nhóm cao (HIGH). Tương
tự áp dụng trường hợp hồ sơ ban đầu được xếp hạng mức trung bình (AVER)
nhưng được thuật toán cho kết quả dự báo nhóm này thuộc nhóm đánh giá cao
(HIGH) sau khi dự báo dựa vào lịch sử giao dịch của khách hàng. Theo kết
quả trên dự báo, nhóm F2_F+ là nhóm gian lận được đánh giá ban đầu thấp,
nhưng kết quả cho ra nhóm được đánh giá cao chiếm 26,9%.
(3) F2_F0 : là nhóm không có gian lận, hồ sơ ban đầu được xếp loại như thế nào,
sau quá trình lịch sử giao dịch cho kết quả dự báo như thế đó. Ví dụ ban đầu
hồ sơ của khách hàng được xếp loại tốt (HIGH), sau quá trình giao dịch, nhóm
khách hàng được cũng được thuật toán dự báo thuộc nhóm có hành vi tốt
(HIGH), tương tự áp dụng cho trường hợp nhóm trung bình (AVER) và nhóm
hồ sơ không tốt (LOW). Kết quả dự báo của trường hợp F2_F0 chiếm tỷ lệ
70,9%, đây là nhóm không có gian lận.
Như vậy kết quả cho thông điệp có sự gian lận trong đánh giá hồ sơ chiếm 29,1%
(bao gồm của F2_F- và F2_F+). Điều này có thể là do chủ đích của người tham gia
trực tiếp trong hồ sơ, hoặc do nhân viên trực tiếp thẩm định. Việc xác định lại nhân
viên hoặc ai tham gia trực tiếp trong đánh giá hồ sơ là không khó, vì hệ thống có ghi
nhận. Hoặc chúng ta có thể xem lại đặc điểm nhân khẩu học nằm trong nhóm có nguy
cơ gian lận.
Nguồn: Kết quả phân tích
Biểu đồ 4.13: Kết quả gian lận xét trên hồ sơ gốc ban đầu
51
c. Kết quả mô hình gian lận kết hợp từ mô hình bước 1 và bước 2
Như kết quả mô hinh Fraud của bước 1 dựa vào hồ sơ gốc và các thông tin cá nhân
của khách hàng tham gia giao dịch kết hợp với bước 2 được dự báo dựa vào hồ sơ
được đánh giá ban đầu được dựa báo dựa vào lịch sử giao dịch sau 12 tháng tham gia.
Kết quả kết hợp mô hình cho kết quả gian lận và không gian lận được xếp hạn như ở
bảng 4.4.
Bảng 4.4: Kết quả gian lận xét từ 2 mô hình gian lận
Kết hợp F1_F0 kết hợp với F2_F0 F1_F0 kết hợp với F2_F- F1_F0 kết hợp với F2_F+ F1_F- kết hợp với F2_F+ F1_F- kết hợp với F2_F- F1_F+ kết hợp với F2_F+ F1_F+ kết hợp với F2_F- F1_F- kết hợp với F2_F0 F1_F+ kết hợp với F2_F0 Kết quả gian lận Không có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Nhận định +++ + + ++ +++ +++ ++ + +
Dựa trên định nghĩa gian lận như nêu ở biểu đồ 4.14. Kết quả gian lận sau cùng được
minh họa ở bảng 4.5. Theo bảng dấu +++ tức chỉ mức độ gian lận rất cao. Nhóm có
++ và dấu + chỉ mức độ gian lận thấp hơn. Theo kết quả thống kê, nhóm khách hàng
được xác định không có biểu hiện sự gian lận chiếm 64% khách hàng, nhóm này có
độ tin cậy cao vì kết quả được dựa vào kết hợp từ bước 1&2. Trên cơ sở kết quả này
sẽ là một thông điệp vô cùng quan trọng giúp cho ngân hàng có định hướng cụ thể
trong thực hiện giải pháp khắc phục. Chẳng hạn, xuất ra tập khách hàng được xếp vào
nhóm có gian lận, ngân hàng sẽ lần được các hành vi của khách hàng, cũng như xác
định được nhân viên nào đã trực tiếp quản lý và thẩm định hồ sơ trên đó.
52
Biểu đồ 4.14: Kết quả Gian lận được xác định từ kết hợp hai mô hình
4.2.4. Thông tin giao dịch phân theo gian lận
Kết quả như được chỉ ra ở biểu đồ 4.15 cho thấy nhóm khách hàng được xem có tính
gian lận cao (YES_GIANLAN+++) có hạn mức bình quân trên 80 triệu đồng.. Trong
khi đó nhóm khách hàng được xếp vào gian lận vừa (YES_GIANLAN++) có hạn
mức cao nhất 120 triệu đồng. Có một lưu ý cho thấy, nhóm khách hàng được xếp vào
nhóm có gian lận thường có thời gian tham gia dịch vụ lâu nhất tại SCB từ 65-81
tháng (biểu đồ 4.15). Điều này có thể cho thấy, những khách hàng này có thể là những
nhóm khách hàng cũ. Một khi kinh nghiệm của khách hàng càng nhiều trong giao
dịch, có thể chỉ ra những phát sinh trong gian lận từ nhân viên trong xét duyệt hồ sơ
hoặc từ khách hàng trong khai báo thông tin và hồ sơ tiếp cận dịch vụ vay vốn cũng
như dịch vụ thẻ tại SCB.
Biểu đồ 4.14: Hạn mức sử dụng theo nhóm khách hàng
53
Biểu đồ 4.15: Nhóm khách hàng xếp loại theo
Ghi chú:
LIFETIME: thời gian tham gia dịch vụ KQ_GIAN_LAN: Kết quả khách hàng được xếp theo nhóm gian lận
Tóm tắt chương:
Kết quả phân tích dữ liệu của chương đã đem đến một bức tranh rõ nét về thông tin,
đặc điểm tham gia dịch cụ của khách hàng, trong đó có chỉ ra đặc điểm nhân khẩu
học và loại dịch vụ mà khách hàng tham gia. Nhiều hơn sự mong đợi trong phân tích,
kết quả đã chỉ ra tỷ lệ khách hàng được đưa vào nhóm mà phía ngân hàng SCB cần
quan tâm hơn để kiểm soát về rủi ro trong gian lận chiếm đến 36%. Tỷ lệ có thể nói
còn khá cao. Nên phía SCB cần lưu ý hơn hướng đến chỉnh đốn trong nội bộ và kiểm
soát kỷ hơn về lịch sử giao dịch của khách hàng.
Có thể nói, một khi khách hàng có thời gian tham gia dịch vụ lâu hơn, dường như
được dự báo có tính gian lận cao hơn, đặc biệt là nhóm khách hàng có thời gian tham
gia dịch vụ từ >65 - 81 tháng và xảy ra ở những khách hàng có hạn mức cao trong
tiếp cận dịch vụ tín dụng và thẻ.
54
CHƯƠNG 4: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC
A. KẾT LUẬN
Ứng dụng nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong
hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ
được thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng
đang tham gia giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có
thời gian tham gia dịch vụ từ trên 12 tháng trở lên. Điều này giúp việc hạn chế những
thông tin nhiễu đối với những khách hàng có thời gian tham gia dịch vụ dưới 12
tháng. Điều này có nghĩa là, một khi thời gian tham gia dịch vụ càng lâu, hành vi
khách hàng được sử dụng trong phân tích, cho kết quả dự báo sẽ chính xác hơn.
Qua thuật toán sử dụng sau hai lần hướng đến xác định sự gian lận, kết quả đã cho ra
trong dịch vụ ngân hàng của SCB có khoảng 36% khách hàng được đưa vào nhóm
có tính gian lận, trong đó gian lận đến từ hai phía. Phía từ nhân viên, người trực tiếp
thẩm định hồ sơ, hoặc vô tình, hoặc có chủ đích thì vấn đề vấn còn ở dấu chấm hỏi.
Với tỷ lệ khách hàng được xem không có hàm ý về gian lận 64% tỷ lệ này thật sự vẫn
chưa cao, nên phía SCB cần phải có nhiều việc phải đưa ra các giải pháp để kiểm
soát.
Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách
hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía.
Do vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên. Các
lỗ hổng trong phân tích có thể bao gồm những nội dung tóm tắt trong các điểm chính
như sau:
+ Thứ 01: khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân
hàng, nhưng nhân viên tiếp nhận và cấp thẩm quyền cao nhất, duyệt sản phẩm dịch
vụ đó, không phát hiện ra hồ sơ mang tính rủi ro cao hoặc trung bình từ khách hàng.
+ Thứ 02 : khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho
ngân hàng, kế hợp với nhân viên tiếp nhận thông đồng, dựa vào lỗ hổng của cấp thẩm
55
quyền cao nhất: như tin tưởng nhân viên cấp dưới, không xem kỷ hồ sơ khách hàng
cung cấp, duyệt sản phẩm dịch vụ đó, không phát hiện ra hồ sơ mang tính rủi ro trung
bình hoặc thấp từ khách hàng và nhân viên tiếp nhận.
+ Thứ 03 : khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân
hàng, kế hợp với lãnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông
đồng, dựa vào chức vụ quyền hạng chỉ đạo làm sai trái qui định ban hành duyệt sản
phẩm dịch vụ đó, phát hiện ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách
hàng và lãnh đạo cấp thẩm quyền phê duyệt sản phẩm đó.
+Thứ 04 : khách hàng cung cấp hồ sơ ban đầu cho ngân hàng, nhân viên tiếp nhận
khách hàng, dựa vào lỗ hổng của cấp thẩm quyền cao nhất: như tin tưởng nhân viên
cấp dưới, nhân viên cấp dưới sử dụng thông tin người khác không đúng như khách
hàng cung cấp, qua mặt khách hàng và lãnh đạo, lãnh đạo không xem kỷ hồ sơ khách
hàng cung cấp có dấu hiệu sai phạm, không đúng qui định sản phẩm ban hành, duyệt
sản phẩm dịch vụ đó, không phát hiện ra hồ sơ mang tính rủi ro thấp từ nhân viên
tiếp nhận.
Cho dù nhân viên có tài ba đi mấy, một khi chủ đích gian lận của khách hàng có thực
hiện, điều này sẽ xảy ra là thường tình. Điều này có thể xảy ra một khi khách hàng vì
lý do cần tiếp cận dịch vụ của ngân hàng, họ sẵn sàng làm lệch hồ sơ, hoặc gia hạn
không trung thực tìm một ý định gian lận trong tăng điểm hồ sơ cho vay vốn, hoặc
cho dịch vụ thẻ. Tuy nhiên để kiểm chứng điều này, lịch sử giao dịch của khách hàng
sau 12 tháng mô hình dự báo sẽ giúp chúng ta dự báo được những khách hàng thuộc
nhóm trung thực/không gian lận và nhóm có gian lận.
Tóm lại kết quả nghiên cứu là một ý tưởng khá mới trong nghiên cứu, mô hình được
ứng dụng là áp dụng từ các phương pháp do các nghiên cứu trước thực hiện. Nghiên
cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào số liệu
thực tế của SCB. Kết quả nghiên cứu có một đóng góp cực kỳ quan trọng cho việc
xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía nhân viên của công
ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.
56
B. CÁC GIẢI PHÁP HẠN CHẾ LỖ HỔNG VÀ GIAN LẬN TRONG
KINH DOANH
Căn cứ vào kết quả phân tích từ mô hình gian lận Fraud từ nguồn số liệu big data hiện
có tại SCB, đề tài đã phát hiện ra hai lỗ hổng có thể tạo ra những gian lận trong hoạt
động tín dụng tại SCB. Sự gian lận có thể xảy ra từ phía nhân viên tham gia trực tiếp
thẩm định hồ sơ và gian lận đến từ chủ đích của khách hàng. Việc phân tích này là
dựa vào số liệu hồ sơ gốc ban đầu do phía khách hàng cung cấp và dựa vào lịch sử
tham gia giao dịch của khách hàng có trên 12 tháng tham gia dịch vụ tại SCB. Những
gian lận
Xuất phát từ những kết quả đỏ. Nội dung bài viết sẽ đưa ra các giải pháp như sau.
(1) Giải pháp áp dụng đến các nhân viên tham gia trực tiếp thẩm định hồ sơ
Phía ngân hàng, cần hiệu chỉnh lại phương pháp hoặc qui trình trong đánh giá hồ sơ
của khách hàng, trong đó cần nhắc nhỡ nhân viên phải thực hiện nghiêm túc qui trình
thẩm định:
Tiếp nhận hồ sơ vay của khách hàng vay tín chấp Thẩm định vay Quyết định
khoản vay Giải ngân/triển khai dịch vụ khách hàng
Để thực hiện qui trình trên đạt một chuẩn mực, nhân viên được tuyển dụng cho thẩm
định cực kỳ quan trọng, điều này liên quan đến năng lực, kinh nghiệm, đặc biệt là tư
duy nhận định vấn đề.
Đối với những khách hàng cũ, người nhân viên cũng nên có thông tin tóm tắt lại lịch
sử giao dịch của khách hàng trong quá khứ, điều này giúp việc đánh giá chính xác
hơn.
(2) Giải pháp quan tâm trong kiểm soát, đánh giá hồ sơ, giám sát hành vi
tham gia dịch vụ của khách hàng
Một khi tiếp nhận thông tin hoặc các hồ sơ có liên quan, nhân niên nên bỏ qua các
yếu tố quen biết. Phía khách hàng phải cung cấp các thông tin đầy đủ, giúp minh
chứng tính pháp lý của cá nhân, các hợp đồng công việc, các nguồn thu có minh
57
chứng và hợp pháp. Tuy nhiên điều quan trọng hơn, hồ sơ của khách hàng cũng cần
có sự lần tìm của người nhân viên đánh giá về lịch sử tín dụng của khách hàng, thái
độ đi vay vốn của khách.
Đối với những khách hàng cũ, phía công ty cũng nên trích ngang ra hành vi tham gia
dịch vụ của khách hàng trước đó, điều này giúp cho việc đánh giá chính xác hơn hạnh
kiểm của khách hàng khi tham gia dịch vụ.
Do kết quả cho thấy, những khách hàng có thời gian tham gia dịch vụ lâu hơn (>65 –
81 tháng) và có hạn mức tín dụng và mức thẻ cao có tiềm ẩn gian lận lớn hơn. Trên
cơ sở này, phái SCB cần có phân loại khách hàng theo các nhóm khác biệt, điều này
giúp cho việc giám sát hành vi giao dịch, cũng như hồ sơ được tốt hơn, góp phần hạn
chế rủi ro có thể xảy ra về thẩm định lệch hoặc không đúng. Điều này có thể làm mất
đi lòng tin của khách hàng có qui mô hoặc hạn mức lớn. Tuy nhiên cũng cần đề phòng
trong việc chạy theo chỉ tiêu cho vay đối với các khách hàng có nhu cầu hạn mức lớn,
ngân hàng có thể gặp những rủi ro không nhỏ nếu không có những đánh giá và nhận
định đúng.
(3) Nâng cao năng lực nhân viên
Thưc hiện đào tạo lại cán bộ/nhân viên có liên quan về nghiệp vụ đánh giá, nghiệp
vụ thẩm định hồ sơ và cách đánh giá hồ sơ quá khứ cũng như lịch sử giao dịch của
khách hàng. Thêm vào đó, SCB cần tiêu chuẩn hoá đội ngũ nhân viên trong tham gia
vào quá trình đàm phán, hướng dẫn trực tiếp khách hàng.
Ngành ngân hàng cũng nhận thức được rằng thách thức trong quá trình hội nhập ngày
càng lớn về công nghệ thông tin, big data và phương pháp khai thác dữ liệu lớn big
data, điều này góp phần vào việc tận dụng cơ hội để phát triển, qua đó nâng cao vị
thế, sức cạnh tranh của hệ thống ngân hàng trong thị trường cạnh tranh, đặc biệt có
các đối thủ từ các ngân hàng quốc tế.
Cần làm việc với các nhà khoa học dữ liệu để tạo điểu kiện cho các nhân viên được
đào tạo về kỹ năng khai phá dữ liệu hướng đến phân tích hành vi khách hàng dựa trên
nguồn gốc kho dữ liệu data warehouse hiện có. Hoặc có thể mời các chuyên gia tư
58
vấn từ các trường/viện hoặc tổ chức có liên quan về khoa học dữ liệu để SCB có điều
kiện hiểu thêm về giá trị dữ liệu hoặc những vấn đề cần đầu tư trong tương lai.
C. PHÁT TRIỂN CÁC DỊCH VỤ CHO VAY
Mô hình Fraud đã giúp cho việc xác định tỷ lệ khách hàng không gian lận chiếm 64%
sau hai lần dự báo dựa vào thuật toán. Đây có thể nói, nhóm khách hàng này cho một
niềm tin lớn để ngân hàng hướng đến mở rộng, chào mời khách hàng cho những dịch
vụ tín dụng thêm vào, hoặc các sản phẩm bán chéo để khai thác tiềm năng tiêu dùng
với mức rủi ro ít nhất.
TÀI LIỆU THAM KHẢO
Doğan, O., Ayçin, E., & Bulut, Z. A. (2018). Customer Segmentation by Using
RFM Model and Clustering Methods: A Case Study in Retail Industry.
International Journal of Contemporary Economics and Administrative
Sciences, 8(1), 1–19. Retrieved from www.ijceas.com
Eshghi, A., & Kargari, M. (2019). Introducing a new method for the fusion of fraud
evidence in banking transactions with regards to uncertainty. Expert Systems
with Applications, 121, 382–392. https://doi.org/10.1016/j.eswa.2018.11.039
Hunt, E., & Krivanek, J. (1966). The effects of pentylenetetrazole and
methylphenoxypropane on discrimination learning. Psychopharmacologia, 9,
1–16. https://doi.org/10.1007/BF00427700
Khajvand, M., & Tarokh, M. J. (2011). Estimating customer future value of
different customer segments based on adapted RFM model in retail banking
context. Procedia Computer Science, 3, 1327–1332.
https://doi.org/10.1016/j.procs.2011.01.011
Wu, J., & Lin, Z. (2005). Research on customer segmentation model by clustering.
ACM International Conference Proceeding Series, 316–318.
https://doi.org/10.1145/1089551.1089610