BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

---------------

LÊ VĂN PHÚ

ỨNG DỤNG BIG DATA PHÂN TÍCH LỖ HỔNG TÍN DỤNG

CHO VAY VÀ GIẢI PHÁP HẠN CHẾ: TRƯỜNG HỢP CỦA

NGÂN HÀNG TMCP SÀI GÒN (SCB)

LUẬN VĂN THẠC SĨ KINH TẾ

Thành Phố Hồ Chí Minh – Năm 2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

---------------

LÊ VĂN PHÚ

ỨNG DỤNG BIG DATA PHÂN TÍCH LỖ HỔNG TÍN DỤNG

CHO VAY VÀ GIẢI PHÁP HẠN CHẾ: TRƯỜNG HỢP CỦA

NGÂN HÀNG TMCP SÀI GÒN (SCB)

Chuyên ngành: Quản trị kinh doanh

( Hệ điều hành cao cấp )

Mã số: 8340101

LUẬN VĂN THẠC SĨ KINH TẾ

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS. TỪ VĂN BÌNH

Thành Phố Hồ Chí Minh – Năm 2020

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu khoa học độc lập của riêng tôi. Các số

liệu sử dụng phân tích trong luận án có nguồn gốc rõ ràng, đã công bố theo đúng quy định.

Các kết quả nghiên cứu trong luận án do tôi tự tìm hiểu, phân tích một cách trung thực,

khách quan và phù hợp với thực tiễn của Việt Nam. Các kết quả này chưa từng được công

bố trong bất kỳ nghiên cứu nào khác.

Người thực hiện đề tài

MỤC LỤC

TRANG PHỤ BÌA

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG BIỂU

DANH MỤC CÁC BIỂU ĐỒ

TÓM TẮT

ABSTRACT

MỞ ĐẦU ............................................................................................................................ 1

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU .................... 1

1.1. Lý do chọn đề tài .......................................................................................................... 1

1.2. Mục tiêu nghiên cứu ..................................................................................................... 2

1.3. Phương pháp nghiên cứu .............................................................................................. 3

1.3.1. Đối với số liệu phục vụ nghiên cứu .......................................................................... 3

1.3.2. Các khái niệm tiếp cận trong nghiên cứu .................................................................. 6

1.3.3. Phạm vi nghiên cứu của luận văn ............................................................................. 7

1.3.4. Kết cấu của luận văn ................................................................................................. 7

CHƯƠNG 2: CƠ SỞ LÝ LUẬN ...................................................................................... 8

2.1. Big Data ....................................................................................................................... 8

2.2. Các ứng dụng của big data trong lĩnh vực ngân hàng ................................................ 14

2.3. Khai phá dữ liệu (Data Mining) ................................................................................. 19

2.4. Hành vi tiêu dùng ....................................................................................................... 20

2.4.1. Định nghĩa ............................................................................................................... 20

2.4.2. Hành vi tiêu dùng dựa trên phương pháp RFM ...................................................... 23

2.5. Mô hình đề xuất cho nghiên cứu ................................................................................ 24

CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ PHÂN TÍCH DỮ LIỆU ................................................................................................................................. 28

A. BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SCB ............................................... 28

3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng .................................. 28

3.1.1. Big data ................................................................................................................... 28

3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng .................................................. 29

3.2. Ứng dụng big data tại Ngân hàng TMCP Sài Gòn (SCB) ......................................... 36

3.2.1. Giới thiệu về SCB ................................................................................................... 36

B. PHÂN TÍCH DỮ LIỆU BIG DATA ......................................................................... 37

4.1. Số liệu phục vụ nghiên cứu ........................................................................................ 37

4.2. Thông tin giao dịch khách hàng ................................................................................. 37

4.2.1. Đối với khách hàng tham gia dịch vụ vay ............................................................... 37

4.2.2. Thông tin khách hàng sử dụng thẻ .......................................................................... 41

4.2.3. Phân tích mô hình gian lận Fraud trong kinh doanh ............................................... 44

4.2.4. Thông tin giao dịch phân theo gian lận ................................................................... 52

CHƯƠNG 4: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC ...................................... 54

A. KẾT LUẬN ................................................................................................................ 54

B. CÁC GIẢI PHÁP HẠN CHẾ LỖ HỔNG VÀ GIAN LẬN TRONG KINH DOANH ............................................................................................................................ 56

C. PHÁT TRIỂN CÁC DỊCH VỤ CHO VAY ............................................................... 58

TÀI LIỆU THAM KHẢO

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Từ viết tắt Nguyên nghĩa

SCB Ngân hàng Thương Mại Cổ Phần Sài Gòn

RFM Recency, Frequency, Monatery

DANH MỤC CÁC BẢNG BIỂU

Table 1.1: Information of variables concerned ................................................................... 4

Bảng 2.1. Các bước trong quá trình khai phá dữ liệu ....................................................... 19

Bảng 2.4. Bảng mô tả điểm theo RFM ............................................................................. 24

Bảng 4.1: Loại thẻ sử dụng của khách hàng theo nghề nghiệp ......................................... 43

Bảng 4.2: Thông tin các trường trong mô hình ................................................................. 45

Bảng 4.3: Thông tin các trường trong mô hình theo hành vi giao dịch ............................ 48

Bảng 4.4: Kết quả gian lận xét từ 2 mô hình gian lận ....................................................... 51

DANH MỤC CÁC BIỂU ĐỒ

Biểu đồ 2.5: Tiến trình tiếp cận phục vụ mô hình fraud ................................................... 25

Biểu đồ 4.1: Thông tin giới tính khách hàng .................................................................... 38

Biểu đồ 4.2: Thông tin trình độ học vấn ........................................................................... 38

Biểu đồ 4.3: Nghề nghiệp của khách hàng ........................................................................ 39

Biểu đồ 4.4: Loại khách hàng sử dụng dịch vụ tại ngân hàng .......................................... 40

Biểu đồ 4.5: Thời gian tham gia dịch vụ của .................................................................... 40

Biểu đồ 4.6: Thời gian tham gia dịch vụ theo loại khách hàng ........................................ 41

Biểu đồ 4.7: Các loại thẻ được sử dụng bởi khách hàng................................................... 42

Biểu đồ 4.8: Thu nhập bình quân của khách hàng theo loại thẻ sử dụng ......................... 43

Biểu đồ 4.9: Kết quả từ thuật toán C5.0 ............................................................................ 46

Biểu đồ 4.10: Đánh giá mô hình dựa trên nhóm Training/Đào tạo và Testing/Kiểm định .................................................................................................................................... 46

Biểu đồ 4.11: Kết quả gian lận xét trên hồ sơ gốc ban đầu............................................... 47

Biểu đồ 4.12: Kết quả từ thuật toán C5.0 của bước 2 ....................................................... 49

Biểu đồ 4.13: Kết quả gian lận xét trên hồ sơ gốc ban đầu............................................... 50

Biểu đồ 4.14: Kết quả Gian lận được xác định từ kết hợp hai mô hình............................ 52

Biểu đồ 4.14: Hạn mức sử dụng theo nhóm khách hàng .................................................. 52

Biểu đồ 4.15: Nhóm khách hàng xếp loại theo ................................................................ 53

TÓM TẮT

Thông qua nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong

hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ được

thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng đang tham gia

giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có thời gian tham giao

dịch vụ từ trên 12 tháng trở lên. Điều đó cho kết quả dự báo sẽ chính xác hơn.

Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách

hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía. Do

vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên và cấp thẩm

quyền phê duyệt sản phẩm đó. Các lỗ hổng trong phân tích có thể bao gồm những nội dung

tóm tắt trong các điểm chính như sau:

- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng,

nhưng nhân viên tiếp nhận & cấp thẩm quyền cao nhất, không phát hiện hồ sơ rủi ro.

- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho Ngân

hàng, kế hợp với nhân viên tiếp nhận thông đồng, cấp thẩm quyền cao nhất không phát

hiện hồ sơ rủi ro.

- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, kế

hợp với lảnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông đồng, phát hiện

ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách hàng & lãnh đạo cấp thẩm quyền

phê duyệt sản phẩm đó. …vv

Nghiên cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào

số liệu thực tế của một ngân hàng thương mại. Kết quả nghiên cứu có một đóng góp cực

kỳ quan trọng cho việc xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía

nhân viên của công ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.

ABSTRACT

The use of Big data in analyzing and identifying credit frauds is a novelty of this study,

through the application of C5.0 algorithm on 2.572 customers who were transacting with

the Sai Gon Joint Stock Commercial Bank (“SCB”). The customers selected for the study

had transaction histories of more than 12 months, which allows for more accurate

forecasts.

However, we also acknowledge that the criteria to evaluate a customer’s credit

applications are developed by the bank through a process that incorporates inputs from

multiple parties. Therefore, in the event a credit application is misevaluated, it is partially

the responsibilities of the staff and approving authority. In summary, the gaps in credit

evaluation may include the following:

- The customer commits fraud in the credit application submitted to the bank, but the

receiving staff and the highest authority do not detect the credit risk.

- The customer commits fraud in the credit application submitted to the bank, with the

collusion of the receiving staff, but the highest authority does not detect the credit risk.

- The customer commits fraud in the credit application submitted to the bank, but the

highest authority assesses a low credit risk and connives at the red flags, approving the

application.

This study is a practical succession, based on which the Fraud model is applied to the

actual data of a commercial bank. The results of which make a tremendously important

contribution to the development of solutions to mitigate the fraud risks attributed to the

bank’s employees and its customers. Suggested solutions are outlined in the next section.

1

MỞ ĐẦU

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU

1.1. Lý do chọn đề tài

Nhu cầu ngày càng cao của khách hàng là bài toán thách thức cần lời giải đáp của

doanh nghiệp nói chung và ngành ngân hàng nói riêng. Điều này đòi hỏi ngân hàng

hay doanh nghiệp phải thay đổi chiến lược phát triển theo hướng đa dạng hóa tiện ích

của các dòng sản phẩm, dịch vụ và chú trọng công tác chăm sóc khách hàng. Thực

tiễn chỉ ra rằng nguồn dữ liệu hiện hữu của một tổ chức kinh doanh là một tài nguyên

quan trọng, việc phân tích nguồn tài nguyên này phần nào giúp việc đơn giản hóa quá

trình giám sát và tìm hiểu nhu cầu khách hàng một cách hiệu quả. Với nguồn dữ liệu

lớn sẵn có, cụ thể là nguồn số liệu từ big data (tạm dịch là dữ liệu lớn), các ngân hàng

có thể tự khai thác thông tin để tiếp tục theo dõi hành vi tiêu dùng của khách hàng

trong tương lai, từ đó đưa ra chiến lược, chính sách phù hợp. Quá trình theo dõi đánh

giá hồ sơ khách hàng dựa vào thông tin hiện có hoặc đặc điểm khách hàng sẽ giúp

ngân hàng giảm thiểu được rủi ro đến mức nhỏ nhất. Điều này góp phần trong khai

thác hiệu quả đối tượng khách hang, đảm bảo vị thế cạnh tranh trên thị trường.

Gần đây ngân hàng SCB không ngừng nỗ lực trong việc đẩy mạnh phát triển công

nghệ số, nâng cao chất lượng dịch vụ, đa dạng hóa sản phẩm với tính bảo mật cao,

cung cấp các giải pháp tài chính hiệu quả, chuyên nghiệp hóa công tác chăm sóc

khách hàng. Bên cạnh những cơ hội phát triển, ngân hàng cũng phải đối mặt với nhiều

bài toán thách thức của thị trường. Mức độ cạnh tranh ngày càng gay gắt giữa các

ngân hàng là một trong những thách thức đầu tiên và đầy khó khăn mà không SCB

phải tìm cách giải quyết. Đặc biệt, sự liên kết và sát nhập giữa Ngân hàng ngoại với

Ngân hàng nội đã và đang gây thêm nhiều khó khăn hơn trong việc cạnh tranh, bởi

sự liên kết này sẽ chiếm ưu thế hơn với sản phẩm dịch vụ có chất lượng cao, kinh

nghiệm chuyên nghiệp, năng lực quản trị tốt và mạng lưới toàn cầu cùng sự am hiểu

đặc thù kinh tế tại địa phương. Hai là, nhu cầu của khách hàng ngày một tăng cao,

đòi hỏi Ngân hàng phải đáp ứng thường xuyên việc tối ưu hóa các sản phẩm dịch vụ,

2

nâng cao chất lượng dịch vụ, quy trình, thủ tục đơn giải, nhanh chóng và hướng về

mục tiêu chất lượng trong kinh doanh.

Trong những năm gần đây, SCB đã chi ra một khoảng không nhỏ đầu tư hệ thống lưu

trữ dữ liệu. Đến thời điểm hiện tại, nguồn dữ liệu lưu trữ trong các data warehouse

đã trở thành một nguồn big data. Tuy nhiên việc khai phá dữ liệu từ nguồn big data

đang là bài toán không dễ cho các bộ phận có liên quan. Điều này sẽ dễ dẫn đến tài

nguyên về dữ liệu được đầu tư không phục vụ lợi ích lớn. Thực tế, một khi nguồn dữ

liệu big data được khai thác tốt, là một lợi thế trong nâng cao chất lượng cạnh tranh,

giảm chi phí đáng kể trong phân tích hành vi khách hàng.

Để ngân hàng hiểu hơn về hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách

hàng, việc phân tích hành vi khách hàng từ nguồn dữ liệu big data là cực kỳ quan

trọng. Điều này không những góp phần vào việc xác định lại phân khúc thị trường để

ngân hàng có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ

hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn

chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới. Đây là

lý do nghiên cứu của đề tài sẽ hướng đến chủ đề “Ứng dụng big data phân tích lỗ

hổng tín dụng cho vay và giải pháp hạn chế: trường hợp của ngân hàng TMCP Sài

Gòn”. Đề tài này có một tiếp cận mới trên nguồn dữ liệu big data giúp việc phân tích

lỗ hổng trong xét duyệt hồ sơ đánh giá cho vay khách hàng, còn giúp công ty định vị

lại những giải pháp gắn với hành vi đang kỳ vọng của khách hàng hạn chế những rủi

ro trong tín dụng.

1.2. Mục tiêu nghiên cứu

- Đánh giá đặc điểm tiếp cận vốn vay của khách hàng

- Phân tích những lỗ hổng trong việc thực hiện xét duyệt hồ sơ cho vay

- Phân tích hành vi tham gia giao dịch hướng đến xây dựng những giải pháp phù

hợp giúp chăm sóc khách hàng hiệu quả, hạn chế rủi ro trong tín dụng.

3

1.3. Phương pháp nghiên cứu

1.3.1. Đối với số liệu phục vụ nghiên cứu

Nguồn dữ liệu phục vụ nghiên cứu luận văn được trích xuất từ nguồn Big Data của

ngân hàng. Nguồn này được chứa trong các hệ thống lưu trữ của SCB. Việc xuất dữ

liệu được thực hiện từ bộ phân IT, của CRM (hệ thống thu thập và quản lý thông tin

khách hàng), của kho dữ liệu (data warehouse) và portal...Nguồn thông tin này đã ghi

lại những lịch sử giao dịch của khách hàng trong thời gian qua. Mặc dù số liệu không

thuộc dạng khảo sát, tuy nhiên việc sử dụng nguồn dữ liệu Big Data này được xem

như là một xu hướng mới trong việc nghiên cứu các vấn đề kinh tế trong kỷ nguyên

công nghệ thông tin phát triển. Nguồn tài nguyên từ Big Data phản ánh một cách

trung thực nhất về hành vi và lịch sử tiêu dùng của khách hàng theo thời gian. Qua

đó, kết quả của quá trình nghiên cứu sẽ mang độ tin cậy cao hơn. Tuy nhiên, nguồn

tài nguyên này được cung cấp từ phía Ngân hàng nên cần có tính bảo mật cao, vì thế

nghiên cứu này tác giả đề xuất phần dữ liệu sẽ không được công bố rộng rãi.

Số liệu được trích xuất có nhiều nguồn khác nhau, bộ phận chăm sóc khách hàng, bộ

phận cho vay, khách hàng thẻ, khách hàng tiền gửi. Tuy nhiên trong nghiên cứu, số

liệu cho vay sẽ được tập trung. Để hạn chế những thông tin nhiễu, các khách hàng

được chọn đưa vào nghiên cứu có thời gian tham gia dịch vụ trên 12 tháng. Thời gian

nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/1/2019 đến

ngày 31/12/2019. Thời gian đưa vào nghiên cứu mỗi mã khách hàng có nhiều dòng

thông tin, nói cách khác mỗi một dòng là một giao dịch của khách hàng. Việc xác

định số lần giao dịch của mỗi khách hàng dựa vào mã khách hàng thống kê từ hệ

thống báo cáo. Các đối tượng khách hàng trong nghiên cứu là khách hàng có tham

gia giao dịch trong thời gian nghiên cứu trên, công cụ được sử dụng hỗ trợ phục vụ

phân tích là SPSS Modeler 18.

Kết quả thống kê nhanh vể số liệu phục vụ cho luận văn này có số dòng 128.290

dòng, tương đương với 3.572 khách hàng. Số lượng 25 biến/field được trích ra từ dữ

4

liệu big data được đưa vào nghiên cứu. Thông tin các biến và giá trị thang đo có thể

được thấy ở bảng 1.1.

Table 1.1: Information of variables concerned

Định nghĩa Thang đo Tên các biến/ trường

1. CIF ID Khách hàng

2. Branch ID của chi nhánh

3. No.document ID của tài liệu KH

4. Type of customer Loại khách hàng vay Biến định danh

+ Khách hàng tín dụng thẻ

+ Khách hàng cá nhân

+ Khách hàng kinh doannh gia đình

5. Access date Ngày đăng ký dịch vụ của khách hàng Ngày

6. Approved date Ngày hồ sơ vay được duyệt Ngày

7. Document score Điểm hồ sơ vay do nhân viên đánh giá Biến liên tục

8. Gender Giới tính khách hàng Biến định danh

9. Age Tuổi của khách hàng Giá trị liên tục

10. Education Trình độ học vấn của khách hàng Biến định danh

11. Community Hành vi quan hệ cộng đồng Biến định danh

+ Có danh tiếng/Prestige

+ Tốt/good engough

+ Không biết/unknown

12. Marital status Biến định danh

Tình trạng gia đình: Độc thân/ Single và kết hôn/ married

13. Job position Vị trí công việc Biến định danh

+ Công nhân/worker

+ Nhân viên văn phòng/Office staff

+Quản lý/Manager

+Giám đốc/Director

14. Houseownership Tình trạng sở hữu nhà Biến định danh

+ Nhà riêng/Owned house

5

+ Nhà thuê/Rented house

+ Ở với cha mẹ/Stayed with parents’ house

15. Usage Thông tin sử dụng dịch vụ của NH Biến định danh

+Chỉ sử dụng dịch vụ từ SCB/ only loan services from SCB bank

+Sử dụng dịch vụ vay từ SCB > ngân hàng khác/loan services from SCB bank > another bank

+Sử dụng dịch vụ vay từ SCB = NH khác/loan services from SCB bank = another bank

+Sử dụng dịch vụ vay từ SCB< NH khác/loan services from SCB < another bank

+ Không sử dụng dịch vụ vay từ SCB/No loan services from SCB

16. Type of product Hình thức cho vay Biến định danh

17. Type of card Biến định danh Loại thẻ sử dụng: Thẻ chính và thẻ phụ/Type of card: Main and non-main

18. Level of card Giá trị của mức thẻ/Value of card level Liên tục

19. Balance account account measured in Liên tục Balance Vietnamese currency (VND)

20. Fee Biến định danh Phí hàng năm (Có/Không)/Annual fee (Yes/No)

21. Card_date Date Ngày cấp thẻ/Date to issue the bank card

22. No.Card Series number Số tài khoản thẻ/Account number of card

23. Ncard_Date thẻ mới/Date to Date Ngày công nhận approve the new card

24. Workingyear Liên tục

tác/làm việc của Số năm công kH/Number of years of customers working

25. NetIncome Liên tục Thu nhập ròng bình quân theo tháng (đồng/tháng)

6

Nguồn: Tổng hợp từ big data

1.3.2. Các khái niệm tiếp cận trong nghiên cứu

Mô hình Fraud còn được dịch là mô hình gian lận, có chức năng hỗ giúp tìm ra những

gian lận hoặc lỗ hổng trong hoạt động kinh doanh, trong đó lĩnh vực cho vay không

là ngoại lệ. Điển hình trong lĩnh vực thế chấp, mô hình gian lận đã giúp việc phát hiện

những nhân viên sử dụng chuyên môn hoặc thẩm quyền của mình để tạo ra một gian

lận cá nhân.

Thuật toán khám phá những lỗ hổng trong kinh doanh có nhiều phương pháp, trong

đó có thể kể đến mô nhánh/cây quyết định, điển hình thuật toán C5.0. Đây là mô hình

kế thừa thuật toán cây quyết định dựa trên nền tảng kết quả nghiên cứu của (Hunt &

Krivanek, 1966). Đặc điểm chính của C5.0 hướng đến khái phá dữ liệu theo phân lớp

dữ liệu dựa trên cây quyết định hiệu quả và phổ biến. Phương pháp này giúp xây dựng

một kế hoạch nhằm đạt được mục tiêu mong muốn và giúp dự báo hành vi của khách

hàng, trong dự báo về hành vi gian lận.

Phân tích lòng trung thành của khách hàng đối với dịch vụ. (Doğan, Ayçin, & Bulut,

2018) sử dụng khái niệm của RFM để xác định mức độ lòng trung thành của khách

hàng dựa vào 3 chỉ số: R, F, M. Trong đó, R là Recency, tức là thời gian mua hàng

gần nhất tính đến thời điểm nghiên cứu. F là Frequency là tần suất giao dịch của

khách hàng trong thời gian mà nghiên cứu đang thực hiện của 12 tháng, tần suất giao

dịch hoặc mua hàng sẽ được tính toán. M là Monetary tức đo lường tổng giá trị mà

khách hàng thực hiện giao dịch trong khoảng thời gian nghiên cứu. Tượng tự,

(Khajvand & Tarokh, 2011) đã sử dụng mô hình RFM như nêu trên để hướng đến

phân phúc thị trường trong lĩnh vực ngân hàng bán lẻ và đo lường nhóm khách hàng

có đóng góp lớn nhất.

Xuất phát từ các nhận định trên, nghiên cứu của luận văn này, phương pháp tiếp cận

trong phân tích sẽ áp dụng vào mô hình của (Khajvand & Tarokh, 2011) để tính RFM,

từ cơ sở đó, các bước hướng đến phân khúc thị trường sẽ được thực hiện để xác định

các nhóm khách hàng khách biệt về sự đóng góp cho ngân hàng từ thấp đến cao.

7

1.3.3. Phạm vi nghiên cứu của luận văn

Dữ liệu được trích xuất chọn ra khách hàng thuộc khu vực Thành phố Hồ Chí Minh.

Mô hình nghiên cứu dựa trên kiến thức chuyên gia của cá nhân, đang là lãnh đạo của

phòng giao dịch tại một quận của thành phố. Đề tài không sử dụng phương pháp định

tính, tuy nhiên trong quá trình nghiên cứu, có sự ủng hộ của các phòng ban và của

lãnh đạo cao hơn. Kết quả nghiên cứu này sẽ là một khởi đầu để xem xét mức độ hiệu

quả trong nghiên cứu giúp cho việc nghiên cứu mở rộng trong thời gian tới.

Việc nghiên cứu sự gian lận trong kinh doanh hàm ý sẽ tập trung vào gian lận có thể

xuất phát từ nhân viên trong xét duyệt hồ sơ, hoặc do khách hàng chủ động khai báo

hồ sơ không chính xác để đạt được mục tiêu trong giao dịch. Cơ sở khám phá gian

lận trong kinh doanh sẽ là cơ sở để xây dựng giải pháp khắc phục gian lận từ phía

nhân viên và từ phía khách hàng.

1.3.4. Kết cấu của luận văn

Luận văn được chia làm 4 chương, với các nội dung sau:

Chương 1: Giới thiệu tổng quan về đề tài nghiên cứu

Chương 2: Cơ sở lý luận

Chương 3: Ứng dụng của Big data tại SCB và kết quả phân tích

Chương 4: Kết luận và giải pháp

8

CHƯƠNG 2: CƠ SỞ LÝ LUẬN

2.1. Big Data

Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc.

Các hoạt động được tạo lập trong hệ thống đều được big data ghi lại. Đối với hoạt

động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong

suốt thời gian giao dịch. Một khi dữ liệu được lưu trữ, bản ghi ngày càng phong phú,

đa dạng hơn theo thời gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử

dụng trong việc truy vấn thông tin để phát triển chiến lược kinh doanh, hay tạo lập

môi trường quản lý chuyên nghiệp.

Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân

hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh

trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng

đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản lý doanh

nghiệp.

Big Data đóng vai trò quan trọng trong việc truy xuất dữ liệu và hỗ trợ con người đưa

ra quyết định tốt hơn với cơ hội thành công cao hơn nhiều.

Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data

Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động

vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết

các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin,

dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh,

bộ phận của tổ chức. Tuy nhiên, khi các ngân hàng ngày càng mở rộng dịch vụ, các

tiện ích, hay áp dụng công nghệ trong việc phát triển phân khúc thị trường, thu hút

thêm khách hàng thì song song họ cũng phải xây dựng một hệ thống hạ tầng để thu

thập dữ liệu và tiến hành phân tích và xác định giải pháp cải thiện hiệu quả kinh

doanh. Theo một số chuyên gia dự đoán số lượng dữ liệu tăng lên gấp bảy lần trước

9

năm 2020 (so với năm 2016). Big data là bước tiến lớn đối với sự phát triển của ngành

ngân hàng.

Ngày nay, hầu hết các tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm (Banking,

Financial services and Insurance (BFSI)) đang nỗ lực để áp dụng một cách tiếp cận

mới theo hướng khai thác dữ liệu để phát triển và đổi mới các dịch vụ mà họ cung

cấp cho khách hàng. Giống như hầu hết các ngành công nghiệp khác, phân tích dữ

liệu lớn (Big data analytics) sẽ là một sự thay đổi lớn quan trọng trong cuộc chiến

giữa các tổ chức cùng ngành.

Mặc dù nhiều tổ chức BFSI đang thay đổi cách thức khai thác dữ liệu bằng cách thu

thập một khối lượng dữ liệu khổng lồ và tiến hành phân tích, nhưng đó chỉ là những

bước tổng quát, những bước riêng lẻ ở từng giai đoạn trong quy trình khai thác Big

data. Trong tất cả trường hợp, các dự án Big data được hình thành đều hướng đến

mục tiêu ban đầu là trả lời cho câu hỏi: “Những dữ liệu này có thể giúp chúng ta giải

quyết các vấn đề kinh doanh như thế nào?”

Khi khối lượng khách hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả năng

cung cấp dịch vụ của từng tổ chức. Thực tiễn cho thấy việc phân tích dữ liệu hiện tại

đã đơn giản hóa quá trình theo dõi và đánh giá khách hàng tín dụng của các ngân

hàng và các tổ chức tài chính, dựa trên khối lượng lớn dữ liệu như thông tin, hồ sơ cá

nhân và các thông tin bảo mật khác. Nhưng với sự giúp đỡ của Big data, các ngân

hàng có thể khai thác để liên tục theo dõi hành vi của khách hàng trong thời gian thực,

xác định được các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc đưa ra giải

pháp. Quá trình đánh giá hồ sơ khách hàng trong thời gian thực sẽ dần thúc đẩy hiệu

suất hoạt động và lợi nhuận, từ đó đẩy mạnh phát triển tổ chức hơn nữa.

Theo Forbes, 87% các công ty cho rằng Big data sẽ tạo ra những thay đổi lớn cho các

ngành công nghiệp của họ đến cuối thập kỷ thứ 2 của thế kỷ 21. Thậm chí nhiều công

ty còn nghĩ rằng nếu không có một chiến lược Big data cụ thể và hiệu quả sẽ khiến

họ tụt lại phía sau trong thời đại công nghệ 4.0 ngày nay.

10

Có rất nhiều nguồn dữ liệu Big data trong hầu hết ở các ngành và lĩnh vực khác nhau,

không riêng ở lĩnh vực tài chính, thương mại, bán lẻ, bảo hiểm, mà nó còn rất được

quan tâm ở lĩnh vực ngân hàng. Mọi tương tác, mọi giao dịch của khách hàng tại ngân

hàng đều tạo ra các bản ghi điện tử, các bản sao lưu được lưu lại theo quy định pháp

luật, và các giao dịch tại các trụ ATM ở các địa điểm khác nhau cũng được lưu thông

tin tại ngân hàng. Nhờ phân tích Big data, các công ty dịch vụ tài chính không còn

lưu trữ dữ liệu theo yêu cầu bắt buộc như ngày xưa nhưng giờ đây họ đang tích cực,

chủ động hơn trong việc khai thác để có được những kết quả mà dựa vào đó đưa ra

được các giải pháp cải thiện hoạt động, gia tăng lợi nhuận của tổ chức.

Ngoài ra, các công ty cũng không chờ đợi một khoảng thời gian dài mới có thể phân

tích các dữ liệu lịch sử, dữ liệu quá khứ. Hầu hết các phân tích Big data được thực

hiện chủ yếu xảy ra trong thời gian thực nhằm thúc đẩy việc đưa ra các quyết định

chiến lược một cách nhanh chóng.

Tóm lại, Big data chính là nguồn lực quan trọng, mang tính chất nòng cốt tạo ra lợi

thế cạnh tranh ở bất kỳ một tổ chức tài chính nào đặc biệt khi việc nắm bắt nhu cầu

của người tiêu dùng ngày càng phức tạp mặc dù đã thuận tiện hơn, dễ dàng hơn nhờ

sự phát triển vượt bậc của công nghệ, kỹ thuật. Big data không chỉ đem lại các cái

nhìn mới, sự sáng tạo trong quá trình đổi mới từng loại hình dịch vụ đến khách hàng

mà còn đảm bảo hiệu quả kinh doanh với rủi ro, chi phí được tối ưu nhất

Việc xác định các mảng dịch vụ, các bộ phận, các chức năng trong tổ chức tài chính,

nơi mà Big data có thể được xem xét nhằm mục đích khai thác một cách hiệu quả

nhất dựa vào sự kết hợp giữa các kiến thức, mô hình kinh doanh và khả năng áp dụng

phần mềm công nghệ sẽ tạo ra cơ hội cạnh tranh cho chính tổ chức đó.

Tùy vào mục đích, cơ cấu, nguồn lực, khả năng khác nhau ở mỗi tổ chức mà sẽ có

nhiều trường hợp ứng dụng Big data khác nhau, mang tính chất đặc thù, riêng biệt.

Dưới đây là các trường hợp sử dụng phổ biến nhất – được chúng tôi nghiên cứu và

chọn lọc – mà các ngân hàng và công ty dịch vụ tài chính đang thực hiện để tìm kiếm

các giá trị ẩn sâu bên trong quá trình phân tích Big data.

11

Các ứng dụng của Big data trong lĩnh vực BankingPhân tích các thói quen chi tiêu của khách hàng

Các ngân hàng có khả năng truy cập trực tiếp nguồn thông tin, dữ liệu lịch sử dồi dào

liên quan đến các thói quen, hành vi chi tiêu của khách hàng. Các ngân hàng còn nắm

thông tin về số tiền một khách hàng được trả bao nhiêu ví dụ như mức lương cụ thể

trong bất kỳ tháng nào, số tiền được chuyển vào tài khoản tiết kiệm, số tiền đã được

thanh toán đến các công ty cung cấp tiện ích (ví dụ công ty điện lực, công ty cung cấp

dịch vụ internet,..), thời gian khách hàng sử dụng dịch vụ của ngân hàng, v.v. Điều

này cung cấp cơ sở, cơ hội để các ngân hàng tiếp cận và phân tích dữ liệu sâu hơn.

Áp dụng các chức năng sàng lọc thông tin (filter function) ví dụ như khi lọc ra thời

điểm dịp lễ hay mùa lễ và điều kiện kinh tế vĩ mô (ví dụ tình hình lạm phát, tỷ lệ thất

nghiệp,..) mà nhân viên ngân hàng có thể hiểu được nguyên nhân tác động làm mức

lương của khách hàng tăng hay giảm và khả năng chi tiêu của khách hàng thay đổi

như thế nào. Đây là một trong những yếu tố nền tảng cho quá trình đánh giá rủi ro,

sàng lọc, thẩm định hồ sơ cho vay, đánh giá khả năng thế chấp và cung cấp nhiều sản

phẩm tài chính khác (cross-selling) đến khách hàng như bảo hiểm.

Các ngân hàng được hưởng lợi rất nhiều nếu biết được thông tin khách hàng rút tiền

mặt - tất cả số tiền có được vào ngày trả lương - hoặc nếu họ muốn giữ tiền lại trên

thẻ tín dụng (credit card)/ thẻ ghi nợ (debit card). Tận dụng điều đó, ngân hàng có

thể tiếp cận khách hàng, mở rộng dịch vụ với các đề nghị, thu hút khách hàng đầu tư

vào các khoản vay ngắn hạn với tỷ lệ thanh toán cao và lãi suất thích hợp, v.v.

Phân khúc khách hàng và xem xét (thẩm định) hồ sơ

Một khi các phân tích ban đầu về thói quen chi tiêu của khách hàng cùng với xác định

các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên (ví dụ khách hàng

muốn gửi tiết kiệm hay muốn đầu tư vào các khoản vay) được hoàn tất thì các ngân

hàng sẽ có được một database (cơ sở dữ liệu) phục vụ cho quá trình phân khúc, phân

loại khách hàng một cách phù hợp dựa vào thông tin và hồ sơ khách hàng cung cấp.

Những khách hàng nào chi tiêu dễ dàng thoải mái, các nhà đầu tư nào thận trọng kỹ

lưỡng, khách hàng nào thanh toán các khoản nợ nhanh chóng, khách hàng nào mới

12

bắt đầu trả nợ khi sắp đáo hạn, thời gian khách hàng sử dụng dịch vụ của ngân hàng

để đo lường lòng trung thành… Biết được hồ sơ cá nhân của tất cả khách hàng giúp

ngân hàng đánh giá chi tiêu và thu nhập dự kiến trong tháng tới và lập kế hoạch chi

tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi ích cho chính khách hàng.

Big Data sẽ cung cấp cho các ngân hàng những hiểu biết, kiến thức chuyên môn sâu

về thói quen và mô hình chi tiêu của khách hàng, đơn giản hóa những nhiệm vụ xác

định nhu cầu và mong muốn của họ. Bằng cách có thể theo dõi từng giao dịch của

khách hàng, các ngân hàng sẽ có thể phân loại khách hàng dựa trên các thông số khác

nhau, bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng dịch

vụ, thói quen chi tiêu khi dùng thẻ tín dụng hoặc thậm chí là giá trị tài sản ròng (net

worth – thu nhập cộng với giá trị tài sản của khách hàng trừ đi các khoản nợ).

Lợi ích mà phân khúc khách hàng đem lại là nó cho phép các ngân hàng nhắm mục

tiêu khách hàng tốt hơn với các chiến dịch tiếp thị có liên quan được thiết kế để đáp

ứng chính xác nhu cầu của khách hàng.

Phân tích dữ liệu Big Data tăng khả năng cho các công ty, tổ chức BFSI nắm được

nhu cầu tìm ẩn bên trong từng khách hàng (customer insights) từ đó tạo được phân

khúc khách hàng. Tuy nhiên việc thu thập và đánh giá thông tin khách hàng đòi hỏi

sự đầu tư vào cơ sở hạ tầng của tổ chức cũng như đầu tư vào mạng lưới liên kết giữa

mọi nhân viên thuộc các phòng ban, bộ phận chức năng của tổ chức với công nghệ,

phần mềm kỹ thuật tiên tiến phục vụ quá trình khai thác Big Data.

Bán kèm thêm các dịch vụ khác (service cross-selling)

Dựa vào database mà ngân hàng có thể thu hút thêm, hay giữ chân khách hàng bằng

cách giới thiệu thêm các dịch vụ khác. Ví dụ ngân hàng có thể giới thiệu các khoản

đầu tư có lãi suất hấp dẫn đến các khách hàng có lượng tiền nhàn rỗi hoặc những nhà

đâu tư lúc nào cũng luôn thận trọng, cân nhắc trong việc ra quyết định đầu tư. Hoặc

ngân hàng có đề xuất các vay ngắn hạn cho các khách hàng có thói quen chi tiêu

“thoải mái” cho nhu cầu tiêu dùng hàng ngày của họ hoặc những khách hàng đang

gặp khó khăn trong việc thanh toán nợ cũ. Phân tích một cách chính xác về hồ sơ cá

13

nhân của khách hàng, ngân hàng có thể bán kèm các dịch vụ khác quả hơn và thu hút

khách hàng tốt hơn với các ưu đãi được “cá nhân hóa” tập trung chính xác vào nhu

cầu khách hiệu quả hơn, từ đó tăng doanh thu cho công ty.

Xây dựng hệ thống thu thập các phản hồi khách hàng (feedback) và phân tích chúng

Khách hàng có thể để lại phản hồi sau mỗi lần giao dịch hay mỗi lần nhận được tư

vấn từ trung tâm hỗ trợ chăm sóc khách hàng (customer call center) hoặc thông qua

các biểu mẫu phản hồi, nhưng thường xuyên ( hay có thể nói nhiều khả năng) chia sẻ

ý kiến thông qua các phương tiện truyền thông xã hội (social media) hơn ví dụ

Facebook, Zalo,... Các công cụ Big Data có thể tìm kiếm chọn lọc thông qua các

thông tin, feedback công khai trên các social media và thu thập tất cả những dữ liệu

đề cập về thương hiệu của ngân hàng để có thể phản hồi nhanh chóng và đầy đủ đến

khách hàng. Ngoài ra cũng hỗ trợ ngăn chặn các tin đồn thất thiệt ảnh hưởng đến hoạt

động kinh doanh và niềm tin nơi khách hàng ví dụ như vụ ngân hàng Agribank vướng

phải tin đồn phá sản trong hồi đầu tháng 11, 2018 vừa qua.

Khi khách hàng cảm thấy ngân hàng lắng nghe, đánh giá cao ý kiến và thực hiện

những cải tiến, thay đổi theo yêu cầu của họ thì sự trung thành dành cho thương hiệu

sẽ gia tăng, hơn nữa cải thiện hình ảnh của ngân hàng. Để có cái nhìn tổng quát, một

cái nhìn 360 độ về khách hàng các ngân hàng cần xây dựng một trung tâm dữ liệu -

trung tâm lưu trữ tất cả sự tương tác của khách hàng với thương hiệu bao gồm dữ liệu

cá nhân cơ bản, lịch sử giao dịch, lịch sử duyệt web, dịch vụ, v.v. Hiện tại để hỗ trợ

các tổ chức trong việc phân

Trên đây mới là những ứng dụng của Big Data trong lĩnh vực Banking nhắm đến mục

đích phân khúc khách hàng gia tăng thêm lượng khách hàng sử dụng dịch vụ tại các

ngân hàng (bao gồm cả khách hàng cũ và khách hàng mới) bằng cách phân tích dữ

liệu (feedback và hồ sơ cá nhân của khách hàng) để tiếp thu ý kiến, xác định được

nhu cầu, thói quen chi tiêu của khách hàng để đáp ứng một cách phù hợp.

Ở phần tiếp theo chúng tôi sẽ phân tích về các ứng dụng của Big Data trong việc

hướng đến marketing từng khách hàng (personlized marketing), thay đổi cách thức

14

cung cấp dịch vụ sao cho phù hợp. Đặc biệt là đảm bảo hiệu quả hoạt động, giảm

thiểu rủi ro bằng cách phát hiện, ngăn chặn các gian lận trong giao dịch tài chính,

2.2. Các ứng dụng của big data trong lĩnh vực ngân hàng

Marketing theo hướng cá nhân hóa (personalized marketing)

Sau khi có được phân khúc khách hàng thì các ngân hàng cần tận dụng để

personalized marketing để nhắm mục tiêu khách hàng dựa trên hiểu biết về thói quen

chi tiêu cá nhân của họ. Ngoài việc thu thập dữ liệu về lịch sử giao dịch của khách

hàng, các công ty dịch vụ tài chính hay ngân hàng cũng có thể kết hợp dữ liệu phi cấu

trúc (unstructured data) – một dạng dữ liệu Big Data – lấy được từ mạng xã hội hay

social media ví dụ như hồ sơ của khách hàng trên Facebook,.. để có được một bức

tranh đầy đủ hơn về nhu cầu của khách hàng dựa trên các phân tích về tâm lý, mong

muốn khách hàng ở mọi thời điểm. Mặt khác, dữ liệu của khách hàng ở các nền tảng

social media hay các ứng dụng xã hội thông minh khác sẽ giúp ngân hàng phân tích

được các rủi ro có thể xảy ra mà xem xét có nên cung cấp các khoản vay hay không

ngoài việc thẩm định hồ sơ như thông thường.

Sau khi phân tích và nắm được nhu cầu cụ thể và riêng biệt của mỗi khách hàng, các

tổ chức nên tiếp tục phân khúc sâu hơn nữa và cung cấp các giải pháp, kế hoạch

marketing phù hợp để từ đó có được tỷ lệ phản hồi, tỷ lệ chuyển đổi cao hơn từ mỗi

khách hàng. Ví dụ các ngân hàng sử dụng công cụ e-mail marketing để gửi đến khách

hàng các thông tin mới nhất về những dịch vụ cho vay ngắn hạn với lãi suất vừa phải,

hay gửi tiết kiệm với lãi suất hấp dẫn, hoặc các chương trình ưu đãi khác,…Việc tạo

ra các sản phẩm dịch vụ cung cấp cho từng phân khúc khách hàng, hay thậm chí từng

khách hàng cụ thể sẽ giúp các ngân hàng xây dựng hình ảnh thương hiệu và tạo dựng

một mối quan hệ tốt ở từng khách hàng.

Không chỉ riêng ở lĩnh vực ngân hàng, Big Data còn hỗ trợ marketing ở hầu hết mọi

lĩnh vực khác nhau nếu các công ty biết được tầm quan trọng và có được một tầm

nhìn chiến lược nghiêm túc trong việc khai thác Big Data. Theo McKinsey, việc sử

15

dụng dữ liệu để đưa ra quyết định marketing tốt hơn có thể tăng năng suất tiếp thị,

thu hút khách hàng thêm 15-20% ngoài các giải pháp marketing thông thường.

Thay đổi cách thức cung cấp dịch vụ đến khách hàng

Hệ thống Big Data có thể là một hệ thống phức tạp liên kết giữa nhiều bộ phận chức

năng khác nhau, nhưng công việc của nó là đơn giản hóa các nhiệm vụ trong một tổ

chức. Bất cứ khi nào một tên khách hàng hoặc số tài khoản được nhập vào hệ thống,

hệ thống Big Data sẽ hỗ trợ sàng lọc tất cả dữ liệu và chỉ truyền đi hay cung cấp các

dữ liệu được yêu cầu để phục vụ cho quá trình phân tích. Điều này sẽ cho phép các

ngân hàng tối ưu hóa quy trình làm việc và tiết kiệm cả thời gian và chi phí. Big Data

cũng sẽ cho phép các tổ chức xác định và khắc phục các vấn đề, trước khi chúng ảnh

hưởng đến khách hàng của họ.

Đôi khi khách hàng cũng có thể là nguồn gốc của một vấn đề. Ví dụ, các nhà đầu tư

có thể đưa ra quyết định, nhưng sau đó thay đổi ý định của họ tại một thời điểm trong

tương lai. Big Data sẽ giúp ngân hàng thay đổi phương thức cung cấp dịch vụ của họ

theo cách mà những khách hàng sẽ không thể “đi ngược lại” với cam kết ban đầu của

họ. Big Data cho phép ngành ngân hàng theo dõi hạn mức cho vay và thẻ tín dụng

của khách hàng, đảm bảo rằng họ không chi tiêu quá mức quy định. Cách cung cấp

dịch vụ thay đổi như thế nào còn phụ thuộc vào quy mô hoạt động, tính chất đặc thù

của loại hình dịch vụ, cơ sở hạ tầng,..của tổ chức ngân hàng đó.

Big Data chỉ đưa ra kết quả là thông tin ví dụ như những khách hàng nào có khả năng

không thanh toán được nợ, hay những khách hàng có khả năng rời dịch vụ (churn

risk) và nhiệm vụ của từng ngân hàng là suy nghĩ ra giải pháp để khắc phục ví dụ

theo dõi “sát sao” và thông tin liên tục về thời hạn trả nợ đến các khách hàng có thói

quen chậm trễ trong việc thanh toán lãi,…

Nói tóm lại, mục đích đầu tiên trong việc ứng dụng của Big Data đã được đề cập sẽ

tập trung hướng đến phân khúc khách hàng, cải tiến dịch vụ, marketing tăng doanh

số, lợi nhuận dựa trên toàn bộ thông tin về khách hàng mà tổ chức ngân hàng có được

– chính là dữ liệu Big Data cần được phân tích. Những dữ liệu có thể bao gồm:

16

- Hồ sơ tín dụng của khách hàng

- Thông tin về kỳ hạn vay của khách hàng (ngắn hạn, trung hạn hay dài hạn)

- Mức cấp tín dụng theo từng thời hạn (ngắn hạn, trung hạn hay dài hạn)

- Cơ cấu các loại hình dịch vụ theo số lượng khách hàng đăng ký và mức cấp

tín dụng.

- Thời gian tham gia dịch vụ ví dụ trong 1 năm, từ 1 đến 3 năm hoặc trên 3

năm,..

- V.v ….

Ngoài gia tăng lợi nhuận, mở rộng cung cấp dịch vụ đến các khách hàng tiềm năng,

các ngân hàng cũng có thể dựa vào database đã thu thập để kiểm soát rủi ro, các gian

lận tín dụng, đảm bảo hiệu quả hoạt động của tổ chức.

Phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật (Fraud identification)

Một trong những vấn đề lớn nhất mà ngành ngân hàng phải đối mặt là gian lận, tội

phạm trong tín dụng. Big Data sẽ cho phép các ngân hàng đảm bảo rằng không có

giao dịch trái phép nào được thực hiện, cung cấp mức độ an toàn, nâng cao tiêu chuẩn

bảo mật của toàn bộ ngành.

Nhờ vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân hàng sẽ

có thể xác định hay nhận được cảnh báo nếu có điều gì bất thường xảy ra trong quá

trình hoạt động, cung cấp dịch vụ đến khách hàng. Ví dụ nếu một nhà đầu tư hay

khách hàng thường thanh toán chi tiêu cho sinh hoạt hằng ngày hoặc để tiền trong tài

khoản gửi tiết kiệm lấy lãi, nhưng trong một ngày lại cố gắng rút toàn bộ số tiền từ

tài khoản của mình qua máy ATM, điều này có nghĩa là thẻ có thể đã bị mất cắp và

sử dụng bởi chính những kẻ cắp. Nhân viên ngân hàng sẽ gọi điện đến chủ tài khoản

hoặc thông báo đến khách hàng bằng bất kỳ hình thức nào để xác minh lại giao dịch

đó một cách rõ hơn: giao dịch hợp pháp khách hàng thực hiện hay giao dịch trái phép

bởi tội phạm lừa đảo, tội phạm đã trộm được thẻ mà khách hàng không biết? Cứ thế,

việc phân tích dữ liệu giao dịch lịch sử và làm cơ sở để kiểm tra tính hợp pháp, an

17

toàn bảo mật của các giao dịch hiện tại sẽ giảm thiểu được hành vi vi phạm pháp luật

có thể xảy ra.

Các ngân hàng và tổ chức tài chính khai thác Big Data để phân biệt giữa các giao dịch

là hành vi phạm tội với các giao dịch hợp pháp bằng cách áp dụng các thuật toán phân

tích dữ liệu (data analytics models) và “học máy” (machine learning). Các hệ thống

phân tích sẽ tự động phát hiện, trích xuất các giao dịch bất hợp pháp ở thời gian thực

và đề xuất các hành động ngay lập tức, chẳng hạn như chặn các giao dịch bất thường,

ngăn chặn hành vi lừa đảo trước khi nó xảy ra đảm bảo lợi ích của khách hàng và lợi

nhuận của chính ngân hàng.

Kiểm soát rủi ro (Risk management), tuân thủ luật pháp và minh bạch trong báo

cáo tài chính (Compliance and Reporting)

Ngoài phát hiện các hành vi phạm tội, bảo vệ lợi ích người tiêu dùng, các ngân hàng

có thể ứng dụng Big Data đo lường, kiểm soát rủi ro khi thực hiện các giao dịch bằng

cổ phiếu với những nhà đầu tư và kiểm tra hồ sơ vay của khách hàng. Dĩ nhiên tất cả

phải dựa trên sự phân tích có kết quả từ mọi dữ liệu lịch sử liên quan. Các thuật toán

Big Data còn giúp giải quyết các vấn đề về tuân thủ quy định pháp luật về kế toán,

kiểm toán và báo cáo tài chính minh bạch nhằm hợp lý hoá các hoạt động của tổ chức

từ đó giảm được chi phí quản lý.

Các tổ chức ngân hàng và tài chính hoạt động trong một khung pháp lý rất nghiêm

ngặt, đòi hỏi mức độ cao nhất trong kiểm soát minh bạch các hoạt động tài chính,

tuân thủ các điều luật và báo cáo đầy đủ chi tiết đến các cơ quan nhà nước, chính phủ.

Ở Việt Nam, các ngân hàng và tổ chức tín dụng phải tuân thủ toàn bộ Luật Ngân hàng

trong đó có Đạo luật về Luật Ngân hàng Nhà nước Việt Nam và Luật Các Tổ chức

tín dụng. Ở Mỹ thì có Đạo luật Dodd – Frank, được ban hành sau cuộc khủng hoảng

tài chính năm 2008, yêu cầu giám sát các giao dịch và tài liệu chi tiết về mọi giao

dịch xảy ra ở bất kỳ tổ chức tài chính nào. Việc phát hiện sớm hành vi gian lận của

khách hàng là cực kỳ quan trọng. Hệ thống Big Data thu thập và lưu trữ dữ liệu trong

một cơ sở dữ liệu có quy mô lớn giúp ngân hàng quản lý, tiến hành phân tích một

18

cách nhanh nhất bằng cách sử dụng các phần mềm, thuật toán chuyên dụng. Và khi

phát hiện một số lượng lớn rủi ro có thể xảy ra, ngân hàng sẽ dễ dàng kiểm soát. Big

Data đóng một vai trò to lớn trong quá trình tích hợp các chức năng của các bộ phận,

phòng ban và yêu cầu xử lý dữ liệu của ngân hàng vào một hệ thống trung tâm duy

nhất. Qua đó hỗ trợ kiểm soát, ngăn chặn vấn đề mất dữ liệu, giảm thiểu rủi ro và

gian lận.

Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân

viên

Quá tập trung vào gia tăng lợi nhuận mà nhiều ngân hàng lại thường quên đi một ứng

dụng tiềm năng của Big Data mà có thể có tác động rất lớn đến quá trình phát triển

kinh doanh. Đó chính là nâng cao năng suất làm việc của nhân viên. Hệ thống Big

Data hỗ trợ thu thập, phân tích, đánh giá, truyền tải dữ liệu về hiệu quả làm việc của

nhân viên. Kết quả phân tích sẽ giúp các nhà lãnh đạo có cái nhìn về tình hình, thực

trạng làm việc hiện tại của nhân viên mình như những nhân viên nào đang có thành

tích tốt nhất, những nhân viên nào không đạt được chỉ tiêu, và đặc biệt là xem xét

mức độ hài lòng của nhân viên về môi trường làm việc, phúc lợi,.. của ngân hàng

dành cho họ. Các công cụ của Big Data khai thác toàn bộ dữ liệu đều ở thời gian thực,

do đó lúc giải pháp được đưa ra sẽ mang tính khả thi cao, và tạo nên những sự thay

đổi nhanh chóng.

Ngoài ra các ngân hàng có thể đo lường nhiều thứ không chỉ mỗi hiệu suất làm việc

của cá nhân, mà còn tinh thần đồng đội, sự tương tác giữa các phòng ban và văn hóa

tổng thể của công ty. Nhân viên sẽ giảm thời gian dành cho các công việc mang tính

thủ công gồm nhiều quy trình phức tạp bằng cách dựa vào hệ thống Big Data gồm

các phần mềm đã được lập trình sẵn để giải quyết các công việc ấy một cách nhanh

chóng và chính xác. Từ đó nhân viên dành nhiều thời gian cho các công việc, nhiệm

vụ khó hơn, cấp bách hơn từ cấp trên giao xuống.

19

2.3. Khai phá dữ liệu (Data Mining)

Theo báo cáo của Markets and Markets thị trường Data Mining dự báo sẽ tăng từ

591,2 triệu USD năm 2018 lên 1.039 triệu USD trong năm 2023. Đây chính là minh

chứng cho thấy xu hướng tiếp cận Data mining phục vụ cho khai thác giá trị từ dữ

liệu ở các công ty trên toàn cầu ngày càng mạnh mẽ.

Khai phá dữ liệu là một tập hợp, một hệ thống các phương pháp tính toán, thuật toán

được áp dụng cho các cơ sở dữ liệu lớn và phức tạp, mục đích loại bỏ các chi tiết

ngẫu nhiên, chi tiết ngoại lệ, khám phá các mẫu, mô hình, quy luật tìm ẩn, các thông

tin có giá trị trong bộ dữ liệu. Khai phá dữ liệu là thành quả công nghệ tiên tiến ngày

ngay, là quá trình khám phá các kiến thức vô giá bằng cách phân tích khối lượng lớn

dữ liệu đồng thời lưu trữ chúng ở nhiều cơ sở dữ liệu khác nhau (Data-Flair).

Qui trình khai phá dữ liệu sẽ được thực hiện qua 2 quá trình: chuẩn bị dữ liệu (data

preparation) và khai phá dữ liệu (data mining) và 7 bước được mô tả chi tiết trong

bảng 2.1.

Bảng 2.1. Các bước trong quá trình khai phá dữ liệu

Bước Chức năng Diễn giải

1 Làm sạch dữ liệu Loại bỏ các dữ liệu nhiễu và dữ liệu không liên quan,

(Cleaning) không đầy đủ thông tin

2 Tích hợp dữ liệu Tổng hợp và lưu trữ dữ liệu từ nhiều nguồn khác nhau

(Integration) trong một hệ cơ sở dữ liệu

3 Lựa chọn dữ liệu Chọn ra những dữ liệu liên quan, có giá trị phân tích

(Selection)

4 Chuyển đổi dữ liệu Chuyển đổi và hợp nhất dữ liệu theo các loại biến, định

(Transformation) dạng khác nhau để phù hợp và dễ dàng cho việc phân

tích.

5 Khai phá dữ liệu Xây dựng các thuật toán, phương pháp, các model

(Data mining) phân tích khác nhau nhằm mục đích phát hiện, trích

20

xuất các thông tin hữu ích, giá trị tiềm năng từ những

mẫu dữ liệu.

6 Đánh giá mẫu dữ liệu Xác định mức độ chính xác, khả năng đem lại giá trị

(Evaluation) thực sự và triển khai thực tế không.

7 Trình bày kết quả thu Thể hiện kết quả bằng các công cụ trực quan hóa, sử

được dụng đồ thị, bảng, biểu đồ để diễn giải kết quả đến

(Knowledge) người xem

Khai phá dữ liệu là một trong những lợi thế các công ty trong ngành sản xuất, kinh

doanh, marketing nếu họ biết cách ứng dụng hợp lý để tăng cường hiệu quả hoạt

động. Các lợi ích cơ bản của khai phá dữ liệu như sau: hỗ trợ ra quyết định tự động,

hỗ trợ đưa ra dự báo chính xác, hỗ trợ giảm thiểu chi phí và hỗ trợ khả năng thấu hiểu

khách hàng. Đồng thời việc khai phá dữ liệu cũng được ứng dụng rộng rãi trong nhiều

lĩnh vực kinh doanh và ngành nghề và được phân theo từng chức năng nhiệm vụ.

2.4. Hành vi tiêu dùng

2.4.1. Định nghĩa

Hành vi người tiêu dùng là loại hình nghiên cứu hướng đến các đối tượng là cá nhân

hoặc tổ chức và cách mà các đối tượng chủ thể trên quyết định lựa chọn và sử dụng

sản phẩm, dịch vụ để thỏa mãn nhu cầu của bản thân, cũng như sự tác động của quá

trình đưa ra quyết định đó tới tâm lý số đông người tiêu dùng và xã hội. Những tác

nhân gây ảnh hưởng tới hành vi tiêu dùng chủ yếu là các tác động nội tại và ngoại vi

(Solomon, 2004). Điều này có thể do con người muốn trốn thoát khỏi guồng công

việc thường nhật, cải thiện chất lượng sống, tự thưởng công sức (Danziger, 2004a),

đẩy mạnh niềm tin vào bản thân, tìm kiếm trải nghiệm đáng nhớ, trở nên đặc biệt và

độc nhất (Danziger, 2004b), thể hiện cá tính, thể hiện địa vị xã hội hoặc đáp ứng các

nhu cầu tâm lý (Nia và Judith, 2000).

21

Có nhiều công trình nghiên cứu của nhiều tác giả xoay quanh chủ đề hành vi tiêu

dùng, một cách tổng quát có thể phân tích hành vi người tiêu dùng theo hai trường

phái chính: một là trường phái kinh tế (economic man) hay được gọi là trường phái

dựa vào lí trí (rational school) và hai là trường phái dựa vào cảm xúc (emotional

school).

Trường phái kinh tế cho rằng việc người tiêu dùng đưa ra quyết định dựa vào lí trí để

đáp ứng nhu cầu tối đa hóa giá trị sử dụng đối với sản phẩm dịch vụ. Để làm được

điều này, người tiêu dùng phải trải qua một quá trình nhận thức bao gồm các giai

đoạn: xác định những thuộc tính ưu việt của sản phẩm, thu thập thông tin và thực hiện

đánh giá các thuộc tính của các thương hiệu cạnh tranh trên thị trường nhằm đưa ra

lựa chọn thương hiệu tốt nhất. Trường phái này chỉ phù hợp cho những sản phẩm mà

đối tượng người tiêu dùng tập trung duy nhất vào những lợi ích chức năng sản phẩm.

Quan điểm theo trường phái lí trí này bỏ qua lợi ích mang tính cảm xúc, thứ đóng vai

trò rất quan trọng trong việc tiêu dùng một số sản phẩm nhất định, mà điển hình là

các sản phẩm xa xỉ phẩm.

Khác với trường phái theo lí trí, trường phái cảm xúc lại nhận định rằng, yếu tố tác

động đến hành vi người tiêu dùng cơ bản đó chính là cảm xúc. Theo quan điểm này,

người tiêu dùng ra đưa quyết định hoàn toàn dựa trên các tiêu chuẩn mang tính chất

chủ quan của chủ thể như thị hiếu, niềm tin, ham muốn hay đơn giản chỉ là thích thú

thể hiện cá tính của mình.

Bên cạnh những lí thuyết cơ bản về hành vi tiêu dùng, chúng ta cũng cần phải bàn

thêm khái niệm phân khúc thị trường một khái niệm tuy không mới nhưng lại có ý

nghĩa quan trọng trong thực tiễn kinh doanh của các tổ chức tài chính. Phân khúc thị

trường được hiểu đơn giản là chia “chiếc bánh thị trường” của một sản phẩm hay dịch

vụ nào đó thành nhiều nhóm nhỏ, gọi tắt là các phân khúc, đảm bảo rằng trong cùng

một phân khúc thì có hành vi tiêu dùng của các khách hàng tương tự nhau và mang

tính khác biệt so với khách hàng của những phân khúc còn lại. Phân khúc thị trường

đóng vai trò hết sức rất quan trọng trong việc xây dựng chiến lược marketing mục

22

tiêu để tối đa hóa lợi nhuận. Đây là khâu đầu tiên phải thực hiện để xác định đâu là

thị trường mục tiêu cần tập trung nguồn lực để khai thác. Một điểm cần lưu ý, người

phân tích marketing chỉ đóng vai trò nhận dạng phân khúc và tiến hành phân tích

nguồn lực sẵn có của đơn vị chọn ra phân khúc phù hợp để thực hiện chiến lược kinh

doanh chứ không phải là người tạo ra bất kỳ phân khúc nào.

Phân tích dữ liệu có thể bao gồm cả phân tích dữ liệu thăm dò (dùng trong trường

hợp xác định các mẫu cần phân tích và mối quan hệ trong dữ liệu) và phân tích dữ

liệu xác nhận (thông qua việc áp dụng các kĩ thuật dùng trong thống kê để tìm ra giả

thiết về một bộ dữ liệu nào đó có đúng hay không).

Theo cách tiếp cận khác thì phân tích dữ liệu được chia thành 2 dạng: phân tích dữ

liệu định lượng (hay còn gọi là phân tích dữ liệu số, và các biến trong dữ liệu có thể

so sánh theo thống kê) so với phân tích dữ liệu định tính (chỉ tập trung vào các dữ

liệu không phải là dữ liệu số như video, hình ảnh và văn bản).

Trong thực tế, dữ liệu lớn và phân tích có thể được áp dụng trong nhiều lĩnh vực khác

nhau mà điển hình là lĩnh vực kinh doanh và với nhiều trường hợp sử dụng cụ thể

khác nhau. Sau đây là vài ví dụ:

Phân tích khách hàng: Các công ty có thể truy xuất thông tin dữ liệu giao dịch của

khách hàng để phân tích xu hướng nhu cầu của khách hàng thông qua đó nâng cao

tính năng sản phẩm dịch vụ, cải thiện tỉ lệ chuyển đổi và quan trọng là giữ khách hàng

tốt hơn.

Phân tích hoạt động: Nâng cao hiệu quả hoạt động sản xuất kinh doanh và tối ưu

hóa nguồn lực (tài sản) của công ty là mục tiêu của tất cả công ty. Phân tích big data

có thể giúp doanh nghiệp vận hành một cách hiệu quả hơn và cải thiện hiệu suất lao

dộng góp phần gia tăng lợi nhuận.

Phòng chống gian lận: Dựa vào dữ liệu lịch sử giao dịch khách hàng tham gia dịch

vụ tín dụng ở ngân hàng và dựa vào các mô hình, các thuật toán, chúng ta sẽ khám

phá ra những lổ hỗng trong kinh doanh, cũng như xác định các hoạt động mang tính

23

chất khả nghi giúp chỉ ra hành vi gian lận. Kết quả phân tích như vừa được nêu, có

một đống góp lơn giúp các tổ chức kinh doanh ngăn chặn kịp thời những gian lận từ

phía khách hàng và từ phía nhân viên hướng đến giảm thiểu rủi ro.

2.4.2. Hành vi tiêu dùng dựa trên phương pháp RFM

Trong thị trường cạnh tranh hiện nay, khách hàng được xem là một trong những ưu

tiên lớn nhất của công ty. Để tạo ra sự trung thành và giữ chân khách hàng, các công

ty cần xác định mối quan hệ khách hàng của họ dựa trên một số kỹ thuật RFM được

viết tắt từ Recency, Frequency, Monetary, ý nghĩa của từ yếu tố như sau: (i) Recency

là thời gian giao dịch gần nhất của khách hàng tính đến thời điểm nghiên cứu. Đây là

chỉ số quan trọng để xác định thời gian tham gia giao dịch tại ngân hàng. Điều này sẽ

giúp ngân hàng xác định được đâu là khách hàng mới và đâu là khách hàng cũ; (ii)

Frequency là chỉ số xác định số tần suất giao dịch trong lĩnh vực ngân hàng của suốt

thời gian nghiên cứu. Ví dụ trong nghiên cứu này, thời gian số liệu nghiên cứu là 12

tháng, tổng số lần giao dịch của khách hàng đến ngân hàng sẽ được xác định trong

trường hợp này. Những đối tượng khách hàng thường xuyên đến giao dịch sẽ là những

đối tượng có khả năng nhiều nhất trở thành hệ khách hàng trung thành ở mức cao

trong tương lai. Thông tin này một phần nào đó cũng sẽ xác định được sự hài lòng

của khách hàng đối với dịch vụ của đơn vị kinh doanh; (iii) Monetary là tổng giá trị

số dư của khách hàng tại ngân hàng trong thời gian nghiên cứu. Qua đó, công ty sẽ

có thông tin dữ liệu để phân loại mức dư nợ hoặc số dư nợ của khách hàng. Điều này

là cơ sở giúp ngân hàng xây dựng những chương trình, giải pháp chiến lược sản phẩm

hoặc dịch vụ phù hợp theo khả năng thanh toán hoặc chi trả của khách hàng.

Wu & Lin (2005) đã chứng minh rằng giá trị của R và F càng cao, khách hàng càng

có thể giúp việc đo lường về hành vi sử dụng dịch vụ của khách hàng tại ngân hàng.

Ngoài ra, giá trị M càng cao, khách hàng càng có thể được xem rằng, đánh giá giá trị

giao dịch của khách hàng để hướng đến nhóm khách hàng ở tầm cỡ hoặc qui mô giao

dịch.

24

Tất cả các khách hàng được phân tích dựa vào 3 tiêu chí: thời gian giao dịch gần nhất

(R), tần suất giao dịch (F) và giá trị giao dịch (M), các tiêu chí được đánh giá theo

thang điểm từ 1 năm đến 5 sẽ đóng góp vào việc thực hiện phân khúc thị trường. Chi

tiết phân khúc khách hàng theo RFM được mô tả chi tiết theo bảng 2.3.

Bảng 2.4. Bảng mô tả điểm theo RFM

Điểm Nhóm Recency (R) Frequency (F) Monetary (M)

1 Rất thấp Rất thấp Rất thấp

2 Rời dịch vụ (không chắc chắn) Nguy cơ Thấp Thấp Thấp

3 Thông thường Bình thường Bình thường Bình thường

4 Tiềm năng Cao Cao Cao

5 Tốt nhất Rất cao Rất cao Rất cao

Nguồn: Wu & Lin (2005)

2.5. Mô hình đề xuất cho nghiên cứu

Mô hình Fraud được gọi là mô hình gian lận, mô hình này được xem xét dựa trên sự

tham gia các thông tin về hồ sơ tham gia dịch vụ của khách hàng tại ngân hàng, thông

tin giao dịch và lịch sử giao dịch vủa khách hàng khi đến tham gia. Như được chỉ ra

ở biểu đồ 2.1 (Eshghi & Kargari, 2019), chuỗi tiếp cận để đi vào phân tích tính gian

lận sẽ bao gồm về xu hướng các đặc điểm mới bao gồm về số lượng tham gia giao

dịch, thời gian và khoảng thời gian. Tiếp theo đó là các mức độ về thông tin cá nhân,

chủ tài khoản và các thông tin về đặc điểm được xét duyệt khi tham gia giao dịch, ví

dụ: tài sản nhà, chức vụ công việc, trình độ học vấn. Kế đến là các hoạt động tham

gia, ví dụ tham gia giao dịch vay, thẻ tín dụng, gia hạn. Sau cùng là thời gian có thể

được đo lường đánh giá theo ngày trong tuần, hay ngày trong tháng, tuần trong tháng,

ngày trong năm, tuần trong năm, tháng trong năm, tháng trong vụ mùa, và tổng thể.

25

Biểu đồ 2.1: Tiến trình tiếp cận phục vụ mô hình fraud

Mức độ

Xu hướng của đặc điểm mới

Hoạt động kinh doanh/dịch vụ

Các kênh tham gia

Thời kỳ của giao dịch khách hàng

Cá nhân

Tổng thể

Kênh loại 1

Ngày trong tuần

Kinh doanh 1

Chủ thời khoản

Kênh loại# …

Ngày trong tháng

Thời gian

Tổng thể chung

Tuần trong tháng

Khoảng thời gian

Kinh doanh# … Kinh doanh thứ n

Kênh loại thứ n

Ngày trong năm

Tuần trong năm

Tổng các hoạt động

Tổng thể các kênh

Tháng trong năm

Tháng mùa vụ

Tổng thể

Nguồn: (Eshghi & Kargari, 2019)

Xuất phát từ việc ứng dụng mô hình gian lận Fraud, thuật toán được áp dụng trong

nghiên cứu này là công cụ C5.0 có trong phần mềm IBM SPSS-MODLER. Việc sử

dụng phương pháp này được sự hướng dẫn của và hỗ trợ của giáo viên hướng dẫn.

Thuật toán C5.0, được xem là thuật toán phân lớp dữ liệu dựa trên cây quyết định của

thông tin giao dịch khách hàng. Thuật toán này có cơ chế sinh cây quyết định hiệu

quả và chặt chẽ bằng việc sử dụng mức độ lựa chọn thuộc tính tốt nhất là information-

gain. Các cơ chế xử lý với giá trị lỗi, thiếu và chống “quá vừa” dữ liệu với cơ chế cắt

tỉa cây để tạo nên sức mạnh. Mô hình C5.0 còn giúp cho việc dự báo dựa trên thông

tin ban đầu của khách hàng, hoặc thông tin hành vi giao dịch theo thời gian. Mô hình

Fraud được thực hiện qua thành 3 bước.

Bước 1: Xác định sự gian lận của việc đánh giá hồ sơ ban đầu do khách hàng cung

cấp. Việc xếp hạng này được chia làm 3 mức: TỐT, VỪA, XẤU. Các thông tin được

xếp hạng được dựa vào thông tin hồ sơ của ứng viên tiếp cận ngân hàng cho vay vốn,

26

tham gia dịch vụ thẻ, hoặc gia hạn dịch vụ sử dụng. Thông tin bao gồm: Thu nhập

bình quân/tháng, tài sản nhà ở, loại khách hàng (cũ, mới), quan hệ cộng đồng, học

vấn, chức vụ lãnh đạo và gia cảnh. Với nguồn thông tin vừa nêu, hồ sơ của khách

hàng sẽ được đánh giá xếp hạng (RANK_HOSO) được xem như là trường mục tiêu

(target field).

Việc gian lận này có thể xảy ra các trường hơp: (i) Hồ sơ xấu được đánh giá thành

tốt, lỗi này có thể do nhân viên trực tiếp gian lận trong quá trình đánh giá hồ sơ, hoặc

do khách hàng cố tình gian lận trong khai báo; (ii) Hồ sơ tốt được đánh giá thành

xấu, điều này có thể do sự gian lận của nhân viên trực tiếp thẩm định hồ sơ, điều này

xảy ra có thể do nhân viên thẩm định có thành ý không tốt đối với khách hàng tham

gia giao dịch nên tâm đánh giá có sự lệch so với thực tế; (iii) Hồ sơ vừa được đánh

giá thành tốt hoặc xấu, điều này có thể do gian lận xuất phát từ nhân viên trong ngân

hàng tham gia trực tiếp thẩm định hồ sơ.

Bước 2: Xác định sự gian lận sau khi khách hàng đã được tham gia dịch vụ trên 12

tháng. Hành vi tham gia này thông qua lịch sử giao dịch được đánh giá dựa vào các

chỉ số thuộc RFM. Cụ thể dựa vào lần dịch vụ gần nhất (Recency)- Tần suất tham gia

giao dịch (Frequency)- Tổng số tiền/số dư tài khoàn tham gia giao dịch (Monetary)

của khách hàng. Ba thông số trên hợp thành RFM để xác định lòng trung thành của

khách hàng một khi RFM càng lớn và ngược lại một khi RFM càng nhỏ cho thấy sự

xa rời hoặc có khả năng rời dịch vụ của khách hàng càng nhiều. Như vậy sự gian lận

có thể từ hồ sơ ban đầu được đánh giá xấu, nhưng sau 12 tháng lịch sử giao dịch,

khách hàng này không như đánh giá ban đầu, tức là sau 12 tháng giao dịch, hành vi

biểu hiện tốt. Điều này có thể là do gian lận của nhân viên trực tiếp thẩm định từ ban

đầu. Trường hợp sau 12 tháng tham gia giao dịch, khách hàng được đánh giá có hồ

sơ rất tốt từ ban đầu, nhưng lại cho RFM nhỏ, tức là lòng trung thành rất thấp, điều

này cho thấy, có sự gian lận về khai báo hồ sơ của khách hàng, để cố tình tìm được

ưu đãi trong giao dịch, hoặc do nhân viên thẩm định chủ động đánh điểm tốt. Đồng

thời trong bước này, có kết hợp với số dư của khách hàng tham gia giao dịch. Tuy

27

nhiên cũng có những trường hợp ngược lại, ban đầu hồ sơ được xếp hạng không cao,

nhưng sau quá trình giao dịch trên 12 tháng, kết quả cho RFM cao, điều này cho thấy,

khách hàng đã chịu một sự thiệt thòi trong thẩm định của nhân viên thẩm định. Điều

này cũng có thể do khách hàng không được lòng nhân viên nên vì thế kết quả xếp

hạng thấp ban đầu.

Bước 3: Từ kết quả của bước 1 và bước 2, bước 3 này sẽ giúp xác định nhóm có tính

gian lận thật sự dựa vào 2 bước trước đó. Một khi khách hàng được xếp vào nhóm

gian lận ở bước 1 và gian lận ở bước 2, khách hàng sẽ được đưa vào nhóm có tính

gian lận cảnh báo cao. Ngược lại những nhóm khách hàng không thuộc nhóm gian

lận ở bước 1 và bước 2, nhóm này sẽ được xem là quá trình đánh giá đúng khách

hàng tham gia dịch vụ, không có sự gian lận xảy ra kể cả trong hồ sơ và trong lịch sử

giao dịch.

Tóm lại: Việc sử dụng mô hình gian lận Fraud sẽ góp phần mang đến hai thông điệp

quan trọng, trong đó có thể giúp cho việc xác định tính gian lận thuộc phía nhân viên

gân hàng, hoặc tính gian lận thuộc vào nhóm khách hàng. Một khi các thông tin này

được xác định, các giải pháp kịp thời vô cùng quan trọng vì làm chặn đứng những rủi

ro trong tương lai. Góp phần cũng cố trong quản lý tốt hơn và thẩm định hồ sơ đúng

với đối tượng khách hàng.

28

CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ

PHÂN TÍCH DỮ LIỆU

A. BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SCB

3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng

3.1.1. Big data

Đã có nhiều công trình nghiên cứu rất thành công trong việc sử dụng Big Data để

phân tích mức độ tiêu dùng của khách hàng. Tuy nhiên, điểm chung của các nghiên

cứu này đều chỉ ra rằng Big Data luôn cho phép tổ chức kinh doanh thao tác quản lý

các tập dữ liệu cực kỳ lớn và phức tạp mà không một ứng dụng xử lý dữ liệu truyền

thống nào có thể hỗ trợ.

Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc.

Các hoạt động được tạo lập trong hệ thống đều được Big Data ghi lại. Đối với hoạt

động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong

suốt thời gian giao dịch, dữ liệu này sẽ ngày càng phong phú, đa dạng hơn theo thời

gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử dụng trong việc truy vấn

thông tin để phát triển chiến lược kinh doanh, hay tạo lập môi trường quản lý chuyên

nghiệp.

Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân

hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh

trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng

đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản lý doanh

nghiệp và xác định sự gian lận trong kinh doanh, trong đó gian lận từ phía nhân viên

và từ phía khách hàng. Vô hình chung, Big Data đóng vai trò quan trọng trong việc

truy xuất dữ liệu và hỗ trợ con người đưa ra quyết định tốt hơn với cơ hội thành công

cao hơn nhiều.

29

3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng

Nguồn dữ liệu Big Data đều có hầu hết trong các lĩnh vực kinh tế xã hội, lĩnh vực

ngân hàng và dịch vụ tài chính. Mọi giao dịch của khách hàng tại ngân hàng đều tạo

ra hồ sơ điện tử, các bản sao lưu được lưu theo quy định của pháp luật. Nhờ phân tích

ưu việt của Big Data, các dịch vụ tài chính của các công ty không còn lưu trữ dữ liệu

theo yêu cầu bắt buộc như trước đây mà giờ họ chủ động hơn trong việc trích xuất dữ

liệu để từ đó xây dựng giải pháp chiến lược cải thiện hoạt động, tăng lợi nhuận cho

tổ chức.

Nói tóm lại, Big Data là một nguồn tài nguyên quan trọng và cần thiết trong giai đoạn

hội nhập ngày nay, bởi cốt lõi của Big Data là nền tảng tạo ra lợi thế cạnh tranh trong

bất kỳ một tổ chức tài chính nào không chỉ riêng ngân hàng. Bằng việc phân tích xử

lý nguồn dữ liệu này giúp nhà lãnh đạo nắm bắt và dự đoán được nhu cầu thay đổi

tiêu dùng của khách hàng như thế nào để từ đó đưa ra những chiến lược phù hợp. Dữ

liệu lớn sẽ không chỉ mang lại diện mạo hoàn toàn mới cho doanh nghiệp, mà hơn

thế nữa nó còn tạo ra một quy trình đổi mới cho từng loại dịch vụ đáp ứng nhu cầu

ngày càng đa dạng của khách hàng góp phần thúc đẩy phát triển doanh nghiệp, đảm

bảo lợi nhuận ngày càng tăng đồng thời cũng tối thiểu hóa các rủi ro và tiết kiệm chi

phí.

Xét hệ quy chiếu gồm 3 yếu tố: sản phẩm dịch vụ, bộ phận chăm sóc khách hàng,

chức năng điều hành trong các tổ chức kinh doanh về mảng tài chínnh – dịch vụ, thì

Big Data có thể được xem như là một công cụ khai thác hiệu quả nhất trong việc xây

dựng chiến lược dựa trên sự tổ hợp các thành phần: kiến thức, mô hình kinh doanh

và khả năng áp dụng công nghệ để tạo ra cơ hội cạnh tranh cho tổ chức. Với từng

mục đích cụ thể cũng như việc xử lý nguồn tài nguyên Big Data khác nhau của các

tổ chức khác nhau, sẽ đem lại nhiều trường hợp ứng dụng dữ liệu lớn khác nhau, đặc

biệt và mang tính chất chuyên biệt. Dưới đây là những ví dụ minh họa các trường hợp

phổ biến và mảng dịch vụ tài chính ngân hàng được ra làm mẫu nghiên cứu để tìm và

phát triển các giá trị ẩn sâu bên trong ứng dựng phân tích Dữ liệu lớn.

30

Ngân hàng có khả năng truy cập trực tiếp và tiếp cận thông tin một cách dễ dàng, các

dữ liệu lịch sử liên quan đến thói quen và hành vi chi tiêu của khách hàng. Ngân hàng

cũng nắm giữ các thông tin tài chính của khách hàng: tiền lương chuyển khoản cụ thể

mỗi tháng, tiền gửi tiết kiệm tại các tổ chức tín dụng, hay các chi phí sinh hoạt liên

quan đến công ty cung ứng dịch vụ tiện ích (điện, nước, dịch vụ internet...) khi khách

hàng sử dụng các sản phẩm dịch vụ ngân hàng... Điều này cung cấp cơ sở và cơ hội

để các ngân hàng có thể truy cập và phân tích dữ liệu một cách chuyên sâu hơn phục

vụ từng mục đích nhu cầu cụ thể. Bằng cách áp dụng chức năng sàng lọc thông tin về

thời gian, điều kiện kinh tế vĩ mô (thất nghiệp, lạm phát, cung cầu thị trương…) thì

người phân tích sẽ càng hiểu rõ hơn nhu cầu chi tiêu tăng/giảm của khách hàng xuất

phát từ đâu. Đây là một trong bước đầu tiên cũng như là những yếu tố cơ bản cho

trong quá trình đánh giá rủi ro, sàng lọc tổng thể thông tin từ đó đánh giá khả năng

vay vốn (tài chính, tài sản) của khách hàng và hơn hết là xây dựng chiến lược bán

chéo sản phẩm, tối ưu hóa tiện ích cho khách hàng.

Việc tiếp cận thông tin ban đầu với khách hàng hết sức quan trọng trong việc tìm hiểu

nhu cầu, tạo lập thông tin để từ đó thiết lập sản phẩm dịch vụ phù hợp với khách hàng

dựa trên các thông tin và tài liệu được cung cấp trong quá trình trao đổi. Big Data sẽ

là kho dữ liệu cung cấp cho ngân hàng các thông tin cá nhân và lịch sử giao dịch của

khách hàng để từ đó có sơ sở trong việc phân loại khách hàng dựa trên các thông số

khác nhau, bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng

dịch vụ.

Lợi ích mang lại của việc xác định phân khúc khách hàng là cho phép các ngân hàng

xây dựng các chiến dịch tiếp thị phù hợp để đáp ứng nhu cầu chính xác của khách

hàng. Tuy nhiên, việc thu thập và đánh giá thông tin các yêu cầu cần có sự đầu tư

chỉnh chu vào cơ sở hạ tầng của doanh nghiệp cũng như đầu tư vào mạng lưới kết nối

giữa tất cả nhân viên của các bộ phận, phòng ban chức năng đồng thời chú trọng tân

tiến công nghệ, phần mềm kỹ thuật tốt để thuận lợi cho quá trình khai thác Dữ liệu

lớn.

31

Tùy vào mục đích, cơ cấu, nguồn lực, khả năng khác nhau ở mỗi tổ chức mà sẽ có

nhiều trường hợp ứng dụng big data khác nhau, mang tính chất đặc thù, riêng biệt.

Phân tích các thói quen chi tiêu của khách hàng

Các ngân hàng có khả năng truy cập trực tiếp nguồn thông tin, dữ liệu lịch sử dồi dào

liên quan đến các thói quen, hành vi chi tiêu của khách hàng. Các ngân hàng còn nắm

thông tin về số tiền một khách hàng được trả bao nhiêu ví dụ như mức lương cụ thể

trong bất kỳ tháng nào, số tiền được chuyển vào tài khoản tiết kiệm, số tiền đã được

thanh toán đến các công ty thanh toán tiện ích (điện lực, nước, internet…) thời gian

sử dụng dịch vụ của ngân hàng…Điều này cung cấp cơ sở, cơ hội để các ngân hàng

tiếp cận và phân tích dữ liệu sâu hơn. Áp dụng các chức năng sàng lọc thông tin (filter

function) mà nhân viên ngân hàng có thể hiểu được nguyên nhân tác động làm mức

lương của khách hàng tăng hay giảm và khả năng chi tiêu của khách hàng thay đổi

như thế nào. Đây là một trong những yếu tố nền tảng cho quá trình đánh giá rủi ro,

sàng lọc, thẩm định hồ sơ cho vay, đánh giá khả năng thế chấp và cung cấp nhiều sản

phẩm tài chính khác (cross-selling) đến khách hàng như bảo hiểm.

Các ngân hàng được hưởng lợi rất nhiều nếu biết được thông tin khách hàng rút tiền

mặt – tất cả số tiền có được vào ngày trả lương hoặc nếu muốn giữ tiền lại trên thẻ

tín dụng/thẻ ghi nợ. Tận dụng điều đó, ngân hàng có thể tiếp cận khách hàng, mở

rộng dịch vụ, thu hút khách hàng đầu tư vào các khoản vay ngắn hạn với tỷ lệ thanh

toán cao và lãi suất thích hợp.

Phân khúc khách hàng và thẩm định hồ sơ

Một khi các phân tích ban đầu về các thói quen chi tiêu của khách hàng cùng với xác

định các loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên, ví dụ khách hàng

muốn gửi tiền tiết kiệm hay muốn đầu tư vào vào các khoản vay) được hoàn tất thì

các ngân hàng sẽ có được một cơ sở dữ liệu (database) phục vụ cho quá trình phân

khúc phân loại khách hàng một cách phù hợp dựa vào thông tin và hồ sơ khách hàng

cung cấp. Những khách hàng nào chi tiêu dễ dàng thoải mái, các nhà đầu tư nào thận

32

trọng kỹ lưỡng, khách hàng nào thanh toán các khoản nợ nhanh chóng, khách hàng

nào bắt đầu trả nợ khi sắp đáo hạn, thời gian khách hàng vào sử dụng dịch vụ của

ngân hàng để đo lường lòng trung thành…biết được hồ sơ cá nhân của tất cả khách

hàng giúp ngân hàng đánh giá chi tiêu và thu nhập dự kiến trong tháng tới và lập kế

hoạch chi tiết để đảm bảo lợi nhuận cho chính tổ chức là lợi nhuận cho chính khách

hàng.

Big data sẽ cung cấp cho các ngân hàng những hiểu biết kiến thức chuyên môn sâu

về thói quen và mô hình chi tiêu khách hàng, đơn giản hóa những nhiệm vụ xác định

nhu cầu và mong muốn của họ. Bằng cách có thể theo dõi từng giao dịch của khách

hàng, các ngân hàng sẽ có thể phân loại khách hàng dựa trên các thông số khác nhau,

bao gồm các dịch vụ thường được khách hàng sử dụng, thời gian sử dụng dịch vụ,

thói quen chi tiêu khi dùng thẻ tín dụng hoặc thậm chí là giá trị tài sản ròng.

Lợi ích mà phân khúc khách hàng mang lại là nó cho phép các ngân hàng nhắm mục

tiêu khách hàng tốt hơn với các chiến dịch tiếp thị có liên quan được thiết kế để đáp

ứng chính xác nhu cầu của khách hàng.

Việc phân tích dữ liệu big data tăng khả năng cho các công ty, nắm được nhu cầu

tiềm ẩn bên trong của từng khách hàng từ đó tạo được phân khúc thị trường. Tuy

nhiên việc thu thập và đánh giá thông tin khách hàng đòi hỏi sự đầu tư vào cơ sở hạ

tầng của tổ chức cũng như đầu tư vào mạng lưới liên kết giữa các nhân mọi phòng

ban, bộ phận chức năng của tổ chức với công nghệ, phần mềm kỹ thuật tiên tiến phục

vụ quá trình khai thác big data.

Bán kèm thêm các dịch khác (cross-selling)

Dựa trên cơ sở dữ liệu của Big Data mà các ngân hàng có thể thu hút hoặc giữ chân

khách hàng bằng cách phát triển các dòng sản phẩm mới đa tiện ích hoặc cải thiện

chính sách chăm sóc khách hàng. Ngân hàng có thể đưa ra nhiều sự lựa chọn cho

khách hàng chẳng hạn: giới thiệu các khoản đầu tư với lãi suất hấp dẫn cho phân khúc

khách hàng tiền gửi, đang nhàn rỗi vốn. Hoặc ngân hàng cũng có thể đưa ra các gói

33

tín dụng ngắn hạn cho phân khúc khách hàng có thói quen chi tiêu "thoải mái" cho

nhu cầu tiêu dùng phục vụ nhu cầu đời sống hàng ngày của họ hoặc phân khúc khách

hàng kẹt vốn trong việc thanh toán các khoản đầu tư nhà, xe khi dòng thu nhập chưa

về kịp. Việc phân tích chính xác thông tin dữ liệu hồ sơ của khách hàng sẽ giúp ngân

hàng có thể xây dựng chiến lược marketing bán chéo các sản phẩm dịch vụ khác hiệu

quả hơn và thu hút nhiều khách hàng hơn từ đó góp phần tăng doanh thu cho doanh

nghiệp.

Xây dựng hệ thống thu thập các phản hồi của khách hàng (feedback) và phân

tích chúng

Xây dựng hệ thống ghi nhận phản hồi từ khách hàng sau mỗi lần khác hàng sử dụng

sản phẩm dịch vu: phản hồi trực tiếp tại quầy hay đường dây nóng của Trung tâm

dịch vụ khách hàng, phản hồi qua thư điện tử, hòm thư góp ý hoặc qua fanpage của

ngân hàng thông qua uứng dụng mạng xã hội (facebook, zalo...). Các công cụ phân

tích của Big Data có thể tìm kiếm để sàng lọc thông và thu thập tất cả dữ liệu được

đề cập tới thương hiệu của ngân hàng để có thể phản hồi một cách nhanh chóng và

đầy đủ cho khách hàng. Đồng thời, công cụ này cũng hỗ trợ trong việc ngăn chặn

những tin đồn ảnh hưởng đến hoạt động kinh doanh và niềm tin của khách hàng vào

ngân hàng, thực trạng này cũng đã xảy ra tại một số ngân hàng Việt Nam hiện nay.

Với tâm lý của một khách hàng nghĩ rằng nếu ngân hàng sẵn sàng lắng nghe khách

hàng và đánh giá cao những ý tưởng đóng góp vào việc phát triển cải tiến sản phẩm

dịch vụ tốt hơn thì không lý do nào mà khách hàng có thể từ bỏ để đến một điểm giao

dịch khác. Muốn được như vậy, điều đầu tiên là phải thể hiện được tinh thần “luôn

luôn lắng nghe và luôn luôn thấu hiểu khách hàng” thông qua việc thiết lập xây dựng

một trung tâm dữ liệu - trung tâm này sẽ lưu trữ tất cả các tương tác của khách hàng

với các thương hiệu bao gồm cơ sở dữ liệu riêng tư, lịch sử giao dịch... với mục đích

là hỗ trợ phát triển chiến lược để đáp ứng những gì khách hàng đang mong muốn để

gia tăng lòng trung thành của khách hàng đối với doanh nghiệp.

34

Marketing theo hướng cá nhân hóa

Khi phân khúc khách hàng đã được xác định từ việc phân tích dữ liệu lớn, các ngân

hàng có thể xây dựng chính sách marketing theo hướng cá nhân hóa để nhắm vào

đúng nhu cầu và mục tiêu khách hàng cần dựa trên sự phân tích về thói quen chi tiêu

cá nhân của họ thông qua lịch sử giao dịch. Ngoài ra, để đảm bảo dữ liệu về lịch sử

giao dịch của khách hàng, ngân hàng cần kết hợp dữ liệu không có cấu trúc - một

dạng dữ liệu Big Data được thu thập từ các ứng dụng mạng xã hội như hồ sơ thông

tin khách hàng trên Facebook, Zalo .. để hoàn thiện hơn bức tranh toàn cảnh thể hiện

nhu cầu của khách hàng dựa trên phân tích tâm lý nhu cầu khác nhau của khách hàng

tại các thời điểm khác nhau. Mặt khác, dữ liệu của khách hàng trong các phương tiện

xã hội nền tảng hay thông qua các ứng dụng xã hội thông minh khác sẽ phần nào giúp

các ngân hàng phân tích được các rủi ro có thể xảy ra, từ đó có thể đưa ra quyết định

nên cho vay hay không ngoài việc nhìn nhận và đánh giá hồ sơ như cách truyền thống

bây giờ.

Sau khi phân tích và dự đoán được nhu cầu cụ thể của từng đối tượng khách hàng,

dựa trên cơ sở dữ liệu đó ngân hàng đưa ra các giải pháp, kế hoạch tiếp thị phù hợp

để từ đó tăng cơ hội đồng ý sử dụng dịch vụ ngân hàng từ khách hàng. Có nhiều cách

tiếp thị khác nhau, chẳng hạn các ngân hàng có thể tiếp thị qua e-mail để gửi cho

khách hàng những thông tin ưu đãi mới nhất về các dịch vụ cho vay ngắn hạn với lãi

suất cạnh tranh trên thị trường hoặc tiền gửi với lãi suất hấp dẫn hay các chương trình

dự thưởng đặc biệt...Việc tạo ra các sản phẩm và dịch vụ phù hợp cho từng phân khúc

khách hàng cụ thể sẽ giúp các ngân hàng nâng cao hình ảnh thương hiệu và tạo dựng

mối quan hệ tốt đối với khách hàng.

Thay đổi cách thức cung cấp dịch vụ đến khách hàng.

Hệ thống Dữ liệu lớn được xem là một hệ thống phức tạp liên kết với nhiều bộ phận

có các chức năng khác nhau, nhưng công việc chính của nó là giúp nhà điều hành có

thể đưa ra các quyết định dễ dàng hơn trên cơ sở phân tích các thông tin được cập

nhật từ hệ thống. Bất cứ khi nào thông tin giao dịch của khách hàng được nhập vào

35

hệ thống, hệ thống Dữ liệu lớn sẽ hỗ trợ sàng lọc tất cả dữ liệu và truyền tải hoặc cung

cấp dữ liệu cần thiết để phục vụ nhu cầu phân tích quy trình. Công cụ Big Data cho

phép các ngân hàng tối ưu hóa trong quy trình làm việc và tiết kiệm cả thời gian lẫn

các chi phí phát sinh. Đồng thời dữ liệu lớn cũng cho phép các tổ chức tài chính xác

định và khắc phục sự cố trước khi chúng ảnh hưởng đến khách hàng của họ.

Với thời đại công nghệ 4.0 hiện nay, các ngân hàng ngày nay có hàng nghìn cách để

tìm hiểu nhu cầu của khách hàng. Nhưng với công cụ phân tích của Big Data cho

phép người dùng khai thác tối ưu hơn nguồn tài nguyên thông tin sẵn có để phục vụ

nhu cầu phát triển kinh doanh doanh nghiệp. Muốn làm được điều này, đội ngũ nhân

viên ngân hàng cần được đào tạo kỹ năng phân tích và khai thác dữ liệu tốt. Điều này

sẽ tạo ra một giải pháp khả thi, ngay thời điểm hiện tại hoặc trong tương lai gần. Hiện

tại, các ngân hàng có nguồn vốn lớn đã có những kế hoạch rõ ràng để đầu tư hệ thống

dữ liệu lớn và nghiên cứu cách phân tích hiệu quả nguồn tài nguyên từ hệ thống Dữ

liệu lớn này. Từ việc hiểu được nhu cầu của khách hàng thông qua kết quả phân tích

hành vi người tiêu dùng, các ngân hàng cần phải tổ chức nhiều hơn các hoạt động nội

bộ, cải thiện dịch vụ kịp thời và kiểm soát chi phí hoạt động tốt nhất hoặc đưa ra giải

pháp tài chính đa tính năng cho khách hàng nhằm giữ chân khách hàng và thu lợi

nhuận cho doanh nghiệp.

Phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật

Dựa vào dữ liệu về lịch sử giao dịch và hồ sơ tín dụng của khách hàng, ngân hàng sẽ

có thể xác định hay nhận định được cảnh báo những bất thường xảy ra trong quá trình

hoạt động, cung cấp dịch vụ cho khách hàng. Big data sẽ cho phép các ngân hàng

đảm bảo rằng không có giao dịch trái phép nào được thực hiện, cung cấp mức độ an

toàn, nâng cao tiêu chuẩn bảo mật của toàn bộ ngành.

Kiểm soát rủi ro, minh bạch báo cáo

Ngoài việc phát hiện và ngăn chặn hành vi lừa đảo, vi phạm để bảo vệ lợi ích nguời

tiêu dùng các ngân hàng có thể ứng dụng Big data để đo lường, kiểm soát rủi ro khi

36

thực hiện các giao dịch. Các thuật toán big data còn giúp giải quyết các vấn đề về

tuân thủ quy định pháp luật và kế toán, kiểm toán và báo cáo tài chính minh bạch

nhằm hợp lý hóa các hoạt động của tổ chức từ đó giảm được chi phí quản lý.

3.2. Ứng dụng big data tại Ngân hàng TMCP Sài Gòn (SCB)

3.2.1. Giới thiệu về SCB

Ngân hàng TMCP Sài Gòn (SCB) được Thống đốc NHNN chính thức cấp Giấy phép

số 283/GP-NHNN về việc thành lập và hoạt động Ngân hàng TMCP Sài Gòn (SCB)

vào ngày 26/12/2011 trên cơ sở hợp nhất tự nguyện 3 ngân hàng: Ngân hàng TMCP

Sài Gòn (SCB), Ngân hàng TMCP Đệ Nhất (Ficombank), Ngân hàng TMCP Việt

Nam Tín Nghĩa (TinNghiaBank). Ngân hàng TMCP Sài Gòn (Ngân hàng hợp nhất)

chính thức đi vào hoạt động từ ngày 01/01/2012.

Trên cơ sở thừa kế những thế mạnh vốn có của 3 ngân hàng, cùng sự quyết tâm của

Hội đồng Quản trị, Ban điều hành, toàn thể CBNV, đặc biệt là sự tin tưởng và ủng hộ

của Quý Khách hàng, Cổ đông, đến nay, Ngân hàng TMCP Sài Gòn – SCB đã không

ngừng lớn mạnh, vươn lên vị thế Top 5 ngân hàng TMCP có quy mô lớn nhất Việt

Nam với tổng tài sản hơn 566.834 tỷ đồng, vốn điều lệ hơn 15.231 tỷ đồng tính đến

31/12/2019. Với 239 điểm giao dịch, hiện nay mạng lưới hoạt động của SCB đang

phủ rộng khắp 28 tỉnh/thành thuộc các vùng kinh tế trọng điểm của cả nước, cùng đội

ngũ nhân sự hơn 6.700 người. Tiềm lực tài chính vững mạnh, tốc độ tăng trưởng

nhanh, công nghệ hiện đại, danh mục các sản phẩm đa dạng cùng chất lượng dịch vụ

không ngừng được nâng cao, đây chính là nền tảng để SCB phát triển mạnh mẽ theo

định hướng trở thành ngân hàng bán lẻ - đa năng - hiện đại hàng đầu Việt Nam. Bên

cạnh cung cấp các giải pháp tài chính trọn gói, đáp ứng mọi nhu cầu của Khách hàng,

SCB tự hào mang lại giá trị và đảm bảo quyền lợi thiết thực cho Đối tác, Cổ đông;

cũng như xây dựng chế độ phúc lợi và môi trường làm việc tốt nhất cho đội ngũ

CBNV.

37

Với Tầm nhìn, Sứ mệnh và Giá trị cốt lõi đã được xác lập, trong quá trình hoạt động

kinh doanh SCB luôn trung thành với những cam kết giá trị bền vững. Trong năm

2019 SCB đã đạt được một số thành tựu sau: Ngân hàng bán lẻ sáng tạo nhất Việt

Nam, Ngân hàng đầu tư tốt nhất Việt Nam, Ngân hàng có các hoạt động vận hành

giao dịch thẻ tại nước ngoài tốt nhất năm 2019, Ngân hàng có dịch vụ khách hàng tốt

nhất Việt Nam, Ngân hàng có sản phẩm dịch vụ sáng tạo tiêu biểu, Ngân hàng xuất

sắt về ngoại hối Việt Nam, Ngân hàng bán lẻ tốt nhất Việt Nam, Top 10 Ngân hàng

TMCP uy tín,….

B. PHÂN TÍCH DỮ LIỆU BIG DATA

4.1. Số liệu phục vụ nghiên cứu

Như đã trình bày ở chương 1, số liệu phục vụ nghiên cứu cho đề tài được trích xuất

từ nguồn kho dữ liệu data warehouse của ngân hàng. Thời gian nghiên cứu của dữ

liệu là 12 tháng tính từ ngày 01/1/2019 đến ngày 31/12/2019. Khách hàng trong

nghiên cứu là các khách hàng hiện đang tham gia giao dịch tại SCB và có thời gian

tham gia dịch vụ trên 12 tháng, việc chọn này giúp loại bỏ những thông tin không

chính xác đối với những khách hàng có thời gian giao dịch dưới một năm, điều này

có thể làm nhiễm kết quả nghiên cứu. Số khách hàng trong nghiên cứu là khách hàng

đang tham gia giao dịch tại một phòng giao dịch của quận.

4.2. Thông tin giao dịch khách hàng

4.2.1. Đối với khách hàng tham gia dịch vụ vay

Kết quả thống kê mô tả trong nghiên cứu, giới tính khách hàng dường như không

khác biệt nhiều, theo biểu đồ 4.1, nam chiếm 55% và nữ chiếm 45% trong tổng số

khách hàng trong nghiên cứu. Điều này cho thấy, người nữ hiện tại đã có một vai trò

lớn hơn trong xã hội, có nguồn thu nhập, tự chủ tham gia dịch vụ, cũng như tự có tài

khoản ngân hàng cá nhân tại SCB.

Xét về trình độ học vấn, khách hàng có trình độ đại học chiếm 67% (hình 4.2), sau

đại học 7% (thạc sĩ và tiến sĩ). Thông tin này phần nào cho thấy, khách hàng tham

38

gia dịch vụ có một nhận thức nhất định, điều này cũng sẽ cho thấy mức độ thu nhập

ở chừng mực nào đó có thể được dự báo về mức thu nhập ổn định hơn. Kết quả này

sẽ là một thông điệp để các nhà làm chiến lược kinh doanh, marketing luôn có một

cẩn trọng trong nhận định sự hiểu biến, kiến thức đánh giá của khách hàng về chất

lượng dịch vụ của ngân hàng.

Nữ 45%

Nam 55%

Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.1: Thông tin giới tính khách hàng

Thạc sĩ 6%

Đại học 67%

Tiến sĩ 1%

Trung cấp 13%

Cao đẳng 13%

Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.2: Thông tin trình độ học vấn

39

Xét trên gốc độ nghề nghiệp, biểu đồ 4.3 đã thông tin, số khách hàng có vị trí lãnh

đạo cấp tầm trung và giám đốc chiếm 43.2%, nhân viên văn phòng chiếm 29%, công

nhân 27.6%. Tỷ lệ khách hàng thuộc nhóm đã hưu chiếm một tỷ lệ rất nhỏ 0.2%. Do

vậy, từ sau mục này, nghiên cứu sẽ chỉ tập trung vào vị trí việc làm của 4 nhóm: Giám

đốc, quản lý cấp trung, nhân viên văn phòng, và công nhân.

Biểu đồ 4.3: Nghề nghiệp của khách hàng

Hưu 0,2%

Giám đốc 22,0%

Công nhân 27,6%

Quản lý tầm trung 21,2%

Nhâ viên VP 29,0%

Nguồn: Số liệu big data của Ngân hàng

Xét trên loại khách hàng đang tham gia giao dịch tại ngân hàng nghiên cứu, số khách

hàng tiếp cận hướng đến giao dịch vay vốn tiêu dùng cá nhân chiếm 63%, khách hàng

tiếp cận thực hiện giao dịch thẻ tín dụng chiếm 34% và 3% nhóm khách hàng còn lại

tham gia vay vốn phục vụ kinh doanh gia đình (biểu đồ 4.4)

40

KH Hộ kinh doanh 3%

KH tiêu dùng cá nhân 63%

KH thẻ tín dụng 34%

Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.4: Loại khách hàng sử dụng dịch vụ tại ngân hàng

Như đã nêu trong số liệu được trích ra, số khách hàng trong nghiên cứu phải có thời

gian tham gia dịch vụ (length of stay) trên 12 tháng trở lên. Nếu phân thời gian tham

gia dịch vụ thành các nhóm thời gian, biểu đồ 4.5 cho thấy tỷ lệ số khách hàng có

thời gian tham gia giao dịch từ >12 – 31 tháng chiếm 37.5%, kế đến >31 – 45 tháng

chiếm 20.7% (biểu đồ 4.5).

Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.5: Thời gian tham gia dịch vụ của

Nếu kết hợp thời gian tham gia dịch vụ và loại khách hàng tham gia dịch vụ, biểu đồ

4.6 cho thấy đa số khách hàng có thời gian tham gia dịch vụ >12-31 tháng, số khách

hàng vay tiêu dùng cá nhân chiếm tỷ lệ lớn nhất, trong khi đó nhóm khách hàng có

thời gian tham gia dịch vụ >31 tháng đến 45 tháng có số lượng khách hàng thẻ tín

41

dụng. Điều này phần nào cho thấy số khách hàng sử dụng thẻ tín dụng có thời gian

gắn kết với SCB khá lâu trên 3 năm.

Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.6: Thời gian tham gia dịch vụ theo loại khách hàng

4.2.2. Thông tin khách hàng sử dụng thẻ

Có nhiều loại thẻ được sử dụng bởi khách hàng trong nghiên cứu. Như kết quả ở biểu

đồ 4.7, có 7 loại thẻ chính được khách hàng quan tâm và sử dụng phổ biến nhất, điển

hình VG (Visa Gold), VC (Visa Classis), MG (Master Gold), MS (Master Standard),

VP (Visa Platinum), VV (Viva Violet Card), và VA (Visa Auto Card), trong đó VG

và VC là hai loại thẻ được khách hàng sử dụng phổ biến nhất chiếm 46.55%. Kết quả

này, phần nào khẳng định VG và VC có tính năng công dụng và lợi ích hơn những

thẻ khác nên được khách hàng quan tâm nhiều hơn, trong khi đó thẻ VA có tỷ lệ sử

dụng thấp nhất 3.4%.

42

Nguồn: Số liệu big data của Ngân hàng

Ghi chú tên các loại thẻ: VG: VC: MG: MS: VP: VV: VA: OTHER:

VISA GOLD VISA CLASSIS MASTER GOLD MASTER STANDARD VISA PLATINUM VISA VIOLET CARD VISA AUTO CARD JP = JCB Platinum; JC = JCB Standard; JETSTAR = JCB Credit Jetstar; JG = JCB Gold; VB = Visa Business; MW = Master One World; PB = Master Passbook Card EEFA = UAFA Card.

Biểu đồ 4.7: Các loại thẻ được sử dụng bởi khách hàng

Loại thẻ sử dụng theo nghề nghiệp và thu nhập của khách hàng

Như được nêu trước đó, thẻ VG (Visa Gold) và VC (Visa Classics) được quan tâm

nhiều nhất bởi người sử dụng, trong đó nhóm giám đốc và nhóm công nhân sử dụng

nhiều VG với tỷ lệ sử dụng lần lượt 36.9% và 30.6% (bảng 4.1), trong khi đó nhân

viên văn phòng và công nhân quan tâm nhiều loại thẻ VC với tỷ lệ sử dụng lần lượt

là 37.23% và 35.07%.

Kết quả từ biểu đồ 4.8 cho thấy thu nhập bình quân trong tháng của khách sử dụng

VG và VC ở mức cao vừa phải. Trường hợp này, nhóm khách hàng sử dụng VG có

thu nhập 87.9 triệu đồng/tháng và của VC là 64.8 triệu đồng/tháng. Trong khi đó

nhóm khách hàng sử dụng loại thẻ VP có thu nhập cao nhất 347.5 triệu đồng/tháng,

những nhóm khách hàng nay chỉ chiếm 9% mà thôi.

43

Bảng 4.1: Loại thẻ sử dụng của khách hàng theo nghề nghiệp

Giám đốc

Nhân viên

Công nhân

Tổng

Loại thẻ MG

MS

1 0.23 20.00 0.03 0

OTHER

VA

VC

VG

VP

VV

178 41.78 20.53 5.05 35 8.77 4.04 0.99 85 22.97 9.80 2.41 8 6.67 0.92 0.23 59 7.50 6.81 1.67 316 36.96 36.45 8.96 165 50.46 19.03 4.68 21 8.64 2.42 0.60 867 24.58 100 24.58

Quản lý Hưu 104 24.41 12.95 2.95 112 28.07 13.95 3.18 90 24.32 11.21 2.55 25 20.83 3.11 0.71 157 19.95 19.55 4.45 190 22.22 23.66 5.39 62 18.96 7.72 1.76 63 25.93 7.85 1.79 803 22.77 100 22.77

32 7.51 3.43 0.91 214 0.00 53.63 0.00 22.94 6.07 0.00 129 1 0.27 34.86 20.00 13.83 3.66 0.03 45 0 0.00 37.50 4.82 0.00 1.28 0.00 293 2 0.25 37.23 40.00 31.40 8.31 0.06 91 1 0.12 10.64 9.75 20.00 2.58 0.03 0 9 2.75 0.00 0.96 0.00 0.26 0.00 120 0 0.00 49.38 0.00 12.86 3.40 0.00 933 5 0.14 26.45 100 100 0.14 26.45

111 26.06 12.08 3.15 38 9.52 4.13 1.08 65 17.57 7.07 1.84 42 35.00 4.57 1.19 276 35.07 30.03 7.83 257 30.06 27.97 7.29 91 27.83 9.90 2.58 39 16.05 4.24 1.11 919 26.06 100 26.06

426 100.00 12.08 12.08 399 100.00 11.31 11.31 370 100.00 10.49 10.49 120 100.00 3.40 3.40 787 100.00 22.31 22.31 855 100.00 24.24 24.24 327 100.00 9.27 9.27 243 100.00 6.89 6.89 3527 100 100 100

Diễn giải Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Count Row % Column % Total % Total Count Row % Column % Total % Nguồn: Số liệu big data của Ngân hàng

Biểu đồ 4.8: Thu nhập bình quân của khách hàng theo loại thẻ sử dụng

Nguồn: Số liệu big data của Ngân hàng

44

4.2.3. Phân tích mô hình gian lận Fraud trong kinh doanh

Việc phân tích mô hình Fraud là dựa vào các nghiên cứu (Hunt & Krivanek, 1966).

Sẽ có ba bước được triển khai trong phân tích. Thứ nhất, phân tích sự gian lận dựa

trên hồ sơ đề xuất ban đầu tham gia dịch vụ tại ngân hàng SCB như được nêu ở

chương trước đó. Thứ hai, phân tích sự gian lận để tìm ra lỗi của việc đánh giá hồ sơ

ban đầu của khách hàng tham gia dịch vụ và đối chiếu với lịch sử tham gia giao dịch

của khách hàng. Khách hàng được đưa vào phân tích là khách hàng hiện đang tham

gia giao dịch tại SCB và có thời gian tham gia dịch vụ trên 12 tháng. Thứ ba là bước

kết hợp kết quả dự báo của bước 1 và bước 2, trên cơ sở đó đề xuất tập khách hàng

thuộc nhóm có gian lận trong bước 1 và bước 2.

a. Phân tích mô hình fraud dựa vào hồ sơ từ ban đầu

Các thông tin được chọn phục vụ cho mô hình Fraud gồm các thông tin được nêu

trong bảng 4.9. Trong đó, RANK_HOSO được xem là trường mục tiêu (target field),

trường này là kết quả của việc xếp hạng hồ sơ sau khi được thẩm định. Sau đó, trường

này sẽ được dự báo dựa trên các thông tin ban đầu hồ sơ được xét duyệt của 5,232

khách hàng. Thông tin của từng trường với thang đo như được nêu trong bảng. Thuật

toán ứng dụng để dự báo hành vi gian lận Fraud là phương pháp C5.0 thông qua phần

mềm IBM SPSS MOLDER.

45

STT Tên các trường 1.

RANK_HOSO

Định nghĩa trường Hồ sơ được xếp loại từ ban đầu

2.

NETINCOME

Thu nhập sau thuế

3.

TAISAN

Tài sản nhà ở

4.

LOAI_HOSO

Hồ sơ khách hàng

5.

QUANHE_CONGDONG Qua hệ cộng đồng

6.

HOC_VAN

Học vấn

7.

VITRI_CONGTAC

Chức vụ công việc

lý cấp

8.

GIA_CANH

Gia cảnh

Bảng 4.2: Thông tin các trường trong mô hình

Giá trị đo lường Trường mục tiêu (target field): TỐT/HIGH (68,0%); TRUNG BÌNH/AVERAGE (24,3%); THẤP (7,7%) Triệu đồng/tháng: Min= 5 triệu đồng; Max = 44.1 tỷ đồng; Trung bình = 119,9 triệu đồng Nhà sở hữu (78,4%; Ở cùng cha mẹ (16,0%); Nhà thuê (5,6%) Khách hàng mới (43,5%); Khách hàng cũ (22,3%); Khách hàng phát hành mới (17,9%); Khách hàng gia hạn/đánh giá lại (16,3%) Có uy tín (49,1%); Bình thường (13,7%); Unknown/không biết (37,3%) Đại học (68,0%); Trung cấp (11,5%); Thạc sĩ (6,9%); Cao đẳng (6,5%); Cao đẳng (5,9%); Tiến sĩ (1.3%); Không có thông tin (5,9%). Nhân viên văn phòng (24,48%); Công nhân (26,06%); Giám đốc (24,52%); Quản trung (22,795); Hưu (0.145) Thịnh vượng (41,7%); Bình thường (21,5%); Không rõ (36,8%)

Kết quả dự báo như chỉ ra ở biểu đồ 4.9 cho thấy thu nhập sau thuế (NETINCOME)

được xem có tầm quan trọng lớn nhất trong xếp loại hồ sơ, kế đến là giá trị tài sản

nhà ở của khách hàng, phần kế còn lại là nhóm khách hàng thuộc nhóm khách hàng

cũ hoặc mới, quan hệ cộng đồng, học vấn, vị trí công tác và gia cảnh.

Mô hình được dự báo giữa trên nhóm đào tạo Training (60% số quan sát) và nhóm

kiểm định (Testing) (40% số quan sát). Kết quả giữa hai nhóm cho thấy không có sự

khác biệt về tỷ lệ chính xác (Correct) trên 78%. Điều này cho thấy phương pháp được

chấp nhận để bước tiếp theo xác định nhóm gian lận.

46

Biểu đồ 4.9: Kết quả từ thuật toán C5.0

Biểu đồ 4.10: Đánh giá mô hình dựa trên nhóm Training/Đào tạo và Testing/Kiểm định

Như đã trình bày trước đó, trường mục tiêu là RANK_HOSO có ba nhóm và kết quả

dự báo từ C5.0 sẽ cho trường mục tiêu dự báo là $C_RANK_HOSO. So sánh giữa

hồ sơ được đánh giá ban đầu và sau khi dự báo, kết quả như được chỉ ra ở biểu đồ

4.11. Có 3 nhóm như được nêu trong biểu đồ 4.11. Mỗi nhóm có định nghĩa như sau:

47

(1) F1_F- : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá cao

(HIGH), nhưng sau khi dự báo hồ sơ này được thuật toán xếp loại lại hồ sơ thuộc

nhóm thấp (LOW) hoặc nhóm trung bình (AVER). Tương tự, hồ sơ ban đầu được

đánh giá mức trung bình (AVER) nhưng kết quả thuật toán cho rằng nhóm hồ hơ

này thuộc vào nhóm thấp (LOW). Trong trường hợp này, kết quả thống kê từ dự

báo chỉ ra Nhóm gian lận F- chiếm 2,4%.

(2) F1_F+ : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá thấp

(LOW) nhưng sau khi dự báo hồ sơ này được thuật toán xếp hồ sơ thuộc vào nhóm

trung bình (AVER) hoặc nhóm cao (HIGH). Tương tự hồ sơ ban đầu được xếp

hạng mức trung bình (AVER) nhưng được thuật cho kết quả dự báo nhóm này

thuộc nhóm đánh giá hồ sơ thấp (HIGH). Trong trường hợp này, kết quả thống kê

từ dự báo Nhóm gian lận F+ chiếm tỷ lệ 19,3%.

(3) F1_F0 : là nhóm không gian lận, hồ sơ ban đầu được xếp loại như thế nào, sẽ cho

kết quả dự báo như thế đó. Điển hình, ban đầu hồ sơ được xếp loại cao (HIGH) sau

khi dự báo cũng cho kết quả cao (HIGH), tương tự ban đầu được xếp loại thấp

(LOW) sau dự báo cho kết quả thấp (LOW). Trường hợp này, kết quả thống kê từ

dự báo Nhóm này chiếm tỷ lệ 78,3%.

Như vậy kết quả cho thông điệp có sự gian lận trong đánh giá hồ sơ chiếm 21,7% (bao

gồm F1_F- và F1_F+). Điều này có thể là do chủ đích của người tham gia trực tiếp thẩm

định hồ sơ khi thực hiện xếp loại. Việc xác định lại nhân viên hoặc ai tham gia trực tiếp

thẩm định hồ sơ là không khó, vì hệ thống có ghi nhận từng nhân viên trong trách nhiệm

thẩm định. Hoặc chúng ta có thể xem lại đặc điểm nhận khẩu học nằm trong nhóm có nguy

cơ gian lận.

Biểu đồ 4.11: Kết quả gian lận xét trên hồ sơ gốc ban đầu

48

Nguồn: Kết quả phân tích

b. Phân tích mô hình Fraud dựa vào lịch sử tham gia giao dịch.

Tương tự như mô hình gian lận Fraud ở bước 1, mô hình Fraud bước 2 hướng đến xác định gian lận sau khi khách hàng đã có hành vi giao dịch trên 12 tháng tại ngân hàng. Trường hợp này, RANK_HOSO cũng được xem là trường mục tiêu (target field), các trường hỗ trợ cho dự báo bao gồm lịch sử giao dịch: Số dư bình quân trong 12 tháng, Thời gian giao dịch gần nhất (R), tần suất giao dịch (F), giá trị giao dịch (M), lịch sử giao dịch của ngân hàng SCB so với các giao dịch với ngân hàng khác trong cùng thời gian nghiên cứu. Như ở bảng 4.3, lịch sử giao dịch của khách hàng đối với SCB so với các ngân hàng khác (đối thủ) thông tin như sau: (i) Không sử dụng dịch vụ ngân hàng SCB trước đó (DV NH SCB) trước đó (3,2%); (ii) Sử dụng dịch vụ ngân hàng SCB (DV NH SCB) (66,9%); (iii) Sử dụng DV NH SCB < NH khác (1.1%); (iv) Sử dụng DV NH SCB = NH khác (11.2%); (v) Sử dụng DV NH SCB > NH khác (17.6%). Tương tự, thuật toán ứng dụng để dự báo hành vi gian lận Fraud là phương pháp C5.0 thông qua phần mềm IBM SPSS MOLDER.

STT Tên các trường 1. RANK_HOSO

Định nghĩa trường Hồ sơ được xếp loại từ ban đầu

2.

DU_NO_BQ

Dư nợ của khách hàng

3.

RECENCY

4.

FREQUENCY

Thời gian giao dịch gần nhất Tần suất giao dịch

5.

MONETARY

Giá trị/Số dư giao dịch

6.

Bảng 4.3: Thông tin các trường trong mô hình theo hành vi giao dịch

Giá trị đo lường Trường mục tiêu (target field): TỐT/HIGH (68,0%); TRUNG BÌNH/AVERAGE (24,3%); THẤP (7,7%) Triệu đồng/tháng: Min= 5 triệu đồng; Max = 44.1 tỷ đồng; Trung bình = 119,9 triệu đồng Thứ bậc: 1= rất xa; 2 = xa; 3= vừa phải; 4=gần; 5 = rất gần Thứ bậc: 1= Rất ít; 2 = ít; 3 = vừa phải; 4= thường xuyên; 5 = Rất thường xuyên Thứ bậc: 1 = rất thấp; 2 = thấp; 3 = vừa phải; 4 = cao; 5= rất cao - Không sử dụng DV NH SCB trước

đó = 3,2%

SUDUNG_NHKHAC Thông tin khách hàng sử dụng dịch vụ ngân hàng SCB và ngân hàng khác.

- Sử dụng DV NH SCB = 66,9% - Sử dụng DV NH SCB < NH khác =

1.1%

- Sử dụng DV NH SCB = NH khác =

11.2%

- Sử dụng DV NH SCB > NH khác =

17,6%

49

Kết quả cho thấy thời gian giao dịch gần nhất (RECENCY) có tầm quan trọng lớn

nhất trong mô hình, kế đó là số dư nợ bình quân (DU_NO_BQ) trong thời gian giao

dịch, tần suất giao dịch (FREQUENCY), có sử dụng dịch vụ ngân hàng SCB và ngân

hàng khác (SUDUNG_NHKHAC) (biểu đồ 4.12).

Biểu đồ 4.12: Kết quả từ thuật toán C5.0 của bước 2

Tương tự thuật toán ở bước 1, RANK_HOSO là trường mục tiêu sẽ cho ra kết quả dự

báo của ba nhóm như ở biểu đồ 13, và kết quả dự báo từ C5.0 sẽ cho trường mục tiêu

dự báo là $C_RANK_HOSO. So sánh giữa hồ sơ được đánh giá ban đầu và sau khi

dự báo, kết quả như được chỉ ra ở biểu đồ 4.13. Mỗi nhóm có định nghĩa như sau:

(1) F2_F- : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá cao

(HIGH), nhưng sau khi dự báo dựa vào lịch sử giao dịch thông tin hồ sơ dự

báo được thuật toán xếp nhóm đánh giá thấp (LOW) hoặc nhóm trung bình

(AVER). Tương tự, hồ sơ ban đầu được đánh giá mức trung bình (AVER)

nhưng kết quả thuật toán cho rằng nhóm hồ hơ này thuộc vào nhóm thấp

(LOW). Như vậy theo trường hợp trên, kết quả dự báo cho thấy nhóm F2_F-

là nhóm gian lận của lịch sử so với hồ sơ ban đầu chiếm 2,2%.

50

(2) F2_F+ : là nhóm gian lận được xác định bởi hồ sơ ban đầu được đánh giá thấp

(LOW) nhưng sau khi dự báo dựa vào lịch sử giao dịch của khách hàng, nhóm

này được xếp vào nhóm trung bình (AVER) hoặc nhóm cao (HIGH). Tương

tự áp dụng trường hợp hồ sơ ban đầu được xếp hạng mức trung bình (AVER)

nhưng được thuật toán cho kết quả dự báo nhóm này thuộc nhóm đánh giá cao

(HIGH) sau khi dự báo dựa vào lịch sử giao dịch của khách hàng. Theo kết

quả trên dự báo, nhóm F2_F+ là nhóm gian lận được đánh giá ban đầu thấp,

nhưng kết quả cho ra nhóm được đánh giá cao chiếm 26,9%.

(3) F2_F0 : là nhóm không có gian lận, hồ sơ ban đầu được xếp loại như thế nào,

sau quá trình lịch sử giao dịch cho kết quả dự báo như thế đó. Ví dụ ban đầu

hồ sơ của khách hàng được xếp loại tốt (HIGH), sau quá trình giao dịch, nhóm

khách hàng được cũng được thuật toán dự báo thuộc nhóm có hành vi tốt

(HIGH), tương tự áp dụng cho trường hợp nhóm trung bình (AVER) và nhóm

hồ sơ không tốt (LOW). Kết quả dự báo của trường hợp F2_F0 chiếm tỷ lệ

70,9%, đây là nhóm không có gian lận.

Như vậy kết quả cho thông điệp có sự gian lận trong đánh giá hồ sơ chiếm 29,1%

(bao gồm của F2_F- và F2_F+). Điều này có thể là do chủ đích của người tham gia

trực tiếp trong hồ sơ, hoặc do nhân viên trực tiếp thẩm định. Việc xác định lại nhân

viên hoặc ai tham gia trực tiếp trong đánh giá hồ sơ là không khó, vì hệ thống có ghi

nhận. Hoặc chúng ta có thể xem lại đặc điểm nhân khẩu học nằm trong nhóm có nguy

cơ gian lận.

Nguồn: Kết quả phân tích

Biểu đồ 4.13: Kết quả gian lận xét trên hồ sơ gốc ban đầu

51

c. Kết quả mô hình gian lận kết hợp từ mô hình bước 1 và bước 2

Như kết quả mô hinh Fraud của bước 1 dựa vào hồ sơ gốc và các thông tin cá nhân

của khách hàng tham gia giao dịch kết hợp với bước 2 được dự báo dựa vào hồ sơ

được đánh giá ban đầu được dựa báo dựa vào lịch sử giao dịch sau 12 tháng tham gia.

Kết quả kết hợp mô hình cho kết quả gian lận và không gian lận được xếp hạn như ở

bảng 4.4.

Bảng 4.4: Kết quả gian lận xét từ 2 mô hình gian lận

Kết hợp F1_F0 kết hợp với F2_F0 F1_F0 kết hợp với F2_F- F1_F0 kết hợp với F2_F+ F1_F- kết hợp với F2_F+ F1_F- kết hợp với F2_F- F1_F+ kết hợp với F2_F+ F1_F+ kết hợp với F2_F- F1_F- kết hợp với F2_F0 F1_F+ kết hợp với F2_F0 Kết quả gian lận Không có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Có gian lận Nhận định +++ + + ++ +++ +++ ++ + +

Dựa trên định nghĩa gian lận như nêu ở biểu đồ 4.14. Kết quả gian lận sau cùng được

minh họa ở bảng 4.5. Theo bảng dấu +++ tức chỉ mức độ gian lận rất cao. Nhóm có

++ và dấu + chỉ mức độ gian lận thấp hơn. Theo kết quả thống kê, nhóm khách hàng

được xác định không có biểu hiện sự gian lận chiếm 64% khách hàng, nhóm này có

độ tin cậy cao vì kết quả được dựa vào kết hợp từ bước 1&2. Trên cơ sở kết quả này

sẽ là một thông điệp vô cùng quan trọng giúp cho ngân hàng có định hướng cụ thể

trong thực hiện giải pháp khắc phục. Chẳng hạn, xuất ra tập khách hàng được xếp vào

nhóm có gian lận, ngân hàng sẽ lần được các hành vi của khách hàng, cũng như xác

định được nhân viên nào đã trực tiếp quản lý và thẩm định hồ sơ trên đó.

52

Biểu đồ 4.14: Kết quả Gian lận được xác định từ kết hợp hai mô hình

4.2.4. Thông tin giao dịch phân theo gian lận

Kết quả như được chỉ ra ở biểu đồ 4.15 cho thấy nhóm khách hàng được xem có tính

gian lận cao (YES_GIANLAN+++) có hạn mức bình quân trên 80 triệu đồng.. Trong

khi đó nhóm khách hàng được xếp vào gian lận vừa (YES_GIANLAN++) có hạn

mức cao nhất 120 triệu đồng. Có một lưu ý cho thấy, nhóm khách hàng được xếp vào

nhóm có gian lận thường có thời gian tham gia dịch vụ lâu nhất tại SCB từ 65-81

tháng (biểu đồ 4.15). Điều này có thể cho thấy, những khách hàng này có thể là những

nhóm khách hàng cũ. Một khi kinh nghiệm của khách hàng càng nhiều trong giao

dịch, có thể chỉ ra những phát sinh trong gian lận từ nhân viên trong xét duyệt hồ sơ

hoặc từ khách hàng trong khai báo thông tin và hồ sơ tiếp cận dịch vụ vay vốn cũng

như dịch vụ thẻ tại SCB.

Biểu đồ 4.14: Hạn mức sử dụng theo nhóm khách hàng

53

Biểu đồ 4.15: Nhóm khách hàng xếp loại theo

Ghi chú:

 LIFETIME: thời gian tham gia dịch vụ  KQ_GIAN_LAN: Kết quả khách hàng được xếp theo nhóm gian lận

Tóm tắt chương:

Kết quả phân tích dữ liệu của chương đã đem đến một bức tranh rõ nét về thông tin,

đặc điểm tham gia dịch cụ của khách hàng, trong đó có chỉ ra đặc điểm nhân khẩu

học và loại dịch vụ mà khách hàng tham gia. Nhiều hơn sự mong đợi trong phân tích,

kết quả đã chỉ ra tỷ lệ khách hàng được đưa vào nhóm mà phía ngân hàng SCB cần

quan tâm hơn để kiểm soát về rủi ro trong gian lận chiếm đến 36%. Tỷ lệ có thể nói

còn khá cao. Nên phía SCB cần lưu ý hơn hướng đến chỉnh đốn trong nội bộ và kiểm

soát kỷ hơn về lịch sử giao dịch của khách hàng.

Có thể nói, một khi khách hàng có thời gian tham gia dịch vụ lâu hơn, dường như

được dự báo có tính gian lận cao hơn, đặc biệt là nhóm khách hàng có thời gian tham

gia dịch vụ từ >65 - 81 tháng và xảy ra ở những khách hàng có hạn mức cao trong

tiếp cận dịch vụ tín dụng và thẻ.

54

CHƯƠNG 4: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC

A. KẾT LUẬN

Ứng dụng nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong

hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ

được thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng

đang tham gia giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có

thời gian tham gia dịch vụ từ trên 12 tháng trở lên. Điều này giúp việc hạn chế những

thông tin nhiễu đối với những khách hàng có thời gian tham gia dịch vụ dưới 12

tháng. Điều này có nghĩa là, một khi thời gian tham gia dịch vụ càng lâu, hành vi

khách hàng được sử dụng trong phân tích, cho kết quả dự báo sẽ chính xác hơn.

Qua thuật toán sử dụng sau hai lần hướng đến xác định sự gian lận, kết quả đã cho ra

trong dịch vụ ngân hàng của SCB có khoảng 36% khách hàng được đưa vào nhóm

có tính gian lận, trong đó gian lận đến từ hai phía. Phía từ nhân viên, người trực tiếp

thẩm định hồ sơ, hoặc vô tình, hoặc có chủ đích thì vấn đề vấn còn ở dấu chấm hỏi.

Với tỷ lệ khách hàng được xem không có hàm ý về gian lận 64% tỷ lệ này thật sự vẫn

chưa cao, nên phía SCB cần phải có nhiều việc phải đưa ra các giải pháp để kiểm

soát.

Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách

hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía.

Do vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên. Các

lỗ hổng trong phân tích có thể bao gồm những nội dung tóm tắt trong các điểm chính

như sau:

+ Thứ 01: khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân

hàng, nhưng nhân viên tiếp nhận và cấp thẩm quyền cao nhất, duyệt sản phẩm dịch

vụ đó, không phát hiện ra hồ sơ mang tính rủi ro cao hoặc trung bình từ khách hàng.

+ Thứ 02 : khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho

ngân hàng, kế hợp với nhân viên tiếp nhận thông đồng, dựa vào lỗ hổng của cấp thẩm

55

quyền cao nhất: như tin tưởng nhân viên cấp dưới, không xem kỷ hồ sơ khách hàng

cung cấp, duyệt sản phẩm dịch vụ đó, không phát hiện ra hồ sơ mang tính rủi ro trung

bình hoặc thấp từ khách hàng và nhân viên tiếp nhận.

+ Thứ 03 : khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân

hàng, kế hợp với lãnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông

đồng, dựa vào chức vụ quyền hạng chỉ đạo làm sai trái qui định ban hành duyệt sản

phẩm dịch vụ đó, phát hiện ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách

hàng và lãnh đạo cấp thẩm quyền phê duyệt sản phẩm đó.

+Thứ 04 : khách hàng cung cấp hồ sơ ban đầu cho ngân hàng, nhân viên tiếp nhận

khách hàng, dựa vào lỗ hổng của cấp thẩm quyền cao nhất: như tin tưởng nhân viên

cấp dưới, nhân viên cấp dưới sử dụng thông tin người khác không đúng như khách

hàng cung cấp, qua mặt khách hàng và lãnh đạo, lãnh đạo không xem kỷ hồ sơ khách

hàng cung cấp có dấu hiệu sai phạm, không đúng qui định sản phẩm ban hành, duyệt

sản phẩm dịch vụ đó, không phát hiện ra hồ sơ mang tính rủi ro thấp từ nhân viên

tiếp nhận.

Cho dù nhân viên có tài ba đi mấy, một khi chủ đích gian lận của khách hàng có thực

hiện, điều này sẽ xảy ra là thường tình. Điều này có thể xảy ra một khi khách hàng vì

lý do cần tiếp cận dịch vụ của ngân hàng, họ sẵn sàng làm lệch hồ sơ, hoặc gia hạn

không trung thực tìm một ý định gian lận trong tăng điểm hồ sơ cho vay vốn, hoặc

cho dịch vụ thẻ. Tuy nhiên để kiểm chứng điều này, lịch sử giao dịch của khách hàng

sau 12 tháng mô hình dự báo sẽ giúp chúng ta dự báo được những khách hàng thuộc

nhóm trung thực/không gian lận và nhóm có gian lận.

Tóm lại kết quả nghiên cứu là một ý tưởng khá mới trong nghiên cứu, mô hình được

ứng dụng là áp dụng từ các phương pháp do các nghiên cứu trước thực hiện. Nghiên

cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào số liệu

thực tế của SCB. Kết quả nghiên cứu có một đóng góp cực kỳ quan trọng cho việc

xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía nhân viên của công

ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.

56

B. CÁC GIẢI PHÁP HẠN CHẾ LỖ HỔNG VÀ GIAN LẬN TRONG

KINH DOANH

Căn cứ vào kết quả phân tích từ mô hình gian lận Fraud từ nguồn số liệu big data hiện

có tại SCB, đề tài đã phát hiện ra hai lỗ hổng có thể tạo ra những gian lận trong hoạt

động tín dụng tại SCB. Sự gian lận có thể xảy ra từ phía nhân viên tham gia trực tiếp

thẩm định hồ sơ và gian lận đến từ chủ đích của khách hàng. Việc phân tích này là

dựa vào số liệu hồ sơ gốc ban đầu do phía khách hàng cung cấp và dựa vào lịch sử

tham gia giao dịch của khách hàng có trên 12 tháng tham gia dịch vụ tại SCB. Những

gian lận

Xuất phát từ những kết quả đỏ. Nội dung bài viết sẽ đưa ra các giải pháp như sau.

(1) Giải pháp áp dụng đến các nhân viên tham gia trực tiếp thẩm định hồ sơ

Phía ngân hàng, cần hiệu chỉnh lại phương pháp hoặc qui trình trong đánh giá hồ sơ

của khách hàng, trong đó cần nhắc nhỡ nhân viên phải thực hiện nghiêm túc qui trình

thẩm định:

Tiếp nhận hồ sơ vay của khách hàng vay tín chấp  Thẩm định vay  Quyết định

khoản vay  Giải ngân/triển khai dịch vụ khách hàng

Để thực hiện qui trình trên đạt một chuẩn mực, nhân viên được tuyển dụng cho thẩm

định cực kỳ quan trọng, điều này liên quan đến năng lực, kinh nghiệm, đặc biệt là tư

duy nhận định vấn đề.

Đối với những khách hàng cũ, người nhân viên cũng nên có thông tin tóm tắt lại lịch

sử giao dịch của khách hàng trong quá khứ, điều này giúp việc đánh giá chính xác

hơn.

(2) Giải pháp quan tâm trong kiểm soát, đánh giá hồ sơ, giám sát hành vi

tham gia dịch vụ của khách hàng

Một khi tiếp nhận thông tin hoặc các hồ sơ có liên quan, nhân niên nên bỏ qua các

yếu tố quen biết. Phía khách hàng phải cung cấp các thông tin đầy đủ, giúp minh

chứng tính pháp lý của cá nhân, các hợp đồng công việc, các nguồn thu có minh

57

chứng và hợp pháp. Tuy nhiên điều quan trọng hơn, hồ sơ của khách hàng cũng cần

có sự lần tìm của người nhân viên đánh giá về lịch sử tín dụng của khách hàng, thái

độ đi vay vốn của khách.

Đối với những khách hàng cũ, phía công ty cũng nên trích ngang ra hành vi tham gia

dịch vụ của khách hàng trước đó, điều này giúp cho việc đánh giá chính xác hơn hạnh

kiểm của khách hàng khi tham gia dịch vụ.

Do kết quả cho thấy, những khách hàng có thời gian tham gia dịch vụ lâu hơn (>65 –

81 tháng) và có hạn mức tín dụng và mức thẻ cao có tiềm ẩn gian lận lớn hơn. Trên

cơ sở này, phái SCB cần có phân loại khách hàng theo các nhóm khác biệt, điều này

giúp cho việc giám sát hành vi giao dịch, cũng như hồ sơ được tốt hơn, góp phần hạn

chế rủi ro có thể xảy ra về thẩm định lệch hoặc không đúng. Điều này có thể làm mất

đi lòng tin của khách hàng có qui mô hoặc hạn mức lớn. Tuy nhiên cũng cần đề phòng

trong việc chạy theo chỉ tiêu cho vay đối với các khách hàng có nhu cầu hạn mức lớn,

ngân hàng có thể gặp những rủi ro không nhỏ nếu không có những đánh giá và nhận

định đúng.

(3) Nâng cao năng lực nhân viên

Thưc hiện đào tạo lại cán bộ/nhân viên có liên quan về nghiệp vụ đánh giá, nghiệp

vụ thẩm định hồ sơ và cách đánh giá hồ sơ quá khứ cũng như lịch sử giao dịch của

khách hàng. Thêm vào đó, SCB cần tiêu chuẩn hoá đội ngũ nhân viên trong tham gia

vào quá trình đàm phán, hướng dẫn trực tiếp khách hàng.

Ngành ngân hàng cũng nhận thức được rằng thách thức trong quá trình hội nhập ngày

càng lớn về công nghệ thông tin, big data và phương pháp khai thác dữ liệu lớn big

data, điều này góp phần vào việc tận dụng cơ hội để phát triển, qua đó nâng cao vị

thế, sức cạnh tranh của hệ thống ngân hàng trong thị trường cạnh tranh, đặc biệt có

các đối thủ từ các ngân hàng quốc tế.

Cần làm việc với các nhà khoa học dữ liệu để tạo điểu kiện cho các nhân viên được

đào tạo về kỹ năng khai phá dữ liệu hướng đến phân tích hành vi khách hàng dựa trên

nguồn gốc kho dữ liệu data warehouse hiện có. Hoặc có thể mời các chuyên gia tư

58

vấn từ các trường/viện hoặc tổ chức có liên quan về khoa học dữ liệu để SCB có điều

kiện hiểu thêm về giá trị dữ liệu hoặc những vấn đề cần đầu tư trong tương lai.

C. PHÁT TRIỂN CÁC DỊCH VỤ CHO VAY

Mô hình Fraud đã giúp cho việc xác định tỷ lệ khách hàng không gian lận chiếm 64%

sau hai lần dự báo dựa vào thuật toán. Đây có thể nói, nhóm khách hàng này cho một

niềm tin lớn để ngân hàng hướng đến mở rộng, chào mời khách hàng cho những dịch

vụ tín dụng thêm vào, hoặc các sản phẩm bán chéo để khai thác tiềm năng tiêu dùng

với mức rủi ro ít nhất.

TÀI LIỆU THAM KHẢO

Doğan, O., Ayçin, E., & Bulut, Z. A. (2018). Customer Segmentation by Using

RFM Model and Clustering Methods: A Case Study in Retail Industry.

International Journal of Contemporary Economics and Administrative

Sciences, 8(1), 1–19. Retrieved from www.ijceas.com

Eshghi, A., & Kargari, M. (2019). Introducing a new method for the fusion of fraud

evidence in banking transactions with regards to uncertainty. Expert Systems

with Applications, 121, 382–392. https://doi.org/10.1016/j.eswa.2018.11.039

Hunt, E., & Krivanek, J. (1966). The effects of pentylenetetrazole and

methylphenoxypropane on discrimination learning. Psychopharmacologia, 9,

1–16. https://doi.org/10.1007/BF00427700

Khajvand, M., & Tarokh, M. J. (2011). Estimating customer future value of

different customer segments based on adapted RFM model in retail banking

context. Procedia Computer Science, 3, 1327–1332.

https://doi.org/10.1016/j.procs.2011.01.011

Wu, J., & Lin, Z. (2005). Research on customer segmentation model by clustering.

ACM International Conference Proceeding Series, 316–318.

https://doi.org/10.1145/1089551.1089610