TIÊU CHUẨN QUỐC GIA
TCVN 14483:2025
CÔNG NGHỆ THÔNG TIN - TÍNH TOÁN ĐÁM MÂY - KHUNG TÍN CẬY ĐỂ XỬ LÝ DỮ LIỆU ĐA
NGUỒN
Information technology- Cloud computing- Framework of trust for processing of multi-sourced
data
Nội dung
Lời nói đầu
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Ký hiệu và thuật ngữ viết tắt
5 Kịch bản
5.1 Sử dụng dữ liệu đa nguồn để giảm thiểu tử vong và thương tích do giao thông
5.2 Sử dụng dữ liệu đa nguồn cho tự động hóa trong nhà
5.3 Sử dụng dữ liệu đa nguồn cho hoạt động ô tô
6 Sự tin cậy
7 Quyền truy cập và xử lý dữ liệu
8 Khung xử lý dữ liệu đa nguồn đáng tin cậy
8.1 Giới thiệu
8.2 Luồng dữ liệu
8.3 Các yếu tố về sự tin cậy 8.3.1 Chung
9 Sử dụng khung trong các thỏa thuận
9.1 Quy định chung
9.2 Nghĩa vụ và kiểm soát việc sử dụng dữ liệu
9.3 Bản ghi nguồn gốc dữ liệu, chất lượng và tính toàn vẹn
9.4 Chuỗi hành trình bảo quản
9.5 An ninh và quyền riêng tư
9.6 Bằng chứng tuân thủ không thể thay đổi
Phụ lục A (tham khảo) Nghĩa vụ và kiểm soát việc sử dụng dữ liệu
Thư mục tài liệu tham khảo
Lời nói đầu
TCVN 14483:2025 được xây dựng trên cơ sở tham khảo ISO/IEC TR 23186:2018.
TCVN 14483:2025 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/JTC 1 “Công nghệ thông tin" biên soạn,
Viện Tiêu chuẩn Chất lượng Việt Nam để nghị, Ủy ban Tiêu chuẩn Đo lường Chất lượng quốc gia
thẩm định, Bộ Khoa học và Công nghệ công bố
CÔNG NGHỆ THÔNG TIN - TÍNH TOÁN ĐÁM MÂY - KHUNG TIN CẬY ĐỂ XỬ LÝ DỮ LIỆU ĐA
NGUỒN
Information technology- Cloud computing- Framework of trust for processing of multi-sourced
data
1 Phạm vi áp dụng
Tiêu chuẩn này mô tả một khung tin cậy cho việc xử lý dữ liệu đa nguồn bao gồm các nghĩa vụ và
kiểm soát việc sử dụng dữ liệu, nguồn gốc dữ liệu, chuỗi hành trình bảo quản, bảo mật và Bằng
chứng tuân thủ không thể thay đổi như các yếu tố của khung.
2 Tài liệu viện dẫn
Các tài liệu viện dẫn dưới đây là cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu ghi
năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì
áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).
TCVN 1248Q (ISO/IEC 17788), Công nghệ thông tin -Tính toán đám mây - Tổng quan và từ vựng.
3 Thuật ngữ và định nghĩa
Tiêu chuẩn này áp dụng các thuật ngữ và định nghĩa trong TCVN 12480 (ISO/IEC 17788) và các thuật
ngữ và định nghĩa sau đây.
3.1
Chuỗi hành trình bảo quản (chain of custody)
Sự sở hữu, sự dịch chuyển, sự xử lý và vị trí là bằng chứng của vật liệu từ một điểm thời gian này
đến một điểm thời gian khác.
[NGUỒN: 3.1, ISO/IEC 27050-1:2016]
3.2
Dữ liệu (data)
Thông tin được ghi lại.
[NGUỒN: 3.11, ISO 22005:2007]
3.3
Xử lý dữ liệu (data processing)
Thực hiện có hệ thống các thao tác trên dữ liệu.
[NGUỒN: 2121276, ISO 2382:2015, đã sửa đổi - Chú thích 1 đến 4 cho mục nhập đã bị xóa và thuật
ngữ thay thế “xử lý dữ liệu tự động” đã bị xóa.]
3.4
Tập dữ liệu (data set)
Nhóm dữ liệu có ý nghĩa logic.
[NGUỒN: 3.2.4, ISO 8000-2:2018, đã sửa đổi - VÍ DỤ 1 và 2 đã bị xóa.]
3.5
Dữ liệu đa nguồn (muiti-sourced data)
Dữ liệu bao gồm các tập dữ liệu riêng biệt đã được tạo ra bởi nhiều nguồn đa dạng và được tập hợp
bởi một hoặc nhiều dịch vụ đám mây từ một hoặc nhiều CSP Chú thích 1 cho mục nhập: Các tập dữ
liệu sau đó là đối tượng của phân tích và xử lý kết hợp với mục đích trích xuất thông tin chi tiết và
thông tin không thể thu được thông qua phân tích từng tập dữ liệu riêng lẻ.
3.6
Thông tin định danh cá nhân (personally identifiable information)
Pll
Bất kỳ thông tin nào (a) có thể được sử dụng để nhận dạng chủ thể Pll mà thông tin đó liên quan đến,
hoặc (b) đang hoặc có thể liên kết trực tiếp hoặc gián tiếp với chủ thể Pll
[NGUỒN: 2.9, ISO/IEC 29100:2011, đã sửa đổi - CHÚ THÍCH đã bị xóa.]
3.7
Tin cậy (trust)
mức độ mà người dùng hoặc bên liên quan khác có niềm tin rằng một sản phẩm hoặc hệ thống sẽ
hoạt động như dự kiến
[NGUỒN: 4.1.3.2, ISO/IEC 25010:2011]
4 Ký hiệu và thuật ngữ viết tắt
Pll thông tin định danh cá nhân personally identifiable information
5 Kịch bản
5.1 Sử dụng dữ liệu đa nguồn để giảm thiểu tử vong và thương tích do giao thông
Trên toàn thế giới, 1,25 triệu người tử vong mỗi năm do các tai nạn liên quan đến giao thông và từ 20
triệu đến 50 triệu người chịu thương tích. Các bộ dữ liệu bao gồm dữ liệu tai nạn, các thuộc tính
đường bộ, quy hoạch sử dụng đất, nhân khẩu học, các mô hình đi lại, các vi phạm đỗ xe và các cải
thiện an toàn hiện có. Một trong những kết quả chính là một "mô hình phơi nhiễm" dự đoán số lượng
xe ô tô tại một địa điểm nhất định vào một thời điểm nhất định. Các phép đo lường giao thông thực tế
rất tốn kém trong khi các dự đoán sử dụng học máy tương đối không tốn kém. Ví dụ, tại Hoa Kỳ, nơi
34.000 người tử vong hàng năm trong các tai nạn liên quan đến giao thông, một tổ chức phi lợi nhuận
có tên là DataKind1)1) đang sử dụng dữ liệu và học máy để phát triển các mô hình dự đoán các mô
hình tai nạn giao thông. Các mô hình này sau đó có thể được sử dụng để xác định nơi cần tập trung
các cải thiện đường phố và dự đoán tác động lên tỷ lệ tai nạn đối với các cải thiện cụ thể. Các cải
thiện đường phố đã bao gồm đèn tín hiệu và kiểm soát giao thông, làn đường dành cho xe đẹp, thiết
kế và xử lý mặt đường. DataKind® đã tổ chức một DATADIVE 2)2) để tập hợp các nhà khoa học dữ
liệu nhằm chuyển đổi dữ liệu có sẵn và phát triển mô hình. Một trong những thách thức chính trong
kịch bản này là làm cho các chủ sở hữu dữ liệu tin tưởng giao dữ liệu của họ cho một nhóm và cho
một bộ xử lý bên thứ ba. Các mối quan ngại cụ thể bao gồm:
• Các quy định, chính sách áp dụng và các hạn chế sử dụng dữ liệu khác được xác định và tuân thủ
như thế nào?
• Làm thế nào để tránh các hành vi xâm phạm quyền riêng tư?
• Các quy trình nào được sử dụng để cung cấp bảo mật từ đầu đến cuối?
• Nguồn gốc dữ liệu được duy trì như thế nào?
• Bằng chứng về sự tuân thủ là gì?
Hình 1 - Minh họa hệ thống dự đoán các mô hình tai nạn giao thông như được mô tả ở trên.
5.2 Sử dụng dữ liệu đa nguồn cho tự động hóa trong nhà
Một loạt các ứng dụng tự động hóa nhà ở đang nổi lên có thể hưởng lợi từ việc truy cập vào nhiều
loại dữ liệu hơn, có thể được lấy từ nhiều nhà cung cấp khác nhau và được xử lý một cách phối hợp,
kịp thời.
Mục tiêu chung của bất kỳ ứng dụng nhà ở nào là sử dụng dữ liệu sẵn có để nâng cao hiệu quả và
hiệu suất của ngôi nhà, vừa với vai trò là một phần của đô thị, vừa là một nơi sống lý tưởng. Để làm
được điều này, các hệ thống loT/Hệ thống thông tin (IS) trong nhà cần phải có đầy đủ thông tin, linh
hoạt và năng động hơn để phục vụ cư dân - cả trong việc quản lý tòa nhà lẫn cải thiện chất lượng
sống bên trong.
Hiện nay có rất nhiều dịch vụ gia đình đang được phát triển bởi các nhà cung cấp dịch vụ và nhà sản
1)1) DataKind là nhãn hiệu dịch vụ của DataKind. Thông tin này được cung cấp để thuận tiện cho
người dùng tài liệu này và không cấu thành sự chứng thực của ISO hoặc IEC.
2)2) DATADIVE là nhãn hiệu dịch vụ của một dịch vụ do DataKind cung cấp. Thông tin này được cung
cấp để thuận tiện cho người dùng tài liệu này và không cấu thành sự chứng thực của ISO hoặc IEC
đối với dịch vụ được đặt tên. Các dịch vụ tương đương có thể được sử dụng nếu chứng minh được
chúng dẫn đến kết quả tương tự.
xuất khác nhau, từ hệ thống giải trí thông minh (TV, Internet, điện thoại, màn hình treo tường...) đến
các hệ thống phát hiện và cảnh báo khẩn cấp, cũng như các hệ thống quản lý điện và nước thông
minh.
Một số ví dụ về dữ liệu đa nguồn dùng để xử lý hoạt động trong nhà bao gồm:
- Tín hiệu thời gian từ các nguồn công cộng;
- Thông tin dự báo thời tiết và điều kiện hiện tại tại khu vực nhà ở; Thông tin khu dân cư, ví dụ: cảnh
báo, chuông báo cháy, chất lượng không khí, ùn tắc giao thông;
- Dữ liệu từ cảm biến của các hệ thống đa nhà cung cấp trong nhà, ví dụ: khóa cửa, nhiệt độ, trạng
thái và tình trạng thiết bị (ví dụ: tủ lạnh bị hỏng), trạng thái có người ở (có ai ở nhà không?), trạng thái
kết nối, chỉ số điện và nước;
- Thông tin bảo trì, hỗ trợ và thanh toán dịch vụ trong nhà;
- Nguồn dữ liệu hình ảnh và âm thanh (bên trong và bên ngoài);
- Báo động y tế khẩn cấp và xâm nhập trái phép;
- Thông tin lịch và vị trí hiện tại của cư dân, tức là ai được mong đợi có mặt ở nhà và vào thời điểm
nào;
- Các chính sách và cấu hình thiết lập, ví dụ: biểu giá nước, chi phí điện, quy tắc theo thời gian trong
ngày. Các nguồn thông tin có thể được phân loại như sau:
- Thông tin công cộng, ví dụ: cơ sở dữ liệu công cộng, chính quyền, cơ quan quản lý, quy định pháp
luật, biểu giá cung cấp;
- Thông tin tại nhà, ví dụ: cảm biến loT trong và xung quanh ngôi nhà. Đây có thể là các nguồn riêng
biệt (từ thiết bị của các nhà cung cấp khác nhau), hoặc có thể được tổng hợp và phân phối từ một
trung tâm điều phối; bao gồm cả dữ liệu theo thời gian thực, dữ liệu do người dùng nhập và dữ liệu
lưu trữ;
- Nguồn thông tin liên quan, ví dụ: dữ liệu từ phương tiện cá nhân của cư dân, thông tin từ nhà sản
xuất, thông tin cơ hội như sự kiện địa phương, chương trình khuyến mãi thay thế linh kiện;
- Thông tin mang tính lịch sử và xu hướng;
- Các thiết lập chính sách và quy tắc từ chính phủ, nhà cung cấp và cư dân.
Tất cả dữ liệu này sẽ được truy cập, kết hợp, xử lý và quản lý cả một cách độc lập và tổng hợp nhằm
tạo ra cơ sở ngày càng thông minh hơn cho việc tự động hóa hoạt động trong nhà, kiểm soát và bảo
vệ vận hành ngôi nhà. Sự tin cậy là yếu tố cần thiết để tránh các sự cố, hư hỏng, thiếu hiệu quả và
hành vi sai lệch trong và xung quanh ngôi nhà.
Nhiều giải pháp độc lập sử dụng các nguồn dữ liệu riêng lẻ có thể hưởng lợi từ việc được xử lý một
cách phối hợp và điều phối tốt hơn. Ví dụ, nếu hệ thống điều khiển nhiệt độ trong nhà nhận được
thông tin dự báo thời tiết, nhiệt độ trong nhà và thời gian cư dân về nhà, thì có thể tối ưu hóa hiệu quả
năng lượng một cách hiệu quả hơn..
5.3 Sử dụng dữ liệu đa nguồn cho hoạt động ô tô
Thuật ngữ "ô tô" đại diện cho một phạm vi rộng các loại phương tiện có thể có các yêu cầu rất giống
nhau. Các nhà sản xuất, chủ sở hữu, người lái và người ngồi trong ô tô có thể là khách hàng của các
hệ thống dựa trên đám mây và các hệ thống tích hợp trên ô tô của xe.
Các ứng dụng trên ô tô có thể hưởng lợi từ việc truy cập dữ liệu từ nhiều nguồn được cung cấp theo
cách phối hợp, kịp thời và đáng tin cậy. Hai trường hợp sử dụng là việc thu thập thông tin để sử dụng:
- bởi ô tô (một "đám mây con" trên xe) hoặc proxy dựa trên đám mây cho mục đích lái xe; hoặc
- bởi các công ty bảo hiểm, nhà sản xuất ô tô, thành phố, chính phủ và các bên khác cho các dịch vụ
liên quan và ngoại tuyến như bảo trì, theo dõi sử dụng, quản lý tắc nghẽn và nhiều khả năng khác.
Các mục tiêu chung cho bất kỳ chiếc ô tô nào là tối ưu hóa trải nghiệm người dùng (hành khách),
giảm chi phí và chậm trễ vận chuyển, cải thiện an toàn và tối đa hóa tuổi thọ phương tiện. Để làm
được điều này, các hệ thống tự động hóa ô tô cần được cung cấp thông tin, linh hoạt và năng động,
đặc biệt nếu các hệ thống tự lái hoặc hỗ trợ lái xe đang được sử dụng.
Các dịch vụ liên quan đến ô tô bao gồm từ mạng xã hội trong xe đến quản lý lộ trình đến báo động
khẩn cấp và tránh va chạm. Ngoài ra, một lượng thông tin đáng kể có thể được thu thập cho việc sửa
chữa và bảo trì hoặc để phát hiện lỗi. Các ứng dụng khác cố gắng biến chiếc ô tô thành một "ngôi nhà
di động" và có thể cung cấp quyền truy cập vào tất cả dữ liệu có sẵn tại nhà.
Một chiếc ô tô có thể được xem như một cụm các "thiết bị loT", mỗi thiết bị này có thể yêu cầu nguồn
cấp dữ liệu từ các nguồn dữ liệu khác nhau hoặc có thể tương tác với các hệ thống bên ngoài xử
dữ liệu từ nhiều nguồn, có thể có hàng trăm cảm biến liên quan đến một chiếc ô tô duy nhất.
Ví dụ về dữ liệu đa nguồn cho hoạt động ô tô có thể bao gồm:
- Tín hiệu thời gian từ các nguồn công cộng;
- Thông tin thời tiết và trạng thái hiện tại cho các khu vực quan tâm;
- Thông tin đường bộ và môi trường xung quanh, ví dụ: tắc nghẽn, ùn tắc, tai nạn, thiên tai, có thể đến
từ nhiều nguồn khác nhau bao gồm cả các ô tô khác;
- Dữ liệu dựa trên cảm biến từ bên trong ô tô, ví dụ: khóa cửa, nhiệt độ bên trong/bên ngoài, trạng thái
và tình trạng linh kiện (ví dụ: động cơ), trạng thái người lái và người ngồi trong xe, có thể được sử
dụng trực tiếp bởi "đám mây ô tô" hoặc sử dụng từ xa với kết quả được đưa ngược lại cho ô tô;
- Thông tin bảo trì, hỗ trợ và dịch vụ ô tô (cả được thu thập và báo cáo);
- Nguồn dữ liệu hình ảnh, âm thanh và dữ liệu (bên trong và bên ngoài) cho người sử dụng là hành
khách;
- Tình trạng sức khỏe của người ngồi trong xe, báo động khẩn cấp và xâm nhập (đột nhập);
- Thông tin từ các hệ sinh thái quan tâm khác, ví dụ: nhà, văn phòng.
Tất cả các nguồn dữ liệu này có thể được truy cập, kết hợp, xử lý và quản lý cả độc lập và kết hợp để
cung cấp một cơ sở ngày càng thông minh hơn cho hoạt động, kiểm soát và bảo vệ ô tô. Từ góc độ vĩ
mô, thông tin từ nhiều ô tô có thể được thu thập và xử lý để phát triển thông tin cho các nhà cung cấp
ô tô, các nhà quy hoạch thành phố và các cơ quan quản lý.
Nhiều giải pháp điểm sử dụng các nguồn dữ liệu độc lập có thể được phối hợp và chia sẻ một cách
hữu ích. Ví dụ, nếu một chiếc ô tô biết dự báo thời tiết, điều kiện đường hiện tại và lượng nhiên liệu
có sẵn, thì việc lựa chọn tuyến đường và các điểm dừng nghỉ/tiếp nhiên liệu có thể được điều phối và
tối ưu hóa hiệu quả hơn.
6 Sự tin cậy
Tin cậy là một yếu tố then chốt trong việc xử lý dữ liệu đa nguồn. Tin cậy có nhiều ý nghĩa và hình
thức khác nhau đối với các bên liên quan đến dữ liệu và việc xử lý dữ liệu tùy thuộc vào cốc góc nhìn
khác nhau. Các bên liên quan bao gồm (các) tổ chức xử lý dữ liệu, (các) tổ chức là nguồn dữ liệu,
những người có Pll được chứa trong bất kỳ dữ liệu nào, và cuối cùng là những người và/hoặc tổ chức
sử dụng kết quả của quá trình xử lý.
Đối với một tổ chức xử lý dữ liệu, một trong những yếu tố chính của sự tin cậy liên quan đến nguồn
gốc của dữ liệu mà họ sử dụng: dữ liệu đã được tập hợp như thế nào, thông tin chứa trong đó đáng
tin cậy đến mức nào, dữ liệu có cần làm sạch hoặc lọc không, dữ liệu chứa đầy đủ đến mức nào, dữ
liệu có chứa Pll hoặc thông tin mật dưới bất kỳ hình thức nào không. Các vấn đề khác liên quan đến
bất kỳ quy định và luật lệ nào có thể áp dụng cho dữ liệu và bất kỳ điều khoản thương mại nào áp
dụng cho dữ liệu mà có thể ảnh hưởng đến việc xử lý theo kế hoạch.
Đối với một tổ chức là nguồn dữ liệu, yếu tố chính của sự tin cậy liên quan đến việc tổ chức xử lý có
sử dụng dữ liệu đúng như được ủy quyền hay không. Các câu hỏi thiết yếu có thể bao gồm:
- Tổ chức xử lý có đưa ra tuyên bố rõ ràng về các mục đích sử dụng dự kiến không?
- Tổ chức xử lý có ký một thỏa thuận liên quan đến việc xử lý này không, và đặc biệt có đồng ý tuân
thủ bất kỳ hạn chế hoặc quy định nào áp dụng cho dữ liệu không (liên quan đến cả các điều khoản
thương mại, nếu có, và bất kỳ quy định hoặc luật lệ nào áp dụng)?
- Tổ chức xử lý có các chứng nhận phù hợp hoặc bằng chứng, tương đương liên quan đến việc xử lý
không, bao gồm các biện pháp kiểm soát an ninh và bảo vệ Pll phù hợp?
Đối với bất kỳ cá nhân nào có Pll được chứa trong bất kỳ dữ liệu nào được sử dụng cho việc xử lý
mối quan ngại chính là Pll được xử lý một cách minh bạch và chỉ cho các mục đích đã được nêu rõ
ràng cho cá nhân và đã được sự đồng ý. Một mối quan ngại chính liên quan đến bất kỳ sự cố rò rỉ Pll
nào có thể xảy ra là liệu tất cả các biện pháp cần thiết có được áp dụng để ngăn chặn các sự cố đó
hay không.
Cuối cùng, đối với những người hoặc tổ chức sử dụng kết quả của quá trình xử lý, yếu tố chính của
sự tin cậy liên quan đến khả năng của họ trong việc dựa vào kết quả đó, rằng nó là chính xác, không
thiên vị và khớp với bất kỳ tuyên bố nào mà bộ xử lý đưa ra về kết quả.
7 Quyền truy cập và xử lý dữ liệu
Thiết lập ai có thể sử dụng, xử lý và chuyển tiếp dữ liệu, và hiểu rõ các quyền mà các bên khác nhau
có đối với dữ liệu là điều cần thiết cho một hệ sinh thái dữ liệu đa nguồn.
Từ cuộc thảo luận về quyền sở hữu dữ liệu, ví dụ về hệ sinh thái ô tô là một trường hợp sử dụng điển
hình trong việc thiết lập quyền truy cập dữ liệu và các quyền xem, sửa đổi, sao chép hoặc xử lý dữ
liệu khi xem xét có thể có các nguồn dữ liệu riêng biệt từ các thành phần khác nhau, nhà cung cấp
linh kiện, nhà sản xuất ô tô hoặc chủ sở hữu ô tô, những người có thể sở hữu dữ liệu sau khi nó