TCVN 14483:2025: Tiêu chuẩn quốc gia [Mới nhất]

TIÊU CHUẨN QUỐC GIA

TCVN 14483:2025

CÔNG NGHỆ THÔNG TIN - TÍNH TOÁN ĐÁM MÂY - KHUNG TÍN CẬY ĐỂ XỬ LÝ DỮ LIỆU ĐA

NGUỒN

Information technology- Cloud computing- Framework of trust for processing of multi-sourced

data

Nội dung

Lời nói đầu

1 Phạm vi áp dụng

2 Tài liệu viện dẫn

3 Thuật ngữ và định nghĩa

4 Ký hiệu và thuật ngữ viết tắt

5 Kịch bản

5.1 Sử dụng dữ liệu đa nguồn để giảm thiểu tử vong và thương tích do giao thông

5.2 Sử dụng dữ liệu đa nguồn cho tự động hóa trong nhà

5.3 Sử dụng dữ liệu đa nguồn cho hoạt động ô tô

6 Sự tin cậy

7 Quyền truy cập và xử lý dữ liệu

8 Khung xử lý dữ liệu đa nguồn đáng tin cậy

8.1 Giới thiệu

8.2 Luồng dữ liệu

8.3 Các yếu tố về sự tin cậy 8.3.1 Chung

9 Sử dụng khung trong các thỏa thuận

9.1 Quy định chung

9.2 Nghĩa vụ và kiểm soát việc sử dụng dữ liệu

9.3 Bản ghi nguồn gốc dữ liệu, chất lượng và tính toàn vẹn

9.4 Chuỗi hành trình bảo quản

9.5 An ninh và quyền riêng tư

9.6 Bằng chứng tuân thủ không thể thay đổi

Phụ lục A (tham khảo) Nghĩa vụ và kiểm soát việc sử dụng dữ liệu

Thư mục tài liệu tham khảo

Lời nói đầu

TCVN 14483:2025 được xây dựng trên cơ sở tham khảo ISO/IEC TR 23186:2018.

TCVN 14483:2025 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/JTC 1 “Công nghệ thông tin" biên soạn,

Viện Tiêu chuẩn Chất lượng Việt Nam để nghị, Ủy ban Tiêu chuẩn Đo lường Chất lượng quốc gia

thẩm định, Bộ Khoa học và Công nghệ công bố

CÔNG NGHỆ THÔNG TIN - TÍNH TOÁN ĐÁM MÂY - KHUNG TIN CẬY ĐỂ XỬ LÝ DỮ LIỆU ĐA

NGUỒN

Information technology- Cloud computing- Framework of trust for processing of multi-sourced

data

1 Phạm vi áp dụng

Tiêu chuẩn này mô tả một khung tin cậy cho việc xử lý dữ liệu đa nguồn bao gồm các nghĩa vụ và

kiểm soát việc sử dụng dữ liệu, nguồn gốc dữ liệu, chuỗi hành trình bảo quản, bảo mật và Bằng

chứng tuân thủ không thể thay đổi như các yếu tố của khung.

2 Tài liệu viện dẫn

Các tài liệu viện dẫn dưới đây là cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu ghi

năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì

áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).

TCVN 1248Q (ISO/IEC 17788), Công nghệ thông tin -Tính toán đám mây - Tổng quan và từ vựng.

3 Thuật ngữ và định nghĩa

Tiêu chuẩn này áp dụng các thuật ngữ và định nghĩa trong TCVN 12480 (ISO/IEC 17788) và các thuật

ngữ và định nghĩa sau đây.

3.1

Chuỗi hành trình bảo quản (chain of custody)

Sự sở hữu, sự dịch chuyển, sự xử lý và vị trí là bằng chứng của vật liệu từ một điểm thời gian này

đến một điểm thời gian khác.

[NGUỒN: 3.1, ISO/IEC 27050-1:2016]

3.2

Dữ liệu (data)

Thông tin được ghi lại.

[NGUỒN: 3.11, ISO 22005:2007]

3.3

Xử lý dữ liệu (data processing)

Thực hiện có hệ thống các thao tác trên dữ liệu.

[NGUỒN: 2121276, ISO 2382:2015, đã sửa đổi - Chú thích 1 đến 4 cho mục nhập đã bị xóa và thuật

ngữ thay thế “xử lý dữ liệu tự động” đã bị xóa.]

3.4

Tập dữ liệu (data set)

Nhóm dữ liệu có ý nghĩa logic.

[NGUỒN: 3.2.4, ISO 8000-2:2018, đã sửa đổi - VÍ DỤ 1 và 2 đã bị xóa.]

3.5

Dữ liệu đa nguồn (muiti-sourced data)

Dữ liệu bao gồm các tập dữ liệu riêng biệt đã được tạo ra bởi nhiều nguồn đa dạng và được tập hợp

bởi một hoặc nhiều dịch vụ đám mây từ một hoặc nhiều CSP Chú thích 1 cho mục nhập: Các tập dữ

liệu sau đó là đối tượng của phân tích và xử lý kết hợp với mục đích trích xuất thông tin chi tiết và

thông tin không thể thu được thông qua phân tích từng tập dữ liệu riêng lẻ.

3.6

Thông tin định danh cá nhân (personally identifiable information)

Pll

Bất kỳ thông tin nào (a) có thể được sử dụng để nhận dạng chủ thể Pll mà thông tin đó liên quan đến,

hoặc (b) đang hoặc có thể liên kết trực tiếp hoặc gián tiếp với chủ thể Pll

[NGUỒN: 2.9, ISO/IEC 29100:2011, đã sửa đổi - CHÚ THÍCH đã bị xóa.]

3.7

Tin cậy (trust)

mức độ mà người dùng hoặc bên liên quan khác có niềm tin rằng một sản phẩm hoặc hệ thống sẽ

hoạt động như dự kiến

[NGUỒN: 4.1.3.2, ISO/IEC 25010:2011]

4 Ký hiệu và thuật ngữ viết tắt

Pll thông tin định danh cá nhân personally identifiable information

5 Kịch bản

5.1 Sử dụng dữ liệu đa nguồn để giảm thiểu tử vong và thương tích do giao thông

Trên toàn thế giới, 1,25 triệu người tử vong mỗi năm do các tai nạn liên quan đến giao thông và từ 20

triệu đến 50 triệu người chịu thương tích. Các bộ dữ liệu bao gồm dữ liệu tai nạn, các thuộc tính

đường bộ, quy hoạch sử dụng đất, nhân khẩu học, các mô hình đi lại, các vi phạm đỗ xe và các cải

thiện an toàn hiện có. Một trong những kết quả chính là một "mô hình phơi nhiễm" dự đoán số lượng

xe ô tô tại một địa điểm nhất định vào một thời điểm nhất định. Các phép đo lường giao thông thực tế

rất tốn kém trong khi các dự đoán sử dụng học máy tương đối không tốn kém. Ví dụ, tại Hoa Kỳ, nơi

34.000 người tử vong hàng năm trong các tai nạn liên quan đến giao thông, một tổ chức phi lợi nhuận

có tên là DataKind1)1) đang sử dụng dữ liệu và học máy để phát triển các mô hình dự đoán các mô

hình tai nạn giao thông. Các mô hình này sau đó có thể được sử dụng để xác định nơi cần tập trung

các cải thiện đường phố và dự đoán tác động lên tỷ lệ tai nạn đối với các cải thiện cụ thể. Các cải

thiện đường phố đã bao gồm đèn tín hiệu và kiểm soát giao thông, làn đường dành cho xe đẹp, thiết

kế và xử lý mặt đường. DataKind® đã tổ chức một DATADIVE 2)2) để tập hợp các nhà khoa học dữ

liệu nhằm chuyển đổi dữ liệu có sẵn và phát triển mô hình. Một trong những thách thức chính trong

kịch bản này là làm cho các chủ sở hữu dữ liệu tin tưởng giao dữ liệu của họ cho một nhóm và cho

một bộ xử lý bên thứ ba. Các mối quan ngại cụ thể bao gồm:

• Các quy định, chính sách áp dụng và các hạn chế sử dụng dữ liệu khác được xác định và tuân thủ

như thế nào?

• Làm thế nào để tránh các hành vi xâm phạm quyền riêng tư?

• Các quy trình nào được sử dụng để cung cấp bảo mật từ đầu đến cuối?

• Nguồn gốc dữ liệu được duy trì như thế nào?

• Bằng chứng về sự tuân thủ là gì?

Hình 1 - Minh họa hệ thống dự đoán các mô hình tai nạn giao thông như được mô tả ở trên.

5.2 Sử dụng dữ liệu đa nguồn cho tự động hóa trong nhà

Một loạt các ứng dụng tự động hóa nhà ở đang nổi lên có thể hưởng lợi từ việc truy cập vào nhiều

loại dữ liệu hơn, có thể được lấy từ nhiều nhà cung cấp khác nhau và được xử lý một cách phối hợp,

kịp thời.

Mục tiêu chung của bất kỳ ứng dụng nhà ở nào là sử dụng dữ liệu sẵn có để nâng cao hiệu quả và

hiệu suất của ngôi nhà, vừa với vai trò là một phần của đô thị, vừa là một nơi sống lý tưởng. Để làm

được điều này, các hệ thống loT/Hệ thống thông tin (IS) trong nhà cần phải có đầy đủ thông tin, linh

hoạt và năng động hơn để phục vụ cư dân - cả trong việc quản lý tòa nhà lẫn cải thiện chất lượng

sống bên trong.

Hiện nay có rất nhiều dịch vụ gia đình đang được phát triển bởi các nhà cung cấp dịch vụ và nhà sản

1)1) DataKind là nhãn hiệu dịch vụ của DataKind. Thông tin này được cung cấp để thuận tiện cho

người dùng tài liệu này và không cấu thành sự chứng thực của ISO hoặc IEC.

2)2) DATADIVE là nhãn hiệu dịch vụ của một dịch vụ do DataKind cung cấp. Thông tin này được cung

cấp để thuận tiện cho người dùng tài liệu này và không cấu thành sự chứng thực của ISO hoặc IEC

đối với dịch vụ được đặt tên. Các dịch vụ tương đương có thể được sử dụng nếu chứng minh được

chúng dẫn đến kết quả tương tự.

xuất khác nhau, từ hệ thống giải trí thông minh (TV, Internet, điện thoại, màn hình treo tường...) đến

các hệ thống phát hiện và cảnh báo khẩn cấp, cũng như các hệ thống quản lý điện và nước thông

minh.

Một số ví dụ về dữ liệu đa nguồn dùng để xử lý hoạt động trong nhà bao gồm:

- Tín hiệu thời gian từ các nguồn công cộng;

- Thông tin dự báo thời tiết và điều kiện hiện tại tại khu vực nhà ở; Thông tin khu dân cư, ví dụ: cảnh

báo, chuông báo cháy, chất lượng không khí, ùn tắc giao thông;

- Dữ liệu từ cảm biến của các hệ thống đa nhà cung cấp trong nhà, ví dụ: khóa cửa, nhiệt độ, trạng

thái và tình trạng thiết bị (ví dụ: tủ lạnh bị hỏng), trạng thái có người ở (có ai ở nhà không?), trạng thái

kết nối, chỉ số điện và nước;

- Thông tin bảo trì, hỗ trợ và thanh toán dịch vụ trong nhà;

- Nguồn dữ liệu hình ảnh và âm thanh (bên trong và bên ngoài);

- Báo động y tế khẩn cấp và xâm nhập trái phép;

- Thông tin lịch và vị trí hiện tại của cư dân, tức là ai được mong đợi có mặt ở nhà và vào thời điểm

nào;

- Các chính sách và cấu hình thiết lập, ví dụ: biểu giá nước, chi phí điện, quy tắc theo thời gian trong

ngày. Các nguồn thông tin có thể được phân loại như sau:

- Thông tin công cộng, ví dụ: cơ sở dữ liệu công cộng, chính quyền, cơ quan quản lý, quy định pháp

luật, biểu giá cung cấp;

- Thông tin tại nhà, ví dụ: cảm biến loT trong và xung quanh ngôi nhà. Đây có thể là các nguồn riêng

biệt (từ thiết bị của các nhà cung cấp khác nhau), hoặc có thể được tổng hợp và phân phối từ một

trung tâm điều phối; bao gồm cả dữ liệu theo thời gian thực, dữ liệu do người dùng nhập và dữ liệu

lưu trữ;

- Nguồn thông tin liên quan, ví dụ: dữ liệu từ phương tiện cá nhân của cư dân, thông tin từ nhà sản

xuất, thông tin cơ hội như sự kiện địa phương, chương trình khuyến mãi thay thế linh kiện;

- Thông tin mang tính lịch sử và xu hướng;

- Các thiết lập chính sách và quy tắc từ chính phủ, nhà cung cấp và cư dân.

Tất cả dữ liệu này sẽ được truy cập, kết hợp, xử lý và quản lý cả một cách độc lập và tổng hợp nhằm

tạo ra cơ sở ngày càng thông minh hơn cho việc tự động hóa hoạt động trong nhà, kiểm soát và bảo

vệ vận hành ngôi nhà. Sự tin cậy là yếu tố cần thiết để tránh các sự cố, hư hỏng, thiếu hiệu quả và

hành vi sai lệch trong và xung quanh ngôi nhà.

Nhiều giải pháp độc lập sử dụng các nguồn dữ liệu riêng lẻ có thể hưởng lợi từ việc được xử lý một

cách phối hợp và điều phối tốt hơn. Ví dụ, nếu hệ thống điều khiển nhiệt độ trong nhà nhận được

thông tin dự báo thời tiết, nhiệt độ trong nhà và thời gian cư dân về nhà, thì có thể tối ưu hóa hiệu quả

năng lượng một cách hiệu quả hơn..

5.3 Sử dụng dữ liệu đa nguồn cho hoạt động ô tô

Thuật ngữ "ô tô" đại diện cho một phạm vi rộng các loại phương tiện có thể có các yêu cầu rất giống

nhau. Các nhà sản xuất, chủ sở hữu, người lái và người ngồi trong ô tô có thể là khách hàng của các

hệ thống dựa trên đám mây và các hệ thống tích hợp trên ô tô của xe.

Các ứng dụng trên ô tô có thể hưởng lợi từ việc truy cập dữ liệu từ nhiều nguồn được cung cấp theo

cách phối hợp, kịp thời và đáng tin cậy. Hai trường hợp sử dụng là việc thu thập thông tin để sử dụng:

- bởi ô tô (một "đám mây con" trên xe) hoặc proxy dựa trên đám mây cho mục đích lái xe; hoặc

- bởi các công ty bảo hiểm, nhà sản xuất ô tô, thành phố, chính phủ và các bên khác cho các dịch vụ

liên quan và ngoại tuyến như bảo trì, theo dõi sử dụng, quản lý tắc nghẽn và nhiều khả năng khác.

Các mục tiêu chung cho bất kỳ chiếc ô tô nào là tối ưu hóa trải nghiệm người dùng (hành khách),

giảm chi phí và chậm trễ vận chuyển, cải thiện an toàn và tối đa hóa tuổi thọ phương tiện. Để làm

được điều này, các hệ thống tự động hóa ô tô cần được cung cấp thông tin, linh hoạt và năng động,

đặc biệt nếu các hệ thống tự lái hoặc hỗ trợ lái xe đang được sử dụng.

Các dịch vụ liên quan đến ô tô bao gồm từ mạng xã hội trong xe đến quản lý lộ trình đến báo động

khẩn cấp và tránh va chạm. Ngoài ra, một lượng thông tin đáng kể có thể được thu thập cho việc sửa

chữa và bảo trì hoặc để phát hiện lỗi. Các ứng dụng khác cố gắng biến chiếc ô tô thành một "ngôi nhà

di động" và có thể cung cấp quyền truy cập vào tất cả dữ liệu có sẵn tại nhà.

Một chiếc ô tô có thể được xem như một cụm các "thiết bị loT", mỗi thiết bị này có thể yêu cầu nguồn

cấp dữ liệu từ các nguồn dữ liệu khác nhau hoặc có thể tương tác với các hệ thống bên ngoài xử lý

dữ liệu từ nhiều nguồn, có thể có hàng trăm cảm biến liên quan đến một chiếc ô tô duy nhất.

Ví dụ về dữ liệu đa nguồn cho hoạt động ô tô có thể bao gồm:

- Tín hiệu thời gian từ các nguồn công cộng;

- Thông tin thời tiết và trạng thái hiện tại cho các khu vực quan tâm;

- Thông tin đường bộ và môi trường xung quanh, ví dụ: tắc nghẽn, ùn tắc, tai nạn, thiên tai, có thể đến

từ nhiều nguồn khác nhau bao gồm cả các ô tô khác;

- Dữ liệu dựa trên cảm biến từ bên trong ô tô, ví dụ: khóa cửa, nhiệt độ bên trong/bên ngoài, trạng thái

và tình trạng linh kiện (ví dụ: động cơ), trạng thái người lái và người ngồi trong xe, có thể được sử

dụng trực tiếp bởi "đám mây ô tô" hoặc sử dụng từ xa với kết quả được đưa ngược lại cho ô tô;

- Thông tin bảo trì, hỗ trợ và dịch vụ ô tô (cả được thu thập và báo cáo);

- Nguồn dữ liệu hình ảnh, âm thanh và dữ liệu (bên trong và bên ngoài) cho người sử dụng là hành

khách;

- Tình trạng sức khỏe của người ngồi trong xe, báo động khẩn cấp và xâm nhập (đột nhập);

- Thông tin từ các hệ sinh thái quan tâm khác, ví dụ: nhà, văn phòng.

Tất cả các nguồn dữ liệu này có thể được truy cập, kết hợp, xử lý và quản lý cả độc lập và kết hợp để

cung cấp một cơ sở ngày càng thông minh hơn cho hoạt động, kiểm soát và bảo vệ ô tô. Từ góc độ vĩ

mô, thông tin từ nhiều ô tô có thể được thu thập và xử lý để phát triển thông tin cho các nhà cung cấp

ô tô, các nhà quy hoạch thành phố và các cơ quan quản lý.

Nhiều giải pháp điểm sử dụng các nguồn dữ liệu độc lập có thể được phối hợp và chia sẻ một cách

hữu ích. Ví dụ, nếu một chiếc ô tô biết dự báo thời tiết, điều kiện đường hiện tại và lượng nhiên liệu

có sẵn, thì việc lựa chọn tuyến đường và các điểm dừng nghỉ/tiếp nhiên liệu có thể được điều phối và

tối ưu hóa hiệu quả hơn.

6 Sự tin cậy

Tin cậy là một yếu tố then chốt trong việc xử lý dữ liệu đa nguồn. Tin cậy có nhiều ý nghĩa và hình

thức khác nhau đối với các bên liên quan đến dữ liệu và việc xử lý dữ liệu tùy thuộc vào cốc góc nhìn

khác nhau. Các bên liên quan bao gồm (các) tổ chức xử lý dữ liệu, (các) tổ chức là nguồn dữ liệu,

những người có Pll được chứa trong bất kỳ dữ liệu nào, và cuối cùng là những người và/hoặc tổ chức

sử dụng kết quả của quá trình xử lý.

Đối với một tổ chức xử lý dữ liệu, một trong những yếu tố chính của sự tin cậy liên quan đến nguồn

gốc của dữ liệu mà họ sử dụng: dữ liệu đã được tập hợp như thế nào, thông tin chứa trong đó đáng

tin cậy đến mức nào, dữ liệu có cần làm sạch hoặc lọc không, dữ liệu chứa đầy đủ đến mức nào, dữ

liệu có chứa Pll hoặc thông tin mật dưới bất kỳ hình thức nào không. Các vấn đề khác liên quan đến

bất kỳ quy định và luật lệ nào có thể áp dụng cho dữ liệu và bất kỳ điều khoản thương mại nào áp

dụng cho dữ liệu mà có thể ảnh hưởng đến việc xử lý theo kế hoạch.

Đối với một tổ chức là nguồn dữ liệu, yếu tố chính của sự tin cậy liên quan đến việc tổ chức xử lý có

sử dụng dữ liệu đúng như được ủy quyền hay không. Các câu hỏi thiết yếu có thể bao gồm:

- Tổ chức xử lý có đưa ra tuyên bố rõ ràng về các mục đích sử dụng dự kiến không?

- Tổ chức xử lý có ký một thỏa thuận liên quan đến việc xử lý này không, và đặc biệt có đồng ý tuân

thủ bất kỳ hạn chế hoặc quy định nào áp dụng cho dữ liệu không (liên quan đến cả các điều khoản

thương mại, nếu có, và bất kỳ quy định hoặc luật lệ nào áp dụng)?

- Tổ chức xử lý có các chứng nhận phù hợp hoặc bằng chứng, tương đương liên quan đến việc xử lý

không, bao gồm các biện pháp kiểm soát an ninh và bảo vệ Pll phù hợp?

Đối với bất kỳ cá nhân nào có Pll được chứa trong bất kỳ dữ liệu nào được sử dụng cho việc xử lý

mối quan ngại chính là Pll được xử lý một cách minh bạch và chỉ cho các mục đích đã được nêu rõ

ràng cho cá nhân và đã được sự đồng ý. Một mối quan ngại chính liên quan đến bất kỳ sự cố rò rỉ Pll

nào có thể xảy ra là liệu tất cả các biện pháp cần thiết có được áp dụng để ngăn chặn các sự cố đó

hay không.

Cuối cùng, đối với những người hoặc tổ chức sử dụng kết quả của quá trình xử lý, yếu tố chính của

sự tin cậy liên quan đến khả năng của họ trong việc dựa vào kết quả đó, rằng nó là chính xác, không

thiên vị và khớp với bất kỳ tuyên bố nào mà bộ xử lý đưa ra về kết quả.

7 Quyền truy cập và xử lý dữ liệu

Thiết lập ai có thể sử dụng, xử lý và chuyển tiếp dữ liệu, và hiểu rõ các quyền mà các bên khác nhau

có đối với dữ liệu là điều cần thiết cho một hệ sinh thái dữ liệu đa nguồn.

Từ cuộc thảo luận về quyền sở hữu dữ liệu, ví dụ về hệ sinh thái ô tô là một trường hợp sử dụng điển

hình trong việc thiết lập quyền truy cập dữ liệu và các quyền xem, sửa đổi, sao chép hoặc xử lý dữ

liệu khi xem xét có thể có các nguồn dữ liệu riêng biệt từ các thành phần khác nhau, nhà cung cấp

linh kiện, nhà sản xuất ô tô hoặc chủ sở hữu ô tô, những người có thể sở hữu dữ liệu sau khi nó

Tiêu chuẩn quốc gia TCVN 14483:2025

TCVN 14483:2025 quy định khung tin cậy xử lý dữ liệu đa nguồn trên đám mây, bảo mật, toàn vẹn, khả dụng. Áp dụng cho hệ thống phân tích dữ liệu lớn, IoT.

Chủ đề:

Tài liệu liên quan

Tài liêu mới

Xác nhận đăng nhập

Đăng nhập từ tài khoản này?

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi