TNU Journal of Science and Technology
230(05): 353 - 360
http://jst.tnu.edu.vn 353 Email: jst@tnu.edu.vn
ALLELES FREQUENCY OF 21 STR LOCI OF VIETNAM KINH POPULATION
Duong Thi Thu Thuy1*, Le Thi Quynh2, Tran Van Cuong2, Le Thi Thu Thuy1, Bui Anh Tuan1
1Institute of Forensic Science - Ministry of Public Security
2People’s Security Academy - Ministry of Public Security
ARTICLE INFO
ABSTRACT
Received:
29/8/2024
To draw conclusions from forensic DNA typing to trace individuals or
paternity testing, it is necessary to include statistic probability based
on allele and genotype frequencies specific to each population. The
use of 21 core STR loci in DNA typing are widely implemented,
however data on extended STR loci in the Vietnamese (Kinh)
population is still lacking. In this study, the frequency and
polymorphism assessment indices of alleles in the studied population
were calculated and surveyed to build a table on the frequency of
alleles of 21 gene loci of Kinh population according to the GlobalFiler
kit. The results built an allele frequency table of 21 gene loci,
identified a number of typical genetic characteristics such as the
highest and the lowest polymorphism locus, and some common
alleles. Research results are an essential data, providing scientific
basis for each forensic DNA conclusion, serving litigation
requirements.
Revised:
06/02/2025
Published:
07/02/2025
KEYWORDS
DNA profiling
21 STR loci
GlobalFiler
Allele frequency
Vietnamese
NGHIÊN CU TN SUT CÁC ALEN CA 21 LOCUS STR
NGƯỜI KINH VIT NAM
Dương Thị Thu Thy1*, Lê Th Qunh2, Trần Văn Cường2, Lê Th Thu Thy1, Bùi Anh Tun1
1Vin Khoa hc hình s - B Công an, 2Hc vin An ninh nhân dân - B Công an
TÓM TT
Ngày nhn bài:
29/8/2024
Để đưa ra kết luận giám định ADN phc v truy nguyên th hoc
xác đnh quan h huyết thng, cn kèm theo con s xác sut da trên
d liu tn sut alen và tn sut kiểu gen đặc trưng cho mi qun th.
Vic s dng 21 locus STR lõi trong giám định ADN hình s đã
đưc thc hin rng rãi trên thế gii và Vit Nam, tuy nhiên d liu
ca các locus STR m rng trên qun th ngưi Vit (Kinh) hin vn
còn thiếu. Trong nghiên cu này, tn sut và các ch s đánh gtính
đa hình các alen trong qun th nghiên cứu được tính toán kho sát
nhm xây dựng đưc bng d liu v tn sut các alen ca 21 locus
gen của người Vit (Kinh) theo b kit GlobalFiler. Kết qu nghiên
cứu đã xây dựng được bng tn sut alen của 21 locus gen, xác đnh
đưc mt s đặc điểm di truyền đc trưng như locus tính đa hình
cao nht thp nht, mt s alen ph biến. Kết qu nghiên cu
ngun d liu thiết yếu, cung cấp căn cứ khoa hc cho mi kết lun
giám định ADN, phc v các yêu cu t tng.
Ngày hoàn thin:
06/02/2025
Ngày đăng:
07/02/2025
DOI: https://doi.org/10.34238/tnu-jst.11032
* Corresponding author. Email: thuthuysinhhoc@gmail.com
TNU Journal of Science and Technology
230(05): 353 - 360
http://jst.tnu.edu.vn 354 Email: jst@tnu.edu.vn
1. Gii thiu
Giám định DNA phương pháp nghiên cu, phân tích mức độ phân t (nghiên cứu đặc
điểm cu trúc phân t DNA) t các du vết, mu vt ngun gc sinh vt bng các k thut
sinh hc phân t. Vic ng dng k thuật phân tích DNA đã giúp ích rất nhiều cho công tác điều
tra, xét x ti phm [1]. Đây là lĩnh vực giám định cho phép truy nguyên cá th với độ chính xác
cao hơn hẳn các phương pháp nhận dng truyn thng.
Theo lý thuyết di truyn hc, mi qun th người (dân tc, tộc người) khác nhau có những đặc
điểm di truyền đặc trưng, thể hin bng s phân b tn sut các alen trong mi qun th khác
nhau không th áp dụng sở d liu ca qun th này cho mt qun th khác [2], [3]. Trong
giám định DNA các nhà khoa hc hình s phi xem xét chn lc những gen tính đa alen
cao, kho sát tn sut phân b các alen xut hin trong tng qun th, t đó làm sở để phân
tích, đánh giá tính toán xác suất đưa ra kết luận giám định [4] - [6]. Vic thng tn sut
alen, tn sut d hp t, ch s đa hình, khả năng phân bit, kh năng loại tr ca tng locus STR
(Short Tandem Repeat) cùng các ch s kết hp có vai tr quan trng giúp đánh giá đúng mức độ
tin cy ca php phân tích trong từng trường hp c th t đó đưa ra kết luận giám định mt cách
chính xác, khoa hc [7] - [9].
Bộ kit GlobalFiler bao gồm 13 locus thuộc hệ CODIS, khả năng phân biệt cao, độ nhạy
cao, hạn chế các chất ức chế cho kết quả tối ưu với các mẫu bị phân hủy. Hiên nay, bộ kit
GlobalFiler với 24 locus gen (gồm 21 locus gen STR trên nhiễm sắc thể thường 3 locus gen
trên nhiễm sắc thể giới nh) đã đang được sử dụng rộng rãi phục vụ nhận dạng thể người
xác định quan hệ huyết thống tại các phng thí nghiệm giám định DNA hình sự trên thế giới
và trong nước nên việc tính toán tần suất các alen của quần thể người ở Việt Nam theo bộ kit này
cùng cần thiết cấp thiết, làm sở khoa học để phân tích, đánh giá đưa ra kết luận
giám định trong giám định ADN hình sự được khách quan, khoa học.
2. Đối tượng và phương pháp nghiên cứu
2.1. Đối tượng nghiên cu
250 mẫu máu được thu t 250 th người Vit (dân tc Kinh) trên lãnh th Vit Nam, các
mẫu được thu thp ngu nhiên t những người không quan h huyết thng (người được thu
mu tình nguyn cung cp mu và thông tin nhân), mẫu được lưu giữ vào th giy FTA@. 250
th được điều tra v ngun gc qun th thông qua h nhân khẩu căn cước, đảm bảo độ
tin cậy khi được thu mu.
2.2. Phương pháp nghiên cứu
2.2.1. Xác định h kiểu gen ca các mu
Toàn b các mu máu nghiên cứu được tiến hành tách chiết bằng phương pháp tách chiết
(s dng Chelex® 100 Resin hãng Bio-rad), định lượng DNA (bng b kit “Quantiblot
Human DNA Quantitation kit” ca hãng Perkin Elmer), chy phn ng PCR (khuếch đại DNA
bng b kit GlobalFiler trên máy luân nhit ProFlex (hãng Applied Biosystems, Mỹ)), điện di
hunh quang mao qun trên h thng máy gii trình t ABI3500 để phát hin sn phm PCR.
Các bước thí nghiệm đưc thc hiện theo quy trình giám định mu DNA ti Vin Khoa hc hình
s, B Công an. Sau điện di, kết qu được x bng phn mm Genemapper ID-x để xác định
các alen ca mi locus.
2.2.2. Phân tích và tính tn sut alen
Chúng tôi s dụng phương pháp đếm để thng s ng alen trong toàn b kiu gen phân
tích được t 250 mu nghiên cứu sau đó, sử dng phn mm Excel (Microsoft Office) để x lý s
liu thng kê.
TNU Journal of Science and Technology
230(05): 353 - 360
http://jst.tnu.edu.vn 355 Email: jst@tnu.edu.vn
Để s liu nghiên cu v tn sut alen ca các locus th ng dụng được trong giám định
DNA hình s, cn thiết phải đánh giá xem các locus được phân tích t mu có đảm bo cu trúc
di truyn (tn s tương đối ca các alen và tn s các kiu gen) có ổn định hay không qua các thế
h, nghĩa là có tuân theo định lut Hardy-Weinberg hay không [10]. Do đó, cần kim tra s phù
hp gia qun th mu nghiên cu vi qun th cân bng l thuyết thông qua đánh giá chênh lch
gia tn s quan sát thc tế vi phân b l thuyết ca các kiu gen mỗi locus được nghiên cu
có sai khác nhau hay không [2], [4].
2.2.2.1. Xác định và tính tần suất các alen
Tính tn sut các alen ca tng locus theo s liệu thu được theo biu thc sau:
𝑃𝑖 = 𝑖
𝑛
1
2𝑁
(1)
Trong đó: Pi: Tn sut ca alen i; i: alen i quan t thy; n: cá th th n; N: Tng s th (N = 250)
2.2.2.2. Phương pháp kiểm định giả thiết Khi bình phương ( χ2)
Công thức để tính giá tr χ2 như sau: χ2 = (𝑶−𝑬)𝟐
𝑬
𝒌
𝟏 (2)
Trong đó: O: tần suất alen quan sát được t thc nghim; E: tn suất quan sát được, tính theo
lý thuyết; k: s alen xác định được.
Giá tr χ2 được xác định ti bng phân b χ2 vi các bc t do tương ng vi các mc xác sut
tương ứng. Trong các thí nghim sinh hc, 3 mc xác suất thường được s dng là P = 0,05; P =
0,01 hoc P = 0,001. Vi 250 mu nghiên cu, chúng tôi la chn giá tr P = 0,05 là phù hp [1],
[5], [8], [10].
Nếu khi bình phương tính được nh hơn khi bình phương l thuyết thì phân b thc tế phù
hp vi phân phi l thuyết, nghĩa là mu phù hp vi qun th l thuyết.
S dng phn mềm Microsoft Excel để tính toán tn sut các ch s đánh giá nh đa hình
các alen ca qun th nghiên cứu đồng thời xác định tn sut thu thập được đã đủ độ tin cậy để s
dng vào vic tính xác sut truy nguyên th hoc xác sut quan h huyết thng cha, m - con
chưa. Các chỉ s được đánh giá gồm [1] - [6]:
- Tn sut d hp t quan sát (Observed Heterozygosity - H(ob)) là tng tn sut ca tng locus
d hp t quan sát được trong toàn b mu nghiên cu:
H(ob) = S cá th d hp t
Tng s cá th quan sát
(3)
- Tn sut d hp t lý thuyết (Expected Heterozygosity (Hexp))
H(exp) = 1 = 1 pi2
𝑛
𝑖=1
(4)
Trong đó: h là sốth đồng hp t (homozygosity)
= pi2
𝑛
𝑖=1
(5)
- Ch s đa hình (Polymorphism information content - PIC), ch mức đ đa nh ca mt locus:
PIC = 1 pi2
𝑛
𝑖=1 (pi2
𝑛
𝑖=1 )2+pi4
𝑛
𝑖=1
(6)
- Kh năng phân biệt (Power of discrimination - PD): Ch s này cho ta biết kh năng phân
bit gia 2 th không liên quan được xác định v kiu gen trong qun th nghiên cu, ch s
này càng gn ti giá tr 1 thì kh năng phân biệt càng cao. Ch s PD có th đánh giá khả năng
truy nguyên cá th t du vết.
PD = 1 2(pi2
n
i=1 )2+pi4
n
i=1
(7)
- Kh năng loại tr (Power of exclusion - PE): Ch s kh năng loại tr nhằm xác định kh
năng ngẫu nhiên 2 th không quan h huyết thng trên thc tế li th các alen
ging nhau. Giá tr ca ch s càng gn ti 1 tkh năng nhận đnh sai v huyết thng trên
thuyết càng nh. Mi locus có kh năng loại tr khác nhau, vì vy, vai tr quan trng khác
nhau trong vic tính toán độ tin cy. Locus càng có kh năng loại tr cao thì càng có nghĩa
trong giám định truy nguyên cá th và xác định huyết thng cha - m con.
TNU Journal of Science and Technology
230(05): 353 - 360
http://jst.tnu.edu.vn 356 Email: jst@tnu.edu.vn
PE = 1 2 pi2
𝑛
𝑖=1 2(pi2
n
i=1 )2+ 2 pi4
𝑛
𝑖=1 pi3
𝑛
𝑖=1 + 3 pi3pi3
𝑛
𝑖=1
n
i=1
(8)
- Chỉ số quan hệ huyết thống (Paternity index - PI): giá trị tính toán được đưa ra từ một
locus, phản ánh khả năng gấp bao nhiêu lần thể đang được phân tích người cha (mẹ) sinh
học so với một thể được lựa chọn ngẫu nhiên trong cùng quần thể. Nếu PI 1, locus đó hoàn
toàn không nghĩa trong việc xác định huyết thống cha, mẹ - con. Nếu PI >1, thì locus đó
giá tr trong việc xác định huyết thng cha, m - con. Tính đa hình của locus đó càng lớn thì giá
tr này càng cao và càng có giá tr cao trong việc xác định huyết thng cha, m - con.
PI (TPI)= H+h
2h =(1−h)+h
2h =1
2h =1
2(pi2)
𝑛
𝑖=1
(9)
Trong đó: pi: là tần sut ca alen th i trong qun th n alen; h = đồng hp t; H = d hp t.
2.2.2.3. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen
- Ch s kết hp kh năng loại tr (Combined power of exclusion - CPE): Mỗi một bảng tần
suất một giá trị kết hợp khả năng loại trừ khác nhau dựa vào tần suất alen số alen của tộc
người tính được. Trong thang đánh giá, các chỉ số CPE giá trị cao nghĩa hơn giá trị CPE
thấp. L tưởng nhất CPE càng gần giá trị 1,00 càng tốt, nếu chỉ số CPE 1,00 nghĩa
không có khả năng buộc tội sai cho một nghi phạm nào đó khi có hai hồ sơ DNA ging nhau.
CPE = 1 - (1 - PE1)×(1 - PE2)×(1 - PE3)…(1 - PEn)
(10)
Trong đó: PEi là kh năng loại tr ca tng locus trong bng tn sut
- Ch s kết hp kh năng phân biệt (Power of discrimination - CPD) ch s quan trọng để
đánh giá giá tr s dng ca tng locus DNA trong bng tn sut được tính.
CPD = 1 - (1 - PD1)×(1 - PD2) × (1 - PD3) ×… × (1 - PDn)
(11)
Trong đó: PDi là kh năng phân biệt ca tng locus trong bng tn sut
- Ch s kết hợp xác định quan h huyết thng đặc trưng (Combined Paternity index - CPI): là
ch s kết hp giá tr PI ca toàn b các locus được phân tích, phn ánh kh năng gấp bao nhiêu
ln th đang được phân tích là người cha (m) sinh hc so vi mt th được la chn ngu
nhiên trong cùng qun th. CPI = PI1 × PI2 × PI3 ×…× PIn (12)
3. Kết qu và bàn lun
Sau khi điện di kết qu thu được các alen ca tng locus, chúng tôi so sánh vi các alen trong
thang alen chuẩn [10] để xác định các alen đc bit đặc trưng, đồng thi tiến hành tính toán các
ch s đánh giá độ đa hình và xác suất thng kê (tn sut alen, các ch s H(ob), H(ex), PIC, PD, PE,
PI) đặc trưng cho quần th mu nghiên cu.
3.1. Bng tn sut các alen ca 21 locus STR trong qun th nghiên cu
Kết qu phân tích 250 h kiểu gen STR ca 250 th người Kinh Vit Nam, cho thy
tng s 10.500 alen (không k các alen ca locus trên các nhim sc th gii tính), gm 62 loi
alen (t 6 đến 35.2). Kết qu được th hin Bng 1.
Bng 1. Tn sut alen (%) ca 21 locus trong qun th nghiên cu (N = 250) (1)
1.) Locus D3S1358
5.) Locus TPOX
11.) Locus TH01
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
14
4.0
17
25.0
7
0.2*
10
4.0
6
13.8
9
38.8**
15
31.0
18
5.0
8
55.4**
11
27.4
7
28.4
9.3
4.2*
16
34.0**
19
1.0*
9
10.8
12
2.2
8
5.8
10
9.0
3.) Locus D16S539
13.) Locus D22S1045
14.) Locus D5S818
Alen
Tn suất
Alen
Tn suất
Alen
Tn sut
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
8
0.4
11.2
0.2*
11
15.6
15
31.8**
7
2.4
12
22.6
9
24.6
12
24.8**
12
2.8
16
19.0
9
5.2
13
14.8
10
10.4
13
10.2
13
0.4*
17
24.0
10
23.8
14
0.6
11
28.0
14
1.4
14
6.4
18
2.6
11
30.4**
16
0.2*
15.) Locus D13S317
2.) Locus vWA
4.) Locus CSF1PO
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
TNU Journal of Science and Technology
230(05): 353 - 360
http://jst.tnu.edu.vn 357 Email: jst@tnu.edu.vn
(Ghi chú: *: tn sut alen thp nht **: tn sut alen cao nht)
3.2. Đặc điểm các alen ca 21 locus STR so vi thang alen chun trong qun th nghiên cu
Theo Bảng 1, các locus các alen tần suất xuất hiện cao nhất là: locus D16S539 vi hai
alen tn sut xut hiện tương ng alen 9 alen 12 (24,6% 24,8%); locus D8S1179
alen 14 và alen 15 có tn sut xut hin cao nhất (tương ng là 16,0% và 15,6%); D21S11 có alen
30 tn sut là 24,6%; alen 15 locus D18S51 là alen có tn sut cao nht là 24,6%; D2S1338 tn
sut xut hin cao nht alen 11 là 24,8%; locus D19S433 có alen s 13 14 hai alen tn
sut xut hin cao nhất đều lần lượt 22,8% 27,4%; alen 22 locus FGA tn sut xut
hin cao nht là 17,8%; locus D22S1045 hai alen 16 17 trong qun th nghiên cu xut
7
0.2*
11
23.0
14
28.2**
18
22.0
7
0.8
12
36.8**
8
31.0**
12
12.2
15
1.6
19
11.2
9
2.6
12.1
0.6*
9
13.4
13
3.2
15.2
0.2*
20
2.0
10
19.0
13
7.8
10
16.2
14
0.8
16
14.8
21
0.2*
11
30.6
14
1.8
17
19.8
16.) Locus D7S820
18.) Locus D10S1248
20.) Locus D12S391
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
7 7
0.8
11
36.0**
10
0.2*
15
24.4
15
1.8*
21
13.4
8
16.8
12
20.4
11
0.2*
16
9.6
17
9.6
22
10.4
9
6.2
13
2.4
12
7.0
17
1.4
18
16.0
23
10.2
9.1
1.0
14
0.2*
13
36.2**
18
0.4
19
18.2
24
1.8*
10
16.2
14
20.6
20
18.6**
6.) Locus D8S1179
9.) Locus D2S441
21.) Locus D2S1338
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
8
0.4
13.3
0.4
9
1.0
12
14.6
16
2.2
22
4.2
10
14.6
14
16.0**
9.1
1.8
12.3
0.2*
17
10.6
23
16.8
11
13.8
15
15.6
10
19.2
13
2.6
18
7.4
24
15.4
12
12.8
16
9.6
10.1
0.2*
13.1
0.2
19
19.6**
25
6.4
12.3
0.2*
17
0.8
11
24.8**
14
16.4
20
12.2
26
0.2*
13
15.4
18
0.4
11.3
17.8
15
1.2
21
5.0
7.) Locus D21S11
8.) Locus D18S51
10.) Locus D19S433
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
26
0.2*
31.2
9.0
10
0.2*
18
4.8
9
0.2*
14.2
10.0
28
4.8
32
3.4
11
0.4
19
4.0
10
0
15
8.6
29
24.2
32.2
17.2
12
5.4
20
2.4
11
0.2*
15.2
16.8
30
24.6**
33
1.0
13
14.6
21
1.2
12
3.4
16
0.4
30.2
1.6
33.2
6.0
14
18.8
22
1.6
12.2
0.6
16.2
4.0
30.3
0.2*
34.2
1.2
15
24.6**
23
0.2*
13
22.8
17
0
31
6.6
16
12.8
24
0.4
13.2
5.2
17.2
0.2*
17
8.4
25
0.2*
14
27.4**
18.2
0.2*
12.) Locus FGA
17.) Locus SE33
19.) Locus D1S1656
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
Alen
Tn suất
13
0.2*
23.2
1.8
8
0.2*
22.2
2.6
10
0.2*
16.3
0.8
16
0.6
24
13.8
11
0.2*
23
0.4
11
6.8
17
5.6
18
1.8
24.2
3.6
12
0.4
23.2
5.8
12
4.8
17.3
7.4
19
10.2
25
11.6
13.2
0.2*
24
0.2*
13
7.6
18
2.4
20
6.0
25.2
0.8
14
0.2*
24.2
7.0
14
8.2
18.3
1.2
20.2
0.2*
26
3.2
14.2
0.6
25.2
7.6
15
31.6**
19
1.2
21
12.2
26.2
0.4
15
1.2
26.2
9.2**
15.3
0.6
19.3
0.2*
21.2
1.4
27
0.6
16
2.4
27.2
7.0
16
21.4
22
17.8**
28
0.2*
17
3.2
28.2
7.8
22.2
1.2
29
0.2*
18
5.2
29.2
8.6
23
12.2
19
6.6
30.2
4.4
20
5.0
31.2
4.8
20.2
0.6
32.2
1.8
21
2.2
33.2
0.4
21.2
1.6
35.2
0.2*
22
2.4