Tp chí Khoa hc công ngh Giao thông vn ti Tp 13 - S 5
40
D báo cường độ chu nén ca bê tông s dng ct liu
tái chế bng các mô hình hc máy
Predicting the compressive strength of recycled
aggregate concrete using machine learning models
Nguyn Tun Anh1,*, Lê Minh Cường2
1Nhóm nghiên cu D liu ln cho k thuật xanh & Cơ s H tng (BRIGDE), Trường Đại hc Giao thông
vn ti Thành ph H Chí Minh
2Trường Đại hc Giao thông vn ti
Ngày nhn bài: 13/8/2024; Ngày chp nhận đăng: 15/9/2024
Tóm tt:
Bài báo nghiên cu d báo cường độ chu nén ca tông tái chế ct liu (RAC) bng cách s dng các
mô hình hc máy bao gm mô hình hi quy ký t (SR) và XGBoost. B d liu gm 1047 mu thí nghim
được thu thp t 40 nghiên cu thc nghim đã được công b, giúp d báo chính xác cường độ chu nén
da trên các thông s như lượng xi măng, nước, ct liu mn, và ct liu tái chế. Kết qu cho thy mô hình
XGBoost đạt độ chính xác cao vi giá tr MAE = 4.65 MPa và RMSE = 7.61 MPa. Bài báo cũng phân tích
s ảnh hưởng ca các thông s này đến cường độ chu nén bằng phương pháp SHAP, từ đó, nhn mnh
tm quan trng ca vic hiu rõ mối tương quan giữa các biến để tối ưu hóa thiết kế bê tông tái chế.
T khóa: Hi qui kí t; Hc máy; Bê tông tái chế; Mô hình XGBoost.
Abstract:
This paper investigates the compressive strength of recycled aggregate concrete (RAC) using machine
learning models, specifically the Symbolic Regression (SR) and XGBoost models. The dataset consists of
1,047 experimental samples collected from 40 published studies, allowing for accurate prediction of
compressive strength based on parameters such as cement content, water, fine aggregates, and recycled
aggregates. The results show that the XGBoost model achieved high accuracy with an MAE of 4.65 MPa
and an RMSE of 7.61 MPa. The paper also analyzes the influence of these parameters on compressive
strength using the SHAP method, emphasizing the importance of understanding the correlations between
variables to optimize recycled concrete design.
Keywords: Symbolic regression; Machine learning; Recycle aggregate concrete; XGBoost model.
1. Gii thiu
ờng độ chịu nén được xem mt thông s
quan trng trong k thut kết cu vt liu xây
dng. hoạt động như một thước đo bản
v kh năng của mt vt liu chu lc nén dc
trc. C th hơn, cường độ chịu nén xác đnh
ng sut dc trc tối đa khi mt vt liệu, thường
tông, th chịu đựng, không b phá hy
[1], [2], [3], [4]. Đặc tính nàyý nghĩa rất ln
trong vic thiết kế xây dựng công trình như
tòa nhà, cầu, đp, các d án h tng khác.
Vic hiu biết toàn din v ờng độ chu nén
điều không th thiếu đối vi các k kiến
trúc sư, vì nó ảnh hưởng trc tiếp đến tính toàn
vn an toàn kết cu. Các yếu t như thành
phn ca hn hợp tông, điều kin bảo dưỡng,
yếu t môi trường ảnh hưởng lớn đến
ờng độ chu nén. Vì vy, các nhà nghiên cu
quan tâm rt lớn đến nhng phương pháp dự
đoán trong lĩnh vực này. Những m gần đây,
các k thut tiên tiến như học máy, phân tích
phn t hu hn và th nghim không phá hy
Nguyn Tun Anh, Lê Minh Cường
41
đã được nghiên cu phát trin, tt c đều
nhm mc đích tăng cường độ chính xác trong
d đoán cường độ chịu nén. Hơn nữa, s phát
trin ca công ngh tông, bao gm vic kết
hp các vt liệu xi măng các cốt liu thay
thế, đã mang lại mt k nguyên mi hướng đến
s bn vng cho ngành y dng. Đáng chú ý,
nhng ci tiến này không làm gim cường độ
chu nén; trong nhiều trường hp, còn mang
tính ci thin [5], [6], [7]. V bản, vic
nghiên cứu cường độ chịu nén chìa khóa để
đảm bảo độ bền độ tin cy ca các công trình
xây dng. S tiến b không ngng ca nghiên
cứu đổi mới trong lĩnh vực này đang tái định
tương lai của vt liu thc tin xây dng,
đảm bo rng chúng phù hp vi nhu cu ca
ngành xây dựng đang không ngng phát trin,
đồng thi cân nhắc đến tính bn vng môi
trường [8], [9], [10].
S m rng không ngng ca ngành y
dựng đòi hỏi một lượng ln ct liu, ch yếu
được s dng trong sn xut tông. Trái li,
vic phá d các công trình tạo ra một lượng
ln tông thi, gây ra các vấn đ môi trường
nghiêm trọng như cạn kiệt đất. Vấn đ này đã
thúc đẩy vic khám phá tái chế tái s dng
tông b phá d như một gii pháp thay thế
thân thin với môi trường cho các ct liu
nguyên khai không th tái to [11], [12], [13].
Vic s dng ct liu tông tái chế (RCA),
được to ra t nghin nát bê tông b phá dỡ, đã
nổi lên như một gii pháp ha hn, có kh năng
ci thin tính bn vng ca tài nguyên t nhiên,
đồng thi, gim thiểu tác động tiêu cực đến môi
trường. Tuy nhiên, cn phi tha nhn rng
RCA các thuc tính khác so vi ct liu t
nhiên (NA). Nhng khác bit này ch yếu phát
sinh do độ xốp cao hơn khả năng hấp th
nước ca RCA so vi NA [14], [15], [16]. Mt
thuộc tính học quan trng trong ngành công
nghiệp bê tông đun đàn hồi, đo lường s
biến dng ca vt liu, đặc biệt đáng cý.
RAC thường có giá tr đun đàn hồi thấp hơn
so vi ct liu t nhiên (NAC) được hình thành
vi t l nước/xi măng (w/c) tương đương.
Nhiu nhà nghiên cứu đã đề xuất các phương
trình nhm liên h đun đàn hồi ca tông
vi các thuộc tính khác như cường độ chu nén.
Tuy nhiên, cn phi tha nhn rng nhng
phương trình này chủ yếu da trên d liu thc
nghim thu thp t NAC, dẫn đến nghi ng v
tính kh dng của chúng đối vi RAC.
Các nhà khoa học máy tính đã nghiên cứu để
vượt qua thách thc này bng cách to ra các
thut toán la chn da trên các hình d
liu. Nhng thut toán này kh năng phát
hin các biến độc lp quan trng nht, nhanh
chóng gim s ng tham s đầu vào và t đó,
tăng cường hiu quả. Xu hướng đi lên này nhấn
mnh s ni bt liên tc ca các hình hc
máy (ML), được đánh giá cao vì khả năng tạo
ra các d đoán chính xác gần ging vi các quan
sát thc nghim. Trong mt k nguyên được
đánh dấu bi s phát trin không ngng ca
công ngh, nhng công c da trên d liu này
đang cách mạng hóa kh năng dự đoán cường
độ chu nén ca RAC, cung cp nhng hiu biết
cn thiết v hành vi ca vt liu xây dng thân
thin này vi môi trưng. Nghiên cu này góp
phn cho thy s ci thiện độ chính xác ca các
d đoán liên quan đến s phát triển cường độ
chu nén trong RAC bng mô hình hi quy kí t
(SR) và mô hình XGBoost. Mt b d liu toàn
din v ờng độ chu nén ca RAC đưc y
dng. Phân tích so sánh toàn diện đưc thc
hin cn thận để chng minh s t tri ca
so với các phương pháp tối ưu a thông
thường. Các ch s thng uy tín, bao gm R2,
RMSE MSE, được s dng với độ chính xác
cao để đánh giá hiệu sut ca các hình hc
máy được tích hp trong nghiên cu này.
2. D liu
B d liu bao gm 1047 mu thí nghiệm được
thu thp t 40 nghiên cu thc nghiệm đã được
công bố. Để tăng cường hiu qu phân tích, tp
d liệu được chia thành ba tp con riêng bit:
tp hun luyn (70%), tp xác thc (15%),
tp kim tra (15%). Để thu đưc tp d liu này,
vic tin x cn thiết để nâng cao cht
D báo cường độ chu nén ca bê tông s dng ct liu tái chế bng các mô hình hc máy
42
ng ca tp d liu thu thập được. Thc tế,
các mẫu được đo nhiều kích thước và hình
dng khác nhau, d, mu hình khi kích
thước 100 x 100 x 100 mm3 đưc xem xét bi
Limbachiya [17]; trong khi mu hình khi
kích thước lớn hơn 150 x 150 x 150 mm3 được
đo bởi Abdelhady [18]. Ngoài ra, Somna [19]
cung cp d liu thc nghim ca mu hình tr
đường kính 100 mm chiu cao 200 mm.
Các mu hình tr với kích thước lớn hơn 150 x
300 mm cũng được xem t bi nhiu tác gi
khác như trong [20], [21], [22], [23], [24].
Bng 1. Các ch s thng kê ca tp d liu.
Loi
Tên
Loi
Đơn vị
Trung bình
Độ lch chun
min
max
Tui
Age
Đầu vào
ngày
40.41
60.83
1.0
365.0
Xi măng
Cement
Đầu vào
kg/m3
402
75.61
210.0
560.0
c
Water
Đầu vào
kg/m3
169.25
28.75
62.226
235.6
C liu mn
FNA
Đầu vào
kg/m3
607.63
244.18
0.0
1010.0
Ct liu thô
CNA
Đầu vào
kg/m3
484.42
477.55
0.0
1426.3
Ct liu tái chế
RA
Đầu vào
kg/m3
660.24
517.72
0.0
1797.7
ờng độ
CS
Mc tiêu
MPa
47.38
20.753
3.913
117.0
Hình 1. Biểu đồ phân phi ca các thuc tính.
Nguyn Tun Anh, Lê Minh Cường
43
Các đặc trưng quan trọng đối vi vic d báo
ờng độ ca RAC bao gm 06 ch s lần lượt
tuổi (Age), xi măng (Cement), nước (Ef
Water), ct liu mn t nhiên (FNA), ct liu
thô t nhiên (CNA), ct liu tái chế (RA). Trong
đó, lượng xi măng s dng nm trong khong
210 đến 560 kg/m3, có giá tr trung bình 402 và
độ lch chun 75.61.
ớc đại diện cho lượng nước trong hn hp
tông, dao động t 62.3 đến 235.6. Giá tr
trung bình 169 và độ lch chun 28.75. Giá
tr thấp hơn chỉ ra hàm lượng nước gim,
thường dẫn đến bê tông có cường độ cao hơn.
Giá tr ct liu thô t nhiên (CNA) dao động
t 0 đến 1426.3, vi giá tr trung bình là 484.42
và độ lch chun là 477.55. CNA ảnh hưởng
đáng kể đến các đc tính kết cu ca tông.
Ct liu mn t nhiên (FNA) biu din khi
ng ca ct liu mn khi chế to tông, vi
giá tr dao động t 0.00 đến 1010. Trung bình
607.63, độ lch chuẩn 244.18. Lượng ct
liu mn này ảnh hưởng lớn đến tính thi công
độ bn lâu dài ca bê tông. ng ct liu tái
chế (RA) được s dng nm trong khoảng 0 đến
1797 kg/m3giá tr trung bình 660 và độ lch
chun 517.72.
Các ch s thng chi tiết ca những đặc
trưng đầu vào được biu din trong Bng 1. Mi
quan h gia các giá tr đầu vào và giá tr đầu ra
được th hin trong Hình 1.
3. Các mô hình hc máy
3.1. Mô hình hi quy kí t
Hi quy t (Symbolic Regression - SR) là
một phương pháp thng kh năng phát
hin các mi quan h phi tuyến và đa biến gia
các biến trong tp d liu. to ra mt
phương trình dạng khép kín th hin ánh x hàm
s của các tương quan, cho phép dự đoán giá trị
ca biến mc tiêu da trên các giá tr ca các
biến khác. SR s dng các hàm toán hc và các
phép toán như cộng, tr, nhân, chia, logarit,
hàm đ xây dựng phương trình biu din
mối tương quan giữa các biến đầu vào biến
mc tiêu. Hi quy biểu tượng khác vi các k
thut hồi quy thông thường ch trong hi quy
truyn thng, cu trúc của phương trình phi
được xác định trước duy trì c định trong quá
trình hi quy. Tuy nhiên, SR th phát hin
mt cấu trúc phương trình phù hp tối ưu hóa
các hng s s hc cùng lúc. Nói chung, SR
không yêu cu kiến thức trước v cu trúc
hình hay m s. Cách tiếp cận này khá đơn
gin cho những ngưi dùng không chuyên v
các phương pháp da trên máy tính s dng.
Ngoài ra, công thức được xác định th d
dàng chuyn giao trin khai trong các h
thng phn mm khác.
Koza [25] đã gii thiu lp trình di truyn
(Genetic Programming - GP), mt thut toán
tiến hóa để tìm kiếm các chương trình giải quyết
mt vấn đề không cn lp trình c th như hồi
quy t. Thuyết Tiến hóa của Darwin đã
truyn cm hng cho t v GP như một
phương pháp tiến hóa cho lp trình t động.
Bng ch mô phng quá trình chn lc t
nhiên, mt qun th các th (trong hi quy
biểu ng là c hàm toán hc phép toán)
được chn lc. Vi vic liên tc chn các cá th
có chất lượng cao và tái kết hợp chúng để gim
thiu sai s trong biến mc tiêu tối ưu a. GP
mt dạng đơn gin hóa ca thut toán di
truyền và khi được thc hin, phát trin các quy
trình để gii quyết vn đề. Không giống như các
thut toán di truyn, GP cho phép lp trình vi
độ dài biến đổi, chng hạn như, các y biu
thc biểu tượng. Hi quy t, vn mt
nhim v đơn giản hơn cho GP so vi lp trình
t động toàn din, ch xác định mt biu thc
duy nht. Do đó, các toán tử hàm toán hc
thường được phép xut hin các nút bên trong
ca cây biu thc. Tp hp các hiu cui
cùng bao gm mt s tham s ca tp d liu
hun luyện cũng như các hng s. Kết qu là,
khi SR được thc hin bằng GP, chương trình
kết qu mt biu thc toán hc dng khép kín
th hin mt mô hình thng kê.
GP s dng quá trình lp lại để phát trin các
mô hình hi quy biu tượng. Mt qun th ban
D báo cưng đ chu nén ca bê tông s dng ct liu tái chế bng các mô hình hc máy
44
đầu được hình thành bng cách tạo và đánh giá
mt tp hp các biu thc ngu nhiên. Nhng
biu thc kh năng dự đoán chính xác hơn
biến mục tiêu được xem là phù hp. Thông qua
quá trình thc hin GP, các biu thc mới được
to ra bằng cách thường xuyên chn lc tái
kết hp các biu thức cũ, trải qua nhng đột
biến ngu nhiên. Nhng biu thc th hng
cao hơn kh năng được chn nhiều hơn
th được chn nhiu ln. Các biu thc mi
tạo ra được đánh giá hợp nht vi qun th
hin tại để to ra mt qun th mi. Nhng biu
thức độ phù hp kém nht b loi b trong
bước này. Quá trình này thường kết thúc khi
tiêu chí kết thúc vòng lp được đáp ứng, thường
khi đạt đến s thế h tối đa. SR sử dng GP
tương thích với các tp d liu cha hàng triu
quan sát và hàng chc biến.
3.2. Mô hình eXtreme Gradient Boosting
Chen Guestrin [26] đã giới thiu mt thut
toán được phát trin da trên hình cây quyết
định gii thut eXtreme Gradient Boosting
(XGB). Gii thut này d đoán kết qu da trên
các d liệu đầu vào như sau:
0
1()
M
i i t i
k
y y f X

(1)
Trong đó,
_o
yi
kết qu d báo cho mu th
i véc đặc trưng là Xi; M là s ng b ước
tính mi b ước tính ft (vi k trong phm vi
t 1 đến M) tương ng vi mt cấu trúc cây độc
lp;
0
i
y
giá tr trung bình ban đầu ca giá tr
đo được trong tp hun luyn;
tốc độ hc
giúp ci thin hình trong khi thêm cây mi
và tránh khp quá mc (overfitting). Hàm mc
tiêu để gim thiểu bước th k được xác định bi:
2
1
1
2
T
j j j j
j
obj T G H



(2)
Vi, T là s lá cây th kωj j t 1 đến T
trọng lượng ca lá; λ γ các tham s chun
hóa kiểm soát tính đơn giản ca cấu trúc cây để
tránh khp quá mc. Các tham s Gj Hj ln
t tng ca các mẫu được liên kết vi th
j của độ dc th nht th hai ca m mt
mát. y th k được xây dng bng cách tách
các lá bắt đu t một lá. Thay đổi mc tiêu sau
khi thêm phn tách:
2
22
1
2
LR
LR
L R L R
GG
GG
gain H H H H




(3)
Trong đó, GL HL được liên kết vi bên trái,
GR HR được liên kết vi bên phi sau khi
chia tách. Nếu tham s khuếch đại lớn hơn 0 thì
việc tách được chp nhận. Độ chính xác ca
hình được xây dng bi gii thut XGB ph
thuc rt nhiu vào các tham s ca hình
hun luyn.
4. Kết qu
Để đánh giá độ chính xác ca hình, nhóm
nghiên cu s dng 03 thông s thng ln
t là R-squared, Mean Absolute Error (MAE)
và Root Mean Squared Error (RMSE):
2
1
2
1
R-squared 1
n
ii
i
n
ii
i
yy
yy

(4)
2
1
1
RMSE n
ii
iyy
n

(5)
1
1
MAE n
ii
iyy
n

∣∣
(6)
Kết qu của mô hình SR được biu th ti Hình
2 và phương trình (7).
Fc
= 29.0 * (0.003 * Water - 0.77)
* (0.012 * Water 0.656)
* (-0.014*Cement+ (0.21)
* (-0.014*CNA+ 0.0028
* Cement + 0.0026 * RA
* (6.9 - 0.041 * Water)
* (-2.54078) * (0.011 * Cement
- 2.91) + exp((1.06246 0.056
* Age) * (3.0 0.0003 * FNA))
4.0) + 3.3267) + 23.1523
(7)