TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 20 (45) - Thaùng 9/2016<br />
<br />
<br />
<br />
<br />
Những phương pháp tiếp cận<br />
về kỹ thuật giám định ảnh số<br />
<br />
Approaches to techniques of digital image forensics<br />
<br />
han r ng<br />
i n h ng<br />
r ng Đại h c B ch hoa<br />
<br />
Phan Trong Le, BEng.<br />
Le Tien Thuong, Assoc.Prof.,Ph.D.<br />
Ho Chi Minh City University of Technology<br />
<br />
<br />
Tóm t t<br />
Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh<br />
nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hông để lại bất kỳ<br />
dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh<br />
đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng<br />
pháp phát hiện mù từ công trình khởi đầu của Fridrich năm 2003 đ n các công trình mới trong nửa đầu<br />
năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi<br />
kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc<br />
gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau<br />
Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning,<br />
splicing, retouching, ảnh tạo hoàn toàn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích<br />
thành phần chính (PCA), máy vector hỗ trợ (SVM).<br />
Abstract<br />
A digital image can be visually changed with ease by using certain editing software. A foundation on<br />
which we are relying is the assumption that although digital forgeries may leave no visual evidences<br />
indicating the tampering, they may have altered the statistical properties of pixel values in the image. This<br />
paper is a literature review on digital image forgery detection focusing on blind detection approach, from<br />
the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the<br />
proposed methods are well classified into categories and analyzed with comments and citations. This work<br />
also indicates the vital challenges and criteria of performance evaluation to the detection of forgery<br />
images, which are considered as the basis of comparison between different methods.<br />
Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching<br />
image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete<br />
wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM).<br />
<br />
<br />
<br />
<br />
3<br />
1. ặt v v k thu t nh detection). Với trạng thái bị động về nguồn<br />
nh s tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh<br />
Nhi p ảnh dần trở thành lĩnh vực phổ đang có mà ta phải x c định liệu ảnh này có<br />
bi n trong cuộc sống con ng i từ những thật hay bị chỉnh sửa gì hay không. Với sự<br />
năm hởi đầu ở th kỷ XIX. Dù ở mức độ quan sát về bản chất rằng: mặc dù ảnh giả<br />
chuyên nghiệp hay nghiệp d , ai cũng có có thể hông để lại dấu v t trực quan cho<br />
thể d dàng tạo đ ợc một bức ảnh kỹ thuật mắt trần của con ng i nhận bi t dấu hiệu<br />
số (từ đây, g i tắt là ảnh) bằng camera trên chỉnh sửa, nh ng ảnh đó có thể đã bị thay<br />
điện thoại hoặc máy ảnh, sau đó chỉnh sửa đổi về mặt số liệu thống kê ở mức giá trị<br />
ảnh trực ti p tr n điện thoại hoặc chuyên pixel. Các thuộc tính thống kê này có thể<br />
sâu hơn, chỉnh sửa trên máy tính (Personal đ ợc phân tách và trích l c để tạo thành các<br />
Computer) bằng các phần mềm chuyên đặc tr ng giúp nhận bi t sự can thiệp về<br />
dụng. M i chuyện sẽ hông có gì đ ng nói chỉnh sửa ảnh. Hình 2 cho thấy mức độ<br />
n u nh m i bức ảnh đều đ ợc sử dụng quan tâm trong lĩnh vực gi m định ảnh<br />
đúng với mục đích và chức năng của nó: thông qua số l ợng bài báo công bố giai<br />
truyền tải cho ng i nhìn thông tin ghi đoạn 2004 – 2013.<br />
nhận lại trong th giới thực. Vấn đề nảy<br />
sinh khi một ng i dùng ảnh đã chỉnh sửa<br />
nh là một công cụ để khi n cho ng i xem<br />
tin vào thông điệp mà ng i đó muốn<br />
truyền tải. Hiện t ợng này dẫn tới nhu cầu<br />
sử dụng giải pháp khoa h c để gi m định<br />
tính chân thực trong nội dung hiển thị của<br />
ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng<br />
trong truyền thông.<br />
hông th ng, để bảo vệ tác quyền ảnh a) b)<br />
và xác thực nguồn gốc, kỹ thuật Hình 1: Ảnh ch p c u tổng th ng Pháp<br />
watermar ing hay signature đ ợc áp dụng z p gi i Tour de<br />
vào trong ảnh. Từ đó, n u nội dung ảnh bị France: nh g c (a) và nh ch nh s a (b).<br />
chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh [T p chí Le Parisien, 07/2015.<br />
(vốn đ ợc xem là thông điệp nhận dạng www.fourandsix.com]<br />
mang tính bí mật) sẽ bị thay đổi. Việc xác<br />
thực ảnh đ ợc thực hiện bằng cách trích<br />
xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra<br />
mã này có t ơng ứng với mã mà ng i giữ<br />
bản gốc đang sở hữu hay hông Đây là<br />
c ch gi m định chủ động (active), khi mà<br />
ảnh gốc và ảnh giả đều sẵn có, hiện hữu.<br />
Mặt h c, th ng bức ảnh nhận đ ợc Hình 2: S bài báo khoa h c IEEE và<br />
hông đi èm với bất cứ thông tin bi t c nh<br />
tr ớc nào Điều này dẫn tới c ch gi m định nh s n 2004 - 2013. [23]<br />
bị động (passive) hoặc phát hiện mù (blind Phần còn lại của bài vi t có bố cục nh<br />
<br />
4<br />
sau: mục II. trình bày các loại ảnh giả, mục p dụng cho loại ảnh giả này để tăng c ng<br />
III. và IV. phân loại các giải ph p gi m định hay giảm bỏ c c chi ti t gốc. ột ví dụ<br />
theo h ớng Active và Passive, mục V. và VI. đ ợc cho ở hình 5.<br />
lần l ợt là các thách thức và ti u chí đ nh gi<br />
khi thực hiện gi m định ảnh, cuối cùng là<br />
thảo luận và k t luận ở mục VII. và VIII.<br />
2. Phân lo i nh gi<br />
A. Cloning<br />
Một phần của ảnh đ ợc sao chép và<br />
dán (clone) vào một nơi h c của cùng một<br />
ảnh ban đầu với mục đích là để che giấu<br />
hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển a) b)<br />
hình đ ợc cho ở hình 3. Hình 5: Ả<br />
a) b): ú<br />
ổ ê<br />
ặ [35]<br />
D. Computer-Generated Imagery (CGI)<br />
Thay vì làm giả một phần, một bức ảnh<br />
có thể đ ợc làm giả hoàn toàn (không chụp<br />
a) b)<br />
bằng camera) nh các công cụ đồ h a trên<br />
Hình 3: Ví d nh cloning. Ảnh g c (a)<br />
máy tính. Một ví dụ đ ợc cho ở hình 6.<br />
và nh gi (b) v i vùng nh hai con mèo<br />
. [2]<br />
B. Splicing<br />
ỹ thuật này giống cloning, ngoại trừ<br />
việc vùng ảnh sao chép đ ợc lấy từ nguồn<br />
ảnh h c b n ngoài Nói cách khác,<br />
splicing là tr ng hợp tổng qu t hơn<br />
cloning. ột ví dụ ảnh splicing đ ợc cho ở<br />
hình 4.<br />
Hình 6: Ví d v nh CGI. Ảnh g c<br />
(n a mặt trái) và nh gi (n a mặt ph i):<br />
h un nh m khác<br />
bi t bằng m ờng. [22]<br />
3. ng ti p c n phát hi n nh gi<br />
- Active<br />
rong ỹ thuật watermar ing, dữ liệu<br />
Hình 4: Ả a, nhúng là thông tin đã đ ợc x c định tr ớc,<br />
b) c). [7] nh là một ảnh biểu t ợng th ơng hiệu<br />
C. Retouching hoặc một đoạn văn bản au hi mã hóa<br />
Nâng cao chất l ợng ảnh (cân bằng thông tin vào ảnh, dữ liệu nhúng có thể<br />
trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc đ ợc hiển thị tr n ảnh, hoặc cũng có thể để<br />
<br />
5<br />
ẩn hoàn toàn, hoặc t hợp cả hai c ch bi n đổi ng ợc để t i tạo lại watermar đã<br />
(hình 7). Việc trích xuất lại watermar dùng. Kỹ thuật watermar ing trải phổ [10]<br />
cũng có hai c ch: giải thuật có dùng thêm đ ợc sử dụng phố bi n và có nhiều thuật<br />
thông tin từ ảnh gốc (non-blind) và không toán mới đ ợc đề xuất ph t triển; đồng<br />
dùng ảnh gốc (blind) rong hi ỹ thuật th i, đây cũng là giải ph p mang tính bền<br />
watermar ing thực hiện nhúng thông tin vững cao<br />
đ ợc ch n tr ớc vào ảnh, thì ỹ thuật Tiwari et al. [34] dùng bi n đổi DW<br />
signature thực hiện lấy đặc tr ng độc nhất hai mức cho ảnh gốc và dữ liệu nhúng<br />
từ ảnh rồi mã hóa thành dạng chữ ý số đ ợc mã hóa DE (Data Encryption<br />
tandard) tr ớc hi t hợp nhúng với ảnh<br />
gốc t quả là watermar chống chịu hiệu<br />
quả với phép nội suy hối nh ng vẫn giữ<br />
đ ợc chất l ợng ảnh ở hệ số chất l ợng QF<br />
lớn hơn 90 Jiansheng et al. [16] t hợp<br />
a) b) DW với D cho ra t quả watermar<br />
Hình 7: a) đ ợc ẩn hoàn toàn, đồng th i chống ch i<br />
(“ ” Africa Studio, đ ợc một số phép xử lý thông dụng nh<br />
www.shutterstock.com) và bán b) l c, tăng c ng sắc nét, nhi u muối ti u,<br />
(“20 0 ©” Klaus Herrmann, nén và cắt ảnh<br />
http://farbspiel-photo.com). Những năm gần đây, c c h ớng<br />
ó hai h ớng ti p cận: nhúng nghi n cứu dựa trên ba loại bi n đổi cơ bản<br />
watermar trong miền hông gian và trong này vẫn đ ợc chú tr ng ph t triển. Pathak<br />
miền tần số Trong miền hông gian, ba ỹ et al. [27] dùng lý thuy t to n huỗi hỗn<br />
thuật chính là Bit tr ng số thấp nhất (LSB) loạn (Chaotic sequence) để trải phổ tín hiệu<br />
[8, 37], ập hối (Patchwork) [3] và ã dự watermar vào c c hệ số DW , giúp giữ<br />
đo n (Predictive coding) [39]. Ba ph ơng nguy n chất l ợng ảnh gốc (cải thiện chỉ số<br />
pháp trên, theo thứ tự t ơng ứng, rất nhạy NR) và tăng tính bền vững đối với c c<br />
với nhi u thay đổi tr n gi trị pixel (từ phép bi n đổi nh phân t n dữ liệu nhúng<br />
nh truyền, phép xử lý hậu ỳ nh xoay, tr n vùng phổ rộng và mang đặc tính giống<br />
dịch và cắt ảnh), bị giới hạn l ợng thông nhi u (hình 8). Hu et al. [14] tăng c ng<br />
tin nhúng và ém về mặt giữ nguy n chất hả năng chống chịu tấn công nén J E và<br />
l ợng ảnh, n n watermar miền tần số thay đổi nhi u bằng c ch điều ch gi trị<br />
đ ợc quan tâm xem xét nhiều hơn nh trung bình của hệ số D đổi dấu một<br />
hắc phục đ ợc c c y u điểm này. phần ( A) có ph ơng sai điều chỉnh theo<br />
Trong miền tần số, ba phép bi n đổi bảng l ợng tử J E hoặc chỉ số bi n dạng<br />
chính là Wavelet r i rạc - DWT, osine r i đ ng chú ý (JND) của mô hình ệ thống<br />
rạc - DCT và Fourier r i rạc - DFT. Bức thị gi c con ng i ( V ) Su et al. [32]<br />
ảnh đ ợc biểu di n d ới dạng tần số, vốn dùng phép bi n đổi mới hơn là ontourlet,<br />
là đặc tính của tín hiệu nói chung, thông t hợp phép phân tích essenberg để<br />
qua c c hệ số của miền bi n đổi. Thông tin nhúng watermar trong ảnh màu, t quả<br />
mã nhúng đ ợc lồng vào c c hệ số này và đạt tính vô hình cao hơn và hả năng<br />
hi ti n hành x c minh, ta thực hiện phép chống ch i tốt hơn từ c c cuộc tấn công về<br />
<br />
6<br />
nén J E , l c tích chập và nhi u cộng còn đề xuất ph ơng ph p tối u hơn là<br />
Robust Match bằng cách dùng hệ số DCT<br />
thay vì giá trị pixel cho b ớc so sánh khối.<br />
h ơng ph p này cho hiệu quả cao hơn<br />
nh ng vẫn còn vài giới hạn về độ tin cậy.<br />
Ngoài ra, ph ơng ph p này cũng hông bền<br />
vững tr ớc các phép bi n đổi tuy n tính.<br />
Hình 8: w Bảng 1 thống kê k t quả đạt đ ợc<br />
W [40]. t ơng ứng với các loại đặc tr ng khác nhau,<br />
)Ả ú )Ả thay vì dùng mức xám hay hệ số D nh<br />
w )Ả w đã phân tích ở đoạn tr ớc. Công trình tiêu<br />
. biểu gần đây trong nhóm kỹ thuật này là<br />
4. ng ti p c n phát hi n nh gi Kaur và Walia [24] với việc sử dụng ớc<br />
- Passive l ợng nhi u và đặc tr ng về độ dốc có định<br />
Hầu h t các kỹ thuật mù phát hiện ảnh h ớng biểu đồ tần suất ( O ) h ơng<br />
giả đều có thể phân loại thành năm nhóm: pháp này có khả năng đồng th i phát hiện<br />
dựa vào pixel, định dạng, máy ảnh và độ r i và định vị vùng ảnh giả. K t quả (hình 9)<br />
sáng (từ mục A. đ n D.). Ngoài ra, có một đ ợc thử nghiệm trên tập dữ liệu CASIA.<br />
cách phân nhóm khác dựa trên loại đặc<br />
tr ng [30], n n năm nhóm trên có thể sắp<br />
x p lại thành hai nhóm lớn: dựa trên khối<br />
pixel và keypoint.<br />
A. Dựa vào pixel<br />
Các khối pixel, vốn là cơ sở hình thành a) Ảnh gốc b) Ảnh giả<br />
nên ảnh số, đ ợc chú tr ng khảo s t để tìm Hình 9: Phát hi nh v vùng nh<br />
sự h c th ng trong thống kê ở mức giá trị gi trong hình b) dùng k<br />
pixel, từ đó t luận về dấu v t chỉnh sửa thu Ư ng nhi ặ<br />
của vùng ảnh giả. Trong công trình khởi HOG [18].<br />
đầu h ớng nghiên cứu gi m định ảnh, B. Dự và định dạng ảnh<br />
Fridrich et al. [11] đề xuất ph ơng ph p r ớc khi bị làm giả, ảnh đ ợc mở<br />
Exhausive Search cho ảnh cloning bằng bằng phần mềm chỉnh sửa au đó, ảnh<br />
cách tìm hai vùng chứa giá trị pixel giống đ ợc l u mới và qua thêm một lần nén ảnh<br />
nhau Đây là ph ơng ph p rất cơ bản và (ví dụ định dạng J E ) Để tận dụng tính<br />
đơn giản nh ng hông đủ để dùng giám chất nén không bảo toàn JPEG, có ba<br />
định ảnh giả thực t , đồng th i lại cần khối ph ơng ph p đ ợc đề xuất:<br />
l ợng tính toán lớn au đó, công trình này 1. Lượng tử JPEG<br />
<br />
<br />
<br />
<br />
7<br />
B ng 1: So sánh k t qu n nh cloning [23]<br />
h ơng ph p Đặc tr ng Bộ phân lớp Độ chính xác<br />
Popescu và PCA ắp x p theo thứ tự t n 100% hối pixel 16x16<br />
(lexicographic)<br />
Farid [28] 50% hối pixel nhỏ hơn<br />
Gopi et al.[13] ệ số tự hồi quy ạng nơron nhân tạo 94.83%<br />
Lin et al. [19] ng độ s ng trung ắp x p theo cơ số và 98%<br />
bình của hối pixel tính vector dịch<br />
Bashar et al. [1] DWT và KPCA huật to n ph t hiện 95.55% (DWT)<br />
nhân bản dựa theo điểm<br />
90.94% (KCPA)<br />
Thajeel và Sulong [33] CR LBP ắp x p theo thứ tự t n > 91% (với phép xoay<br />
và phép xoay t hợp<br />
với phép bi n đổi khác)<br />
Isaac và Wilscy [15] Gabor Wavelet và SVD 99% tr n tập dữ liệu<br />
l ợng tử pha cục bộ CASIA v1.0 và tập màu<br />
(LPQ) DVMM<br />
Kaur và Walia [18] Ước l ợng nhi u Phân nhóm k-Means và ~70% cho tập dữ liệu<br />
dựa tr n A và đặc SVM CASIA v1.0 và v2.0<br />
tr ng O<br />
<br />
Khi nén, mỗi hệ số DCT c đ ợc l ợng 3. Nhiễu khối JPEG<br />
tử với hệ số q: c/q. Việc lựa ch n giá trị q Phát hiện ảnh giả dựa trên sự bất đồng<br />
khác nhau cho ra bảng l ợng tử khác nhau; nhất trong nhi u khối. Giải pháp là tìm ma<br />
do đó, một dạng chữ ý độc nhất về l ợng trận nhi u khối và quan sát phân lớp mẫu.<br />
tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra. Ảnh giả qua nhiều lần nén sẽ gây nhi u<br />
2. Nén JPEG hơn một lần trong hai quan sát này.<br />
Phát hiện ảnh giả dựa trên hiện diện Lin và Tsay [21] dùng bộ ớc l ợng<br />
của nhi u (artifact) khi có nhiều hơn một ích th ớc khối nhi u (áp dụng kỹ thuật lấy<br />
lần nén ảnh. Giải pháp là phân tích tính chu mẫu ngẫu nhiên, bầu ch n và hợp lý cực<br />
kỳ lặp lại của nhi u l ợng tử đôi trong đại - maximum likelihood) và phân tích<br />
histogram sau khi ảnh bị nén từ lần thứ hai tính nhất quán của ích th ớc khối nhi u<br />
(hình 10). JPEG (hình 11), khối cục bộ nào có kích<br />
th ớc khác với ích th ớc khối chính thì<br />
đ ợc xem là vùng ảnh giả.<br />
<br />
<br />
<br />
a) b)<br />
Hình 10: K t qu phân tích nén JPEG và<br />
a) Ảnh splicing. b) K t quả.<br />
nhi ng t (b) t nh gi (a). Xem<br />
Hình 11: Phát hi n nh Splicing dùng k<br />
ngu n nh th t hình 3. [2]<br />
thu Ư ng kh i nhi u [21].<br />
<br />
8<br />
Tóm lại, những kỹ thuật này chỉ có lợi Tuy nhiên, thực t khó sử dụng h ớng<br />
th trên bức ảnh đ ợc l u lại hơn một lần. ti p cận này vì với phát hiện mù, việc bi t<br />
Việc chỉ dùng mỗi thông tin về định dạng tr ớc thông tin về loại cảm bi n hay bản đồ<br />
ảnh hông đủ để xây dựng ph ơng ph p nhi u cho tr ớc, hoặc sở hữu tập ảnh đ ợc<br />
phát hiện ảnh giả bền vững. Ngoài ra, n u chụp từ cùng một cảm bi n thì hoàn toàn<br />
chỉ dùng thông tin nén ảnh thì d dẫn đ n không khả thi.<br />
phát hiện sai, đơn cử là tr ng hợp ảnh gốc D. Dự và cườ g độ rọi sáng và màu<br />
đ ợc phóng to theo thuật toán nội suy hoặc Vì c c phần ảnh giả đ ợc cắt ghép từ<br />
đ ợc làm nhòe, sau đó đ ợc l u lại Nh nhiều nguồn h c nhau n n chúng hông<br />
vậy, mặc dù nội dung ảnh hông thay đổi đảm bảo đ ợc tính nhất qu n của h ớng<br />
nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng nguồn s ng đặt l n đối t ợng Do đó, phân<br />
có trải qua thêm một lần nén. tích sự bất th ng trong hiệu ứng nh s ng<br />
C. Dựa vào máy ảnh đ ợc r i l n c c đối t ợng giúp chỉ ra dấu<br />
Phân tích nhi u đ ợc tạo ra từ một hệ v t của chỉnh sửa ó hai c ch để tận dụng<br />
thống máy ảnh nhất định; từ đó, sự không h ớng ti p cận này: vị trí nguồn s ng và<br />
nhất quán trong nhi u có thể đ ợc dùng để phân lớp màu (ví dụ hình 14). Tuy nhiên,<br />
chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở số l ợng lớn c c đối t ợng trong màu sắc<br />
để áp dụng: h c th ng về màu sắc, Mảng h c nhau dẫn tới sự hó hăn trong việc<br />
l c màu, àm đ p ứng của máy ảnh và ph t hiện tất cả đối t ợng giả cùng một lúc<br />
Nhi u cảm bi n. Do đó, phần lớn công trình nghi n cứu gần<br />
Fridrich et al. [12] sử dụng kỹ thuật đây tập trung vào sử dụng một phần hông<br />
Ước l ợng đ p ứng hông đồng nhất của gian màu để giới hạn loại đối t ợng xem<br />
máy ảnh để tận dụng thông tin từ nhi u của xét, ví dụ nh chỉ xem xét đối t ợng màu<br />
cảm bi n hông tin này đ ợc xem xét nh da ng i [5].<br />
là đặc tr ng nhận dạng (hình 12) cho việc Johnson và Farid [17] đã vận dụng t<br />
phát hiện ảnh đ ợc chụp bởi máy ảnh thật quả nghi n cứu Ước l ợng tự động h ớng<br />
hay từ cùng một máy ảnh hay không. Theo nguồn s ng [25] để đ nh gi mức độ phản<br />
đó, tất cả cảm bi n đều có các thuộc tính xạ cục bộ hoặc toàn cục tr n c c vùng ảnh<br />
t ơng tự cho việc tạo đặc tr ng nhận dạng có t cấu h c nhau (hình 13). Carvalho et<br />
dựa tr n cơ sở rằng chúng đ ợc tạo từ công al. [6] xây dựng mô hình 3 chiều của đối<br />
nghệ sản xuất giống nhau. t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng<br />
h ớng nguồn s ng đ ợc đặt l n đối t ợng<br />
đó uy t quả hông đ ợc đ nh gi tr n<br />
một tập dữ liệu lớn, nh ng từ t quả thí<br />
nghiệm cho thấy ph ơng ph p này hiệu<br />
quả ngay cả với nguồn s ng phức tạp<br />
Mặc dù kỹ thuật phân tích h ớng<br />
nguồn sáng và thông tin màu rất hứa hẹn trở<br />
Hình 12: Phóng to m t ph n nh nhi u thành một công cụ gi m định ảnh hiệu quả,<br />
trên c m bi n Canon G2. Giá tr pixel nh ng trong 5 năm trở lại đây, số l ợng<br />
c chia t l theo d [0 255] quan công trình về h ớng nghiên cứu này vẫn<br />
sát. [12] còn rất ít so với c c h ớng ti p cận khác.<br />
<br />
9<br />
giống nhau, bầu tr i, mảng mây).<br />
Có khả năng hoanh vùng và định<br />
vị vùng ảnh giả.<br />
Loại bỏ các thông tin thừa khi tìm<br />
vùng ảnh giả: ví dụ nh chữ bìa báo<br />
a) b) trong hình 1.<br />
Hình 13: Ảnh giả (a) cho thấy góc ước Các thuật to n có dùng ng ỡng để<br />
lượng hướng ánh sáng cách biệt giữa hai phân loại k t quả th ng ch n giá<br />
người, 123o và 86o. Ảnh thật (b) cho thấy trị ng ỡng cố định và mang tính<br />
góc ước lượng hướng ánh sáng của hai kinh nghiệm. Cần xây dựng hàm lấy<br />
người tương đương nhau, 98o và 93o. [17] ng ỡng thích hợp có khả năng tùy<br />
bi n thích nghi và có mối liên hệ<br />
chặt chẽ với c c đặc tính đang xem<br />
xét của ảnh để tối u điểm lấy<br />
ng ỡng theo hàm mục ti u độ chính<br />
xác cực đại.<br />
Gần đây, Zerni e moments và lựa ch n<br />
bi n đổi tuy n tính t ơng đồng (SATS)<br />
a) b) đ ợc dùng cho phát hiện xoay [31, 9], SIFT<br />
Hình 14: cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ,<br />
sáng (b) ờ nhi u cộng và nhòe [4], SVM cho phát hiện<br />
(a). [5] vùng nhòe [36]. Bi n đổi FMT thì bền vững<br />
đối với xoay, tỉ lệ, nhi u và nhòe với chi<br />
5. Các thách th c nh nh<br />
phí tính toán thấp.<br />
Cần x c định rõ các thách thức sẽ phải<br />
6. ê<br />
đối mặt trong việc phát hiện ảnh giả để l u<br />
Độ chính x c: ỉ lệ số lần ph t hiện<br />
ý các vấn đề cần giải quy t và đặt ra giả<br />
đúng tr n tổng số ảnh giả đầu vào<br />
thuy t phù hợp trong quá trình nghiên cứu:<br />
hi phí tính to n: l ợng tính to n<br />
Giảm tỉ lệ phát hiện sai<br />
cần dùng để cho ra t quả, cần l u<br />
Hoàn toàn tự động (không cần con<br />
ý hi ứng dụng vào hệ thống th i<br />
ng i can thiệp để di n dịch k t quả)<br />
gian thực<br />
Không phụ thuộc vào định dạng<br />
Độ nhạy với c c phép bi n đổi: chỉ<br />
nguồn ảnh (nén ảnh)<br />
ra mức độ t quả bị ảnh h ởng bởi<br />
ăng độ tin cậy và bền vững đối với<br />
c c điều iện thử nghiệm h c nhau.<br />
bi n đổi tuy n tính và phi tuy n.<br />
Không nhạy với thay đổi của nhi u.<br />
Tránh giới hạn số l ợng và kích<br />
ức độ tự động: giảm thiểu can<br />
th ớc của vùng ảnh giả có thể phát<br />
thiệp của con ng i trong việc di n<br />
hiện đ ợc bởi thuật toán.<br />
dịch và đ a ra t luận gi m định.<br />
Tận dụng thông tin màu, thay vì chỉ<br />
Độ chính x c n n là ti u chí hàng đầu,<br />
dùng ảnh xám.<br />
vì đây là t quả cuối cùng ảnh h ởng tới<br />
Tránh phát hiện sai c c đối t ợng thật<br />
quy t định gi m định, nhất là hi liên quan<br />
có tính chất giống nhau hoặc đồng<br />
tới luật pháp, còn các tiêu chí h c có thể<br />
nhất tự nhiên (ví dụ: lốc các hộp sữa<br />
<br />
10<br />
đ nh đổi qua lại Độ nhạy có thể đ ợc giới r i lại, h ớng ti p cận dựa vào m y ảnh<br />
hạn ở một số hía cạnh và ứng dụng để mang tính ém hả thi nhất vì nó y u cầu<br />
ph ơng ph p đề ra có thể đ p ứng tốt một đ ợc bi t một số thông tin có tr ớc từ ảnh<br />
số mục ti u nhất định. hả nghi, điều mà vốn hông thể đạt đ ợc<br />
iệu năng có thể đ ợc biểu di n d ới trong ứng dụng thực t hép bi n đổi nh<br />
dạng thống độ chính x c, độ nhạy và độ D hay F ti p tục là ỹ thuật hiệu quả<br />
ri ng biệt Độ nhạy (Sensitivity) là thông để biểu di n lại ảnh với ích th ớc nhỏ hơn<br />
số đo l ng độ chính x c phân loại đúng (giảm thông tin d thừa) để giảm hối<br />
đối với ảnh giả (tức, ảnh giả đ ợc x p loại l ợng tính to n Ngoài ra, hai tập dữ liệu<br />
là giả), Độ ri ng biệt ( pecificity) đo l ng ảnh th ng dùng phổ bi n trong c c công<br />
độ chính x c phân loại đúng đối với ảnh trình gần đây đ ợc đ nh gi là đủ tốt để<br />
thực (tức, ảnh thực đ ợc x p loại là thực) thử nghiệm và so s nh giữa c c ph ơng<br />
và Độ chính x c (Accuracy) là tỉ lệ phần ph p, đó là o oFoD (từ phòng thí<br />
trăm giữa số ảnh phân loại đúng tr n tổng nghiệm Video ommunications, Đại h c<br />
số ảnh xem xét (tức, ảnh giả đ ợc x p loại Zagreb, roatia) và A IA (từ Viện ự<br />
là giả và ảnh thực đ ợc x p loại là thực), động Nhận dạng ẫu, c việc hoa h c<br />
tính nh (1): Quốc gia, rung Quốc)<br />
TP TN ổng quan, nhiều ph ơng ph p đã<br />
Accuracy 100 (1)<br />
TP TN FN FP đ ợc đề xuất để xử lý c c th ch thức trong<br />
Với: ph t hiện ảnh giả, tuy nhi n chúng vẫn còn<br />
TP (True Positive): số ảnh giả đ ợc nhiều giới hạn về tính ứng dụng thực t<br />
x p đúng là ảnh giả ột phần là vì có đặt tr ớc giới hạn trong<br />
FN (False Negative): số ảnh giả giả thuy t ban đầu, một phần là vì thi u<br />
đ ợc x p sai thành ảnh thực một mô hình chung và chuẩn hóa để hội tụ<br />
FP (False Positive): số ảnh thực c c nh nh nghi n cứu còn đang ri ng lẻ<br />
đ ợc x p sai thành ảnh giả Việc đ nh gi tính bền vững đối với c c<br />
TN (True Negative): số ảnh thực loại phép bi n đổi đ ợc dùng tr n vùng ảnh<br />
đ ợc x p đúng là ảnh thực giả vẫn dựa tr n thực nghiệm iểm chứng<br />
7. l là chủ y u, n n nhu cầu về một mô hình<br />
rong hi ỹ thuật watermar và to n h c hỗ trợ cho việc phân tích t quả<br />
signature đ ợc dùng nh là công cụ chủ cũng nh là dự đo n và ớc l ợng tr ớc<br />
động để giúp chủ nhân của c c bức ảnh số tính bền vững của giải ph p (hay cụ thể là<br />
bảo vệ quyền t c giả của mình, thì phần loại đặc tr ng) đ ợc đề xuất là cần thi t<br />
còn lại của câu chuyện gi m định ảnh là 8. l n<br />
ph t hiện mù tr n những bức ảnh hông rõ Bài hảo s t này đã tóm tắt phần lớn<br />
nguồn gốc ớng ti p cận dựa vào độ r i các h ớng nghi n cứu về lĩnh vực gi m<br />
sáng và không gian màu là ph ơng ph p định ảnh giả trong 15 năm gần đây, tập<br />
ph t hiện hứa hẹn ph t triển nhất vì nó trung chủ y u vào h ớng ph t hiện mù<br />
hông phụ thuộc vào c c phép bi n đổi p rong h ớng ti p cận chủ động, có hai ỹ<br />
dụng tr n vùng ảnh giả uy nhi n, h ớng thuật chính đ ợc dùng là watermar ing và<br />
ti p cận này cũng phải đối mặt với hó signature; còn h ớng ti p cận bị động, có<br />
hăn về định vị và hoanh vùng ảnh giả năm nhóm chính là dựa vào pixel, định<br />
<br />
11<br />
dạng, m y ảnh và độ r i s ng ai ỹ thuật 8. Chang, C. C., Hsiao, J. Y., và Chan, C. S.<br />
dựa vào hối pixel và eypoint cũng là một (2003). Finding optimal least-significant-bit<br />
substitution in image hiding by dynamic<br />
c ch phân loại h c Bài vi t cũng đã chỉ ra programming strategy. Pattern Recognition,<br />
u nh ợc điểm của mỗi nhóm phân loại 36(7), 1583-1595.<br />
Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải 9. Christlein, V., Riess, C., và Angelopoulou, E.<br />
thiện lớn về độ chính x c l n tới 99%; tuy (2010). On rotation invariance in copy-move<br />
forgery detection. In Information Forensics<br />
nhi n, th ng luôn có sự đ nh đổi giữa độ and Security (WIFS), 2010 IEEE International<br />
chính xác, mức phức tạp và độ bền vững Workshop on, pages 1-6. IEEE.<br />
trong giải thuật Ngoài ra, việc đối phó với 10. Cox, I. J., Kilian, J., Leighton, F. T., và<br />
Shamoon, T. (1997). Secure spread spectrum<br />
c c phép bi n đổi tuy n tính cũng là một<br />
watermarking for multimedia. IEEE<br />
trong c c th ch thức lớn nhất trong việc Transactions on Image Processing,<br />
xây dựng giải ph p mang tính bền vững, do 6(12):1673-1687.<br />
sự đa dạng và tính t hợp của c c phép 11. Fridrich, A. J., Soukal, B. D., và u š, A. J.<br />
(2003). Detection of copy-move forgery in<br />
bi n đổi đ ợc dùng hi tạo ảnh giả. digital images. In in Proceedings of Digital<br />
Lời c Forensic Research Workshop. Citeseer.<br />
12. Fridrich, J. (2009). Digital image forensics.<br />
ông trình này đ ợc tài trợ bởi quỹ Đại h c Signal Processing Magazine, IEEE, 26(2):26-37.<br />
Quốc gia Thành phố Hồ Chí Minh với mã 13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara<br />
sốB2015-20-02. Ganesh, S., và Shah, P. R. (2006). Digital<br />
image forgery detection using artificial neural<br />
TÀI LIỆU THAM KHẢO<br />
network and auto regressive coefficients. In<br />
Electrical and Computer Engineering, 2006.<br />
1. Bashar, M., Noda, K., Ohnishi, N., và Mori,<br />
E E’06 anadian onference on, pages<br />
K. (2010). Exploring duplicated regions in<br />
194-197. IEEE.<br />
natural images. IEEE Transactions on Image 14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016).<br />
Processing, vol. PP, no. 99, pp. 1-1. Robust blind image watermarking by<br />
2. Belkasoft, Belkasoft database. [Online]. modulating the mean of partly sign-altered<br />
Available: https://belkasoft.com/forgery-detection DCT coefficients guided by human visual<br />
3. Bender, W., Gruhl, D., Morimoto, N., và Lu, perception. AEU-International Journal of<br />
A. (1996). Techniques for data hiding. IBM Electronics and Communications.<br />
systems journal, 35(3.4), pp. 313-336. 15. Isaac, M. M., và Wilscy, M. (2015). Image<br />
4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D. Forgery Detection Based on Gabor Wavelets<br />
(2010). Image copymove forgery detection based and Local Phase Quantization. Procedia<br />
on surf. In Multimedia Information Networking Computer Science, 58, 76-83.<br />
and Security (MINES), 2010 International 16. Jiansheng, M., Sukang, L., và Xiaomei, T.<br />
Conference on, pages 889-892. IEEE. (2009). A digital watermarking algorithm<br />
5. Carvalho, T. J. d., Riess, C., Angelopoulou, based on DCT and DWT. In Proceedings of<br />
E., Pedrini, H., và de Rezende Rocha, A. the 2009 International Symposium on Web<br />
(2013). Exposing digital image forgeries by Information Systems and Applications<br />
illumination color classification. Information (WI A’09) Nanchang, R hina, pages<br />
Forensics and Security, IEEE Transactions 104-107. Citeseer.<br />
on, 8(7):1182-1194. 17. Johnson, Micah K., và Hany Farid. (2005)<br />
6. Carvalho, Tiago, Hany Farid, và Eric Kee. Exposing digital forgeries by detecting<br />
(2015). Exposing photo manipulation from inconsistencies in lighting. Proceedings of the<br />
user-guided 3D lighting analysis. SPIE/IS&T 7th workshop on Multimedia and security.<br />
Electronic Imaging. International Society for ACM.<br />
Optics and Photonics. 18. Kaur, M., và Walia, S. (2016). Forgery<br />
7. CASIA. Tampering detection dataset. [Online]. Detection Using Noise Estimation and HOG<br />
Available: http://forensics.idealtest.org Feature Extraction. International Journal of<br />
<br />
<br />
12<br />
Multimedia and Ubiquitous Engineering, Dartmouth College. USA.<br />
11(4), 37-48. 29. Qazi, T., Hayat, K., Khan, S. U., Madani, S.<br />
19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen, A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W.,<br />
S. (2009a). An efficient method for copy-move Yow, K., và Xu, C.-Z. (2013). Survey on<br />
forgery detection. In WSEAS International blind image forgery detection. Image<br />
Conference. Proceedings. Mathematics and Processing, IET, 7(7):660-670.<br />
Computers in Science and Engineering, 30. Rajkumar, R., Chanu, T. A., và Singh, N. N.<br />
number 8. World Scientific and Engineering (2016). Copy move forgery detection<br />
Academy and Society. approaches: A survey. ADBU Journal of<br />
20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al. Engineering Technology,<br />
(2009b). Fast copy-move forgery detection. 31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010).<br />
WSEAS Transactions on Signal Processing, Detection of copy-rotatemove forgery using<br />
5(5): 188-197. zernike moments. In Information Hiding,<br />
21. Lin, C. S., và Tsay, J. J. (2015). Passive pages 51–65. Springer.<br />
forgery detection for JPEG compressed image 32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng,<br />
based on block size estimation and G., và Chen, B. (2016). A novel blind color<br />
consistency analysis. Applied Mathematics image watermarking based on Contourlet<br />
and Information Sciences, 9(2), 1015. transform and Hessenberg decomposition.<br />
22. Luxion. Keyshot program. [Online]. Multimedia Tools and Applications, 1-21.<br />
Available: https://www.keyshot.com 33. Thajeel, S. A. N., và Sulong, G. (2015). A<br />
23. Mushtaq, S. và Mir, A. H. (2014). Digital novel approach for detection of copy move<br />
image forgeries and passive image forgery using completed robust local binary<br />
authentication techniques: A survey. pattern. Journal of Information Hiding and<br />
International Journal of Advanced Science Multimedia Signal Processing, 6(2), 351-364.<br />
and Technology, 73:15–32. 34. Tiwari, N., Ramaiya, M. K., và Sharma, M.<br />
24. Myrna, A., Venkateshmurthy, M., và Patil, C. (2013). Digital watermarking using DWT and<br />
(2007). Detection of region duplication DES. In Advance Computing Conference<br />
forgery in digital images using wavelets and (IACC), 2013 IEEE 3rd International, pages<br />
log-polar mapping. In Conference on 1100–1102.<br />
Computational Intelligence and Multimedia 35. Unknown. Retouching image. [Online].<br />
Applications, 2007. International Conference Available:<br />
on, volume 3, pages 371-377. IEEE. www.retouchingphotos.wikispaces.com<br />
25. Nillius, Peter, và Jan-Olof Eklundh. (2001). 36. Wang, B., Kong, X., Bertino, E., và Fu, H.<br />
Automatic estimation of the projected light (2009). Exposing copypasteblur forgeries<br />
source direction. Computer Vision and based on color coherence. Chinese Journal of<br />
Pattern Recognition, 2001. CVPR 2001. Electronics, 18(3):487-490.<br />
Proceedings of the 2001 IEEE Computer 37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001).<br />
Society Conference on. Vol. 1. IEEE. Image hiding by optimal LSB substitution and<br />
26. Pan, X. và Lyu, S. (2010). Detecting image genetic algorithm. Pattern recognition, 34(3),<br />
region duplication using sift features. In 671-683.<br />
ICASSP, pages 1706–1709. 38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015).<br />
27. Pathak, S., Tiwari, S., và Agrawal, S. (2016). Detecting of copy-move forgery in digital<br />
Digital image watermarking in Wavelet images using fractional Fourier transform. In<br />
domain using chaotic. Futuristic Trends in Seventh International Conference on Digital<br />
Engineering, Science, Humanities, and Image Processing (ICDIP15) (pp. 96310B-<br />
Technology FTESHT-16, 108. 96310B). International Society for Optics and<br />
28. Popescu, A. và Farid, H. (2004). Exposing Photonics.<br />
digital forgeries by detecting duplicated 39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005).<br />
image region [technical report]. 2004-515. Hiding secret data in images via predictive<br />
Hanover, Department of Computer Science, coding. Pattern Recognition, 38(5), 691-705.<br />
<br />
<br />
Ngày nhận bài: 30/8/2016 Biên tập xong: 15/9/2016 Duyệt đăng: 20/9/2016<br />
<br />
13<br />