một ảnh thuần một màu, nếu 
sdn T<σ . Trong trường hợp này sdT là hằng số và 
bằng 1. Khi một khung ảnh thuần một màu được phát 
hiện, tại đó hoặc sẽ là một fade-out hoặc là một cắt tới 
nó. Cho nf là một khung ảnh thuần một màu và 1−nf 
là khung trước nó, như vậy sdn T≥−1σ . Ðể xác định 
22 
nếu nf đánh dấu kết thúc của một fade-out hoặc cặp 
khung chứa một cắt lia, cần tính các số đo nE và nC . 
Các đặc tính cạnh nE sẽ ít giống nhau. Tuy nhiên, 
nếu nf đánh dấu kết thúc của một fade-out là một 
chuyển đổi từ từ, sự sai khác giữa các phân bố màu sẽ 
nhỏ và hầu như không thay đổi. Ðiều này được minh 
hoạ trên hình 7, biểu diễn các số đo nE và nC trong 
một chuỗi phụ video có chứa một fade-out và tiếp sau 
là một fade-in. Có thể thấy không có thay đổi nào 
trong nC . Tuy nhiên, nếu cặp khung chứa một cắt lia, 
cả hai số đo đều thay đổi đáng kể. Hình 8 cho thấy đồ 
thị của nE và nC trong một đoạn video chứa một cắt 
lia tới ảnh thuần đen và tiếp sau bởi một fade-in. 
S
è
 ®
o
Sù gièng nhau cña ®Æc tÝnh c¹nh En
Sù kh¸c nhau biÓu ®å mµu Cn
KÕt thóc cña fade-in
C C¾t tíi mét ¶nh ®en
1
2
3
2
3
1
2
1.5
1100
1
0.5
0
1120 1140 1160 1180 1200 1220 1240
Sè khung
Hình 8. Số đo nE và nC trong một cắt lia 
Nếu đã tìm thấy khung thuần một màu để đánh dấu 
bắt đầu/kết thúc của một fade, coi như xác định chắc 
chắn ranh giới đối diện. Một fade sẽ biểu thị tỷ lệ biến 
đổi cường độ pixel theo thời gian và có thể quan sát 
được như một mẫu parabol. Ðiều này được phản ánh 
bởi tỷ lệ lệch chuẩn của cường độ pixel nσ so với 
đường thẳng xấp xỉ, như thấy trên hình 9 - minh hoạ 
nσ trong một fade-in. Chắc chắn không thể phát hiện 
một fade, khi giả sử tốc độ tăng của thay đổi là hằng 
số, trong một chuyển đổi. Tuy nhiên, lưu ý rằng kết 
thúc của fade-in được đánh dấu bằng sự thay đổi đáng 
kể tốc độ tăng của nσ . Như vậy, có thể phát hiện 
được kết thúc một fade-in bằng xác định vị trí của cặp 
khung, nơi mà thay đổi lớn xuất hiện (tương tự có thể 
phát hiện điểm bắt đầu của một fade-out bằng cách 
phân tích tốc độ tăng ngược lại từ điểm kết thúc của 
fade-out). Nhận xét là độ lệch chuẩn tiếp tục tăng 
không đáng kể sau khi kết thúc fade-in, như vậy nó 
không đủ để phát hiện cặp khung có tỷ lệ thay đổi nhỏ 
hơn hoặc bằng 0, khi kết thúc fade-in. 
§
é
 l
Ö
c
h
 c
h
u
È
n
 c
ñ
a
 c
−
ê
n
g
 ®
é
 p
ix
e
l
Sè khung
§−êng th¼ng xÊp xØ
C¸c ranh giíi cña fade
MÉu parabol
1
2
32
3
1
70
3140
60
50
40
30
20
10
0
3160 3180 3200 3220 3240 3260 3280 3300
Hình 9. Tỷ lệ lệch chuẩn cường độ pixel theo thời gian 
trong một fade so với đường thẳng xấp xỉ 
Tuy nhiên, nếu một fade là tới hoặc từ một cảnh có 
độ tương phản khá thấp, chỉ sử dụng độ lệch chuẩn sẽ 
không thể phát hiện ranh giới một cách chính xác. 
Hình 10a cho thấy 16 khung trong một lia, khi camera 
quét lên bầu trời và sau đó kết thúc với một fade-out. 
Trên đường số 2 trong hình 10b có thay đổi nhỏ độ 
lệch chuẩn của cường độ pixel, trong một fade-out. 
Ðộ giảm lớn nhất là trong khoảng thời gian ứng với 
đoạn camera quét lên trời có độ tương phản thấp. 
Trong trường hợp này, biểu hiện lớn nhất của chuyển 
đổi fade là trong khoảng thời gian của trung bình của 
cường độ pixel, như trên đường số 3 trong hình 10b. 
Thực tế cho thấy chỉ một số đo là không đủ để phát 
hiện chắc chắn ranh giới của một fade, cho nên cần 
kết hợp tuyến tính cả hai số đo, như trên đường số 4 
trong hình 10b. Nếu chỉ quan tâm tới fade-in, nσ sẽ 
luôn gần tới 0 với khung đầu tiên, không kể tới màu 
của nó. Tuy nhiên, giá trị trung bình có thể là bất kỳ 
trong dải [0, 255]. Thực vậy, giá trị trung bình có thể 
giảm trong một fade-in. Do đó, giá trị trung bình của 
khung đầu tiên trong fade-in và mỗi khung tiếp theo 
được biến đổi bằng: 
 snn µµµ −=′ với sn ≥ (9) 
trong đó nµ là trung bình của khung nf , và sf là 
khung đầu tiên của fade-in. Giờ đây, phát hiện kết 
thúc fade-in là vấn đề xác định vị trí của khung có sự 
giảm đáng kể tốc độ thay đổi của khoảng thời gian 
biểu diễn kết hợp tuyến tính: 
 nnnl σµ +′= (10) 
23 
(a) VÝ dô mét fade-out víi c¸c khung ¶nh cã ®é t−¬ng ph¶n thÊp
(b) Mét fade víi c¶nh cã ®é t−¬ng ph¶n thÊp cã ®é lÖch chuÈn Ýt thay ®æi
nh−ng cã ®é lÖch trung b×nh thay ®æi lín
Sè khung
Ranh giíi cña fade-out
§é lÖch chuÈn cña c−êng ®é pixel
Trung b×nh cña c−êng ®é pixel
Tæng cña ®é lÖch vµ trung b×nh chuÈn
1
2
32
3
1
200
5460
180
160
140
120
100
80
60
40
20
0
5480 5500 5520 5540 5560 5580 5600
S
è
 ®
o
4
4
Hình 10. Ðộ lệch chuẩn và độ lệch trung bình với các fade 
từ/tới các cảnh có độ tương phản thấp 
Phát hiện điểm bước ngoặt này nhờ sử dụng tốc độ 
thay đổi trung bình của nl giữa khung bắt đầu và một 
khung hiện tại, để dự báo giá trị của nl cho khung tiếp 
theo. Nếu giá trị thực tế với khung tiếp theo nhỏ hơn 
giá trị dự đoán của nó trong một vài khung liên tiếp, 
tốc độ tăng coi như thay đổi đáng kể và kết thúc của 
fade-in được xác nhận. 
Như vậy, với mỗi khung nf theo sau khung đầu 
tiên sf sao cho n > s, sẽ tính được tốc độ thay đổi 
trung bình của của nl , ở đây )/( nsll nn −= . Sau đó, 
giá trị của nl được dự báo cho khung tiếp theo 1+nf , 
sử dụng nnn lll +=′+1 . Nếu giá trị thực tế của 1+nl lớn 
hơn hoặc bằng giá trị thực tế của dự đoán, tức là 
11 ++ ′≥ nn ll , fade-in coi như vẫn tiếp tục. Ngược lại, 
nếu 11 ++ ′< nn ll , khung hiện tại nf được đánh dấu có 
khả năng là điểm kết thúc của fade-in. Nếu giá trị thực 
tế của 1+nl nhỏ hơn giá trị dự báo của nó trong một 
vài khung liên tiếp, fade-in được xác định là đã kết 
thúc. Nếu số của khung liên tục 1=succN , tương 
đương với giả sử tốc độ tăng là tuyến tính, kết thúc 
của fade-in sẽ dễ dàng được xác định. Tuy nhiên, cho 
phép dùng một hàm tăng không tuyến tính để tính tốc 
độ thay đổi trung bình giữa khung bắt đầu và mỗi 
khung hiện tại (sử dụng 1>succN ). Thực tế, nếu succN 
đặt quá lớn, tốc độ thay đổi trung bình cuối cùng sẽ 
gần tới 0 và 1+nl có khả năng sẽ lớn hơn hoặc bằng 
giá trị dự báo của nó, ứng với nhiều khung liên tục. 
Trường hợp này, sẽ tìm thấy fade-in quá dài. Giá trị 
thực nghiệm cho thấy 5=succN sẽ cho kết quả xác 
định chính xác điểm khởi đầu/kết thúc của một fade. 
V. KẾT LUẬN 
Phát hiện các chuyển lia, nhất là các chuyển lia 
phức tạp luôn phải khắc phục vấn đề chuyển động của 
camera và đối tượng. Bài báo đã giới thiệu một 
phương pháp phát hiện chuyển đổi fade. Các chuyển 
đổi fades được phát hiện trước hết bằng xác định vị trí 
của khung ảnh thuần một màu, sau đó sử dụng thuật 
toán phát hiện cắt lia để xác định khung này hoặc là 
một cắt lia tới một ảnh thuần một màu hoặc có thể là 
điểm bắt đầu hoặc kết thúc của một fade. Nếu xác 
định khung ảnh thuần một màu là ranh giới của một 
fade, ranh giới đối diện được phát hiện bằng kiểm tra 
trung bình pixel và chuỗi thời gian biến đổi, tìm một 
sự tăng tốc độ thay đổi đủ lớn. Phương pháp này kết 
hợp hai phép đo: phép đo sự giống nhau dựa trên 
tương quan đặc tính cạnh của các khối và phép đo sự 
khác nhau biểu đồ màu. Nhờ đó, độ chính xác của 
thuật toán được nâng cao do đã bù được những thay 
đổi gây nên bởi chuyển động của camera và đối 
tượng. 
TÀI LIỆU THAM KHẢO 
[1] A. Giachetti, Matching techniques to compute image 
motion, Image and Vision Computing, 18 (3), Feb. 
2000, pp. 247-260. 
[2] Ahmed K. Elmagarmid, H. Jiang, A. Helal, A. Joshi, M. 
Ahmed, Video Database Systems - Issues, Products and 
Applications, Kulwer Academic Publishers, 2001. 
[3] Ðỗ Trung Tuấn, Lương Xuân Cương, Khun Piseth, 
Nguyễn Văn Tảo, Về Xử lý dữ liệu video, Tạp chí khoa 
học-Khoa học tự nhiên và công nghệ, Ðại học Quốc gia 
Hà Nội, T.XIX, N3, 2003, tr. 48-56. 
[4] E. Saez, J.I Benavides, N.Gui, Combining 
Luminescence and Edge Based Metrics for Robust 
Temporal Video Segmentation, IEEE Int’l. Conf. on 
Image Processing (ICIP2004), Singapore, Oct. 24-27, 
2004. 
24 
[5] H. H. Yu, W. Wolf, A hierarchical multiresolution 
video shot transition detection scheme, Computer 
Vision and Image Understanding, 75 (1/2), July/Aug. 
1999, pp. 196-213. 
[6] J. P. Lewis, Fast normalized cross-correlation, Vision 
Interface, 1995, pp. 120-123.  
zilla/Work/nvisionInterface/nip.html. 
[7] Lương Xuân Cương, Ðỗ Xuân Tiến, Ðỗ Trung Tuấn 
(2006), Một kỹ thuật chỉ số hoá tự động dữ liệu video 
dựa trên đánh dấu vùng nền, Tạp chí khoa học-Khoa 
học tự nhiên và Công nghệ, Ðại học Quốc gia Hà Nội, 
T.XXII, No2, tr. 01-11. 
[8] S. V. Porter (2004), Video Segmentation and Indexing 
using Motion Estimation, Science and Technology 
journal of University of Bristol, pp. 9-19. 
[9] S. V. Porter, M. Mirmehdi, B. T. Thomas, Temporal 
video segmentation and classification of edit effects, In 
Image and Vision Computing, vol. 21, Dec. 2003, pp. 
1097-1106. 
[10] Y. Gong, H. Chua, and X. Guo, Image indexing and 
retrieval based on color histogram, In Proc. Of Int'l 
Conf. Multimedia Modeling, Singapore, Nov. 1995. 
Ngày nhận bài: 02/08/2006 
 SƠ LƯỢC TÁC GIẢ 
LƯƠNG XUÂN CƯƠNG 
Sinh năm 1963 tại Bắc Ninh. 
Tốt nghiệp Ðại học Bách khoa Ðà Nẵng năm 1995, 
nhận bằng Thạc sĩ chuyên ngành Vô tuyến Điện tử và 
Thông tin liên lạc tại Học viện Kỹ thuật Quân sự năm 
2001. 
Nơi công tác: Trường Sỹ quan CH-KT Thông tin 
Nha trang. 
Hướng nghiên cứu: Xử lý video, vi xử lý. 
Email: 
[email protected] 
ĐỖ XUÂN TIẾN 
Sinh năm 1951 tại Hà Tây. 
Tốt nghiệp Ðại học LOLPI (Liên Xô) chuyên ngành 
Vô tuyến điện năm 1975. Nhận bằng Tiến sĩ năm 
1987 tại LETI (Liên Xô), chuyên ngành Thiết kế Vi 
xử lý. Được công nhận chức danh Phó Giáo sư năm 
2002. 
Hiện nay đang là Chủ nhiệm bộ môn Kỹ thuật Vi 
xử lý - Học viện Kỹ thuật Quân sự. 
Hướng nghiên cứu: Kỹ thuật xử lý số, Xử lý song 
song. 
Email: 
[email protected] 
ĐỖ TRUNG TUẤN 
Tốt nghiệp Trường Đại học Bách khoa Hà Nội, 
1976. Nhận bằng Thạc sĩ, Tiến sĩ ngành Tin học tại 
Trường Đại học Pierre et Marie Curie (Paris VI), năm 
1984, 1987. Được công nhận chức danh Phó Giáo Sư 
năm 2003. 
Hiện công tác tại Khoa Toán Cơ Tin học, Trường 
Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà 
Nội. 
Email: 
[email protected] 
25