Tìm kiếm ảnh theo ngữ nghĩa dựa trên đồ thị cụm

Bài toán truy vấn ảnh theo ngữ nghĩa SBIR (Semantic-Based Image Retrieval) được quan tâm trong những năm gần đây vì hướng tiếp cận này có thể trích xuất ngữ nghĩa hình ảnh và khắc phục được nhược điểm của phương pháp truy vấn ảnh theo văn bản TBIR (Text-Based Image Retrieval) cũng như theo nội dung CBIR (Content-Based Image Retrieval). Vì vậy, trong bài báo này, chúng tôi đề xuất phương pháp truy vấn ảnh và trích xuất ngữ nghĩa bằng đồ thị đặc trưng thị giác của hình ảnh và đồ thị cụm. Để thực hiện vấn đề này, phương pháp gom cụm đặc trưng thị giác hình ảnh được đề xuất nhằm tạo ra đồ thị cụm để từ đó trích xuất ngữ nghĩa hình ảnh. Trước hết, chúng tôi đề xuất cấu trúc đồ thị mô tả hình ảnh và độ đo tương tự dựa trên đặc trưng thị giác cấp thấp cùng với quan hệ không gian giữa các vùng trong ảnh. Sau đó, đồ thị cụm được tạo ra bằng phương pháp gom cụm các đồ thị đặc trưng của hình ảnh trên cơ sở độ đo đã được đề xuất; đồng thời, chúng tôi xây dựng ontology mô tả ngữ nghĩa cho tập dữ liệu ảnh và tạo ra câu truy vấn SPARQL dựa trên véctơ từ thị giác của hình ảnh nhằm thực hiện truy vấn trên ontology. Dựa trên cấu trúc đồ thị cụm và ontology đã xây dựng, chúng tôi đề xuất thuật toán tra cứu và trích xuất ngữ nghĩa hình ảnh. Nhằm chứng minh cơ sở lý thuyết đã đề xuất, thực nghiệm được xây dựng và đánh giá trên tập dữ liệu ảnh ImageCLEF; kết quả thực nghiệm được đánh giá so với các phương pháp khác đã được công bố gần đây trên cùng tập dữ liệu. Từ kết quả thực nghiệm cho thấy phương pháp đề xuất của chúng tôi là hiệu quả và có thể ứng dụng trong nhiều hệ thống dữ liệu đa phương tiện

11 trang | Chia sẻ: Thục Anh | Ngày: 11/05/2022 | Lượt xem: 270 | Lượt tải: 1

Nội dung tài liệu Tìm kiếm ảnh theo ngữ nghĩa dựa trên đồ thị cụm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

dung hòa F-measure. Công thức tính các giá trị này như sau [2]: Trong đó, relavant images là tập ảnh tương tự với ảnh truy vấn có trong tập dữ liệu ảnh, retrieved images là tập ảnh đã tìm kiếm được. Các giá trị độ chính xác, độ phủ và độ do dung hòa được tính theo tỷ lệ và được quy đổi thành giá trị trên đoạn [ ]. Precision-Recall và đường cong ROC của hệ thống trên tập dữ liệu ImageCLEF Trung bình độ chính xác, độ phủ và độ dung hòa của hệ thống trên tập dữ liệu ImageCLEF Trong thực nghiệm của bài báo này, chúng tôi chọn 7500 ảnh trong tập 20000 ảnh của tập dữ liệu ImageCLEF 484 TÌM KIẾM ẢNH THEO NGỮ NGHĨA DỰA TRÊN ĐỒ THỊ CỤM để kiểm thử. Kết quả thực nghiệm của phương pháp chúng tôi đề xuất được mô tả tại Hình 5, Hình 6; hiệu suất của phương pháp được trình bày trong Bảng 1; giá trị MAP của phương pháp đề xuất được so sánh với các phương pháp khác trên cùng bộ dữ liệu ImageCLEF được mô tả trong Bảng 2. Hình 5 mô tả các đường cong Precision-Recall và ROC, mỗi đường cong mô tả một bộ dữ liệu được truy vấn. Hình 6 mô tả giá trị Precision, Recall, F-measure trung bình của 39 bộ ảnh trong tập dữ liệu ImageCLEF. Kết quả trong Bảng 2 cho thấy phương pháp đề xuất của chúng tôi tương đối chính xác so với các hệ truy vấn ảnh theo ngữ nghĩa. Bảng 1. Hiệu suất tìm kiếm ảnh của phương pháp được đề xuất trên bộ dữ liệu ImageCLEF Tập ảnh Số ảnh Số cụm Độ chính xác trung bình Độ phủ trung bình Độ đo dung hòa trung bình 00-10 2500 6 0.694152 0.338917 0.455458 11-20 1551 7 0.646883 0.402911 0.496578 21-30 1235 8 0.644240 0.400223 0.493727 31-40 2217 6 0.729549 0.569591 0.639723 Bảng 2. So sánh độ chính xác giữa các phương pháp trên bộ dữ liệu ImageCLEF Phƣơng pháp Mean Average Precision (MAP) C.A. Hernández-Gracidas, 2013 [13] 0.5826 Hakan Cevikalp, 2017 [12] 0.4678 Vijayarajan, 2016 [25] 0.4618 Van T.T, 2017 [23] 0.7945 Phƣơng pháp đề xuất của chúng tôi 0.6787 Ứng dụng thực nghiệm của phương pháp đề xuất Kết quả tìm kiếm ảnh của phương pháp đề xuất VI. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Bài báo đã xây dựng được phương pháp tìm kiếm ảnh theo ngữ nghĩa dựa trên đồ thị cụm bao gồm đồ thị đặc trưng thị giác của hình ảnh. Trong bài báo này, chúng tôi đã đề xuất độ đo tương tự giữa hai hình ảnh và xây dựng cấu trúc đồ thị cụm. Trên cơ sở lý thuyết đã được đề xuất, chúng tôi xây dựng hệ truy vấn ảnh theo ngữ nghĩa dựa trên nội dung của hình ảnh. Kết quả thực nghiệm trên bộ dữ liệu ảnh ImageCLEF được đánh giá và so sánh với các công trình khác trên cùng một tập dữ liệu ảnh đã cho thấy phương pháp đề xuất là hiệu quả. Vì vậy, phương pháp đề xuất của chúng tôi có thể được sử dụng cho các hệ thống tra cứu dữ liệu đa phương tiện. Việc xây dựng đồ thị cụm dựa trên đồ Nguyễn Văn Thịnh, Nguyễn Thị Định, Văn Thế Thành 485 thị đặc trưng thị giác của hình ảnh đã tạo ra một cấu trúc tìm kiếm ảnh nhanh chóng. Từ đó, kết quả của quá trình tìm kiếm ảnh có thể phân tích được ngữ nghĩa và tạo câu truy vấn SPARQL làm cơ sở thực hiện trích xuất mô tả ngữ nghĩa trên ontology. Hướng phát triển tiếp theo của bài báo là phát triển phương pháp cụm dựa trên các kỹ thuật phân lớp hình ảnh, nghĩa là có thể tạo ra một mô hình phân lớp để phân bố các hình ảnh thuộc về các cụm cho trước, đồng thời xây dựng cấu trúc mở rộng các cụm dựa trên phương pháp phân lớp. VII. LỜI CẢM ƠN Nhóm tác giả chân thành cảm ơn Trường Đại học Công nghiệp Thực phẩm TP.HCM là nơi bảo trợ cho nghiên cứu này. Chúng tôi trân trọng cám ơn nhóm nghiên cứu SBIR-HCM và Trường Đại học Sư phạm TP.HCM đã hỗ trợ về chuyên môn và cơ sở vật chất giúp chúng tôi hoàn thành bài nghiên cứu này. TÀI LIỆU THAM KHẢO 1. S. R. W. A. Hlaoui. "A graph clustering algorithm with applications to content-based image retrieval". in Proceedings of the 2003 International Conference on Machine Learning and Cybernetics. 2003. Xi'an, China: IEEE. 2. A. A. Ahmad Alzu’bi, Naeem Ramzan, "Semantic content-based image retrieval: A comprehensive study", Journal of Visual Communication and Image Representation, vol. 32, no., pp. 20-54, 2015. 3. X. Y. B. B. Z. Yao, L. Lin, M.W. Lee, S. C. Zhu. "I2T: Image Parsing to Text Description". in Proceedings of the IEEE. 2010. IEEE. 4. B. S. Banerjee M., Pal S. K., "A Clustering Approach to Image Retrieval Using Range Based Query and Mahalanobis Distance". in In: Skowron A., Suraj Z. (eds) Rough Sets and Intelligent Systems - Professor Zdzisław Pawlak in Memoriam. 2013. Springer, Berlin, Heidelberg. 5. J. B. Bin Xu, Chun Chen, Can Wang, Deng Cai, Xiaofei He, "EMR: A Scalable Graph-Based Ranking Model for Content-Based Image Retrieval", IEEE Transactions on Knowledge and Data Engineering, vol. 7, no. 1, pp. 102- 114, 2015. 6. P. Carbonetto. Available from: 7. C. C. C. Chuen-Horng Lin, Hsin-Lun Lee, Jan-Ray Liao, "Fast K-means algorithm based on a level histogram for image retrieval", Expert System with Application, vol. 41, no. 7, pp. 3276-3283, 2014. 8. Deloitte. 2018; Available from: https://www2.deloitte.com. 9. Deloitte, " Photo sharing: trillions and rising", Deloitte Touche Tohmatsu Limited, Deloitte Global, Tech. Rep., vol., no., 2016. 10. J. Y. Guang-HaiLiu, "Content-based image retrieval using color difference histogram", Pattern Recognition, vol. 46, no. 1, pp. 188-198, 2013. 11. M. M. H. R. Saboorian, Jamzad, M. Rabiee. "User adaptive clustering for large image databases". in 20th IEEE International Conference on Pattern Recognition. 2010. Istanbul, Turkey: IEEE. 12. M. E. Hakan Cevikalp, Savas Ozkan, "Large-scale image retrieval using transductive support vector machines", Computer Vision and Image Understanding, vol. 173, no., pp. 2-12, 2018. 13. C. A. Hernández-Gracidas, Sucar, L. E. & Montes-y-Gómez, "Improving image retrieval by using spatial relations", Multimed Tools Application, vol. 62, no. 2, pp. 479-505, 2013. 14. C. A. H. Hugo Jair Escalante, Jesus A. Gonzalez, A. López- López, Manuel Montes, Eduardo F. Morales, L. Enrique Sucar, Luis Villasenor, Michael Grubinger "The segmented and annotated IAPR TC-12 benchmark", Computer Vision and Image Understanding, vol. 114, no. 4, pp. 419-428, 2010. 15. S. H. J. Hun-Woo Yoo, Dong-Sik Jang, Yoon-Kyoon Na, "Extraction of major object features using VQ clustering for content-based image retrieval", Pattern Recognition, vol. 35, no. 5, pp. 1115-1126, 2002. 16. S. Jabeen, et al., "An effective content-based image retrieval technique for image visuals representation based on the bag-of-visual-wordsmodel", PLoS ONE, vol. 13, no. 4, pp. 1-24, 2018. 17. P. S. Kim S., Kim M. "Central Object Extraction for Object-Based Image Retrieval". in International Conference on Image and Video Retrieval. 2003. Berlin, Heidelberg: Springer, Berlin, Heidelberg. 18. S. M. N. Zakariya, Ali, R., Ahmad. "Combining visual features of an image at different precision value of unsupervised content based image retrieval". in 2010 IEEE International Conference on Computational Intelligence and Computing Research. 2011. Coimbatore, India: IEEE. 19. Y. D. Nan Zhao, Hongliang Bai, Lezi Wang, Chong Huang, Shusheng Cen, Jian Zhao. "A semantic graph-based algorithm for image search reranking". in 2013 IEEE International Conference on Acoustics, Speech and Signal Processing. 2013. IEEE. 486 TÌM KIẾM ẢNH THEO NGỮ NGHĨA DỰA TRÊN ĐỒ THỊ CỤM 20. Z. M. S. Jabeen, T. Mahmood, T. Saba, A. Rehman, M. T. Mahmood, "An effective content-based image retrieval technique for image visuals representation based on the bag-of-visual-wordsmodel", PLoS ONE, vol. 13, no. 4, pp. 1-24, 2018. 21. N. V. T. Thanh The Van, Thanh Manh Le, "The Method Proposal of Image Retrieval Based on K-Means Algorithm", Advances in Intelligent Systems and Computing, vol. 746, no. 2, pp. 481-490, 2018. 22. T.M.L. Thanh The Van, "Content-Based Image Retrieval using A Signature Graph and A Self-Organizing Map", International Journal of Applied Mathematics and Computer Science (AMCS), vol. 26, no. 2, pp. 423-438, 2016. 23. T. M. L. Thanh The Van, "Content-based image retrieval based on binary signatures cluster graph", Journal of Knowledge Engineering, Expert System, vol. 35, no. 1, pp. 1-22, 2017. 24. T. M. L. Thanh The Van, "Image Retrieval Based on Binary Signature ang S-kGraph", Annales Univ. Sci. Budapest, vol. 43, no., pp. 105-122, 2014. 25. M. D. V. Vijayarajan, P. Tejaswin, M. Lohani, "A generic framework for ontology‑ based information retrieval and image retrieval in web data", Human-centric Computing and Information Sciences, vol. 6, no. 18, pp. 1-30, 2016. 26. X. C. Xiao Xie, Junpei Zhou, Nan Cao, Yingcai Wu, "A Semantic-based Method for Visualizing Large Image Collections", IEEE Transactions on Visualization and Computer Graphics, vol., no., 2018. 27. G. L. Yan Yan, Sen Wang, Jian Zhang, Kai Zheng, "Graph-based clustering and ranking for diversified image search", Multimedia Systems, vol. 23, no. 1, pp. 41-52, 2017. 28. B. B. Z. Yao, et al. "I2T: Image Parsing to Text Description". in Proceedings of the IEEE. 2010. IEEE. SEMANTIC-BASED IMAGE RETRIEVAL BASED ON CLUSTER GRAPH Nguyen Van Thinh, Nguyen Thi Dinh, Van The Thanh ABSTRACT: The Semantic-Based Image Image (SBIR) problem is of interest in recent years because this approach can extract image semantics and overcome the disadvantages of Text-Based Image Retrieval (TBIR) and Content-Based Image Retrieval (CBIR) methods. Therefore, in this paper, we propose methods retrieval and extracting images semantics with a visual feature graph of images and a cluster graph. To accomplish this problem, the visual feature graph clustering method is proposed to create the cluster graph from which to extract image semantics. First of all, we propose a structure of image description graphs and similarity measure based on low-level features along with spatial relationships among regions in the image. Then, cluster graphs were created using a method of clustering the visual feature graphs of the images on the basis of the proposed similarity measure; At the same time, we build the ontology that describes the semantics for the image dataset and create the SPARQL query rely on the visual word vector to perform image retrieval on the ontology. Based on the built cluster graph and ontology, we propose an image retrieval and semantic extraction algorithm. In order to illustrate the proposed theory, experiments were built and evaluated on ImageCLEF dataset; Experimental results are evaluated compared to other recently published methods on the same dataset. From the experimental results show that our proposed method is effective and can be applied in many multimedia data systems. Keywords: SBIR, image retrieval, clustering, ontology, SPARQL.

Các file đính kèm theo tài liệu này:

tim_kiem_anh_theo_ngu_nghia_dua_tren_do_thi_cum.pdf