Xây dựng hệ sinh thái dữ liệu mở cùng cách mạng công nghiệp 4.0

Thông tin, dữ liệu đã luôn có vai trò ảnh hưởng quan trọng đối với

nền kinh tế công nghiệp. Tuy nhiên khi đến thời đại CMCN 4.0 thì nó

chiếm giữ ở vị trí số 1 và trở thành động lực chính tạo ra giá trị gia tăng

cho xã hội. Trước đây dữ liệu chỉ được sinh ra bởi con người với các

phương tiện thô sơ thủ công, thì nay dữ liệu có thể được thu thập một

cách tự động từ các thiết bị cảm biến thông qua nền tảng công nghệ IoT.

Dự tính đến 2023 trên thế giới sẽ có khoảng 50 tỷ thiết bị IoT (nguồn

statista.com). Chúng cung cấp ra một khối lượng dữ liệu khổng lồ về

hình ảnh, âm thanh, các số liệu đo đạc được thu thập từ hiện trường.

Ngoài ra công nghệ cũng cho phép con người thực hiện ghi chép và tạo

ra dữ liệu ở mọi lúc, mọi nơi và được ghi lưu lại một cách dễ dàng và

nhanh chóng. Ngày nay trên các mạng xã hội lớn như Facebook, Twitter

cứ sau mỗi phút thì một khối lượng lớn thông tin được tạo thêm từ các

chia sẻ của người dùng.

pdf14 trang | Chia sẻ: Thục Anh | Ngày: 19/05/2022 | Lượt xem: 189 | Lượt tải: 0download
Nội dung tài liệu Xây dựng hệ sinh thái dữ liệu mở cùng cách mạng công nghiệp 4.0, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ủa các nước. Ví dụ, bảng xếp hạng của Open Knowledge Foundation (index.okfn.org) đang thực hiện đánh giá dựa trên 6 tiêu chí gồm: cấp phép mở; định dạng mở và máy đọc được; có thể tải về một lần; có cập nhật thường xuyên; công bố rộng rãi; và miễn phí sử dụng. Các tiêu chí này yêu cầu tương đương với mức độ 3 theo tiêu chuẩn 5 sao như kể trên. Theo kết quả đánh giá mới nhất, Đài Loan, Úc, Anh, Pháp, Phần Lan hiện đang dẫn đầu trong tổng số 94 quốc gia trên bảng xếp hạng. Việt Nam vẫn còn nằm trong những nước chưa được đưa vào bảng đánh giá xếp hạng về dữ liệu mở (do chưa có đủ nguồn thông tin để thực hiện đánh giá). Ngoại trừ các hệ thống cũ đã có từ trước, hạ tầng dữ liệu được xây dựng cho các hệ thống mới cần ưu tiên đạt tối thiểu mức độ 4. Khi đó phải thiết lập một hệ thống các chuẩn định danh duy nhất và các thuật ngữ dùng chung để mô tả dữ liệu và siêu dữ liệu. Chúng nên được áp dụng thống nhất trên phạm vi của cả quốc gia, ưu tiên sử dụng những 326 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ chuẩn đã được quốc tế hóa. Ví dụ trong lĩnh vực thông tin khoa học công nghệ, hệ thống mã quốc tế DOI được khuyến khích áp dụng để định danh các công bố khoa học; mã ORCID để định danh người nghiên cứu; các thuật ngữ của Dublin Core được dùng cho các1miêu tả siêu dữ liệu. Việc áp dụng các chuẩn định danh và thuật ngữ dùng chung là yêu cầu cần thiết để tạo thuận lợi cho quá trình trao đổi và tích hợp dữ liệu trong một hệ sinh thái mở. 5.XÂY DỰNG HỆ SINH THÁI DỮ LIỆU MỞ TẠI VIỆT NAM Việt Nam đang ở giai đoạn sơ khai của quá trình chuyển đổi số. Hạ tầng dữ liệu quốc gia vẫn chưa được sẵn sàng. Đặc biệt ở trong khu vực công, dữ liệu hiện chưa có nhiều và thường được quản lý khá manh mún. Một số hệ thống CSDL tập trung vẫn còn đang trong quá trình triển khai thông qua kế hoạch ưu tiên xây dựng 6 CSDL quốc gia về dân cư, đất đai, đăng kí doanh nghiệp, dân số và tài chính. Do đó việc xây dựng hệ sinh thái dữ liệu mở tại Việt Nam sẽ là một thách thức lớn do chúng ta còn thiếu nhiều kinh nghiệm trong quản lý và khai thác dữ liệu lớn. Tuy nhiên nhận thức về sự cần thiết xây dựng hạ tầng dữ liệu mở đã được thể hiện trên thực tế trong các đề án xây dựng đô thị thông minh tại một số thành phố lớn. Ví dụ trong Đề án của Thành phố Hồ Chí Minh, “Trung tâm kho dữ liệu dùng chung và phát triển hệ sinh thái dữ liệu mở” là một trong bốn trụ cột công nghệ sẽ được xây dựng. Hiện Thành phố đã đưa vào vận hành Cổng khai thác dữ liệu mở tại địa chỉ https://data.hochiminhcity.gov.vn. Dữ liệu mở được cung cấp trên Cổng tương đương với mức độ 3 của tiêu chuẩn 5 sao. Tuy nhiên còn có một thiếu sót lớn là tất cả các bộ dữ liệu được đăng tải trên Cổng chưa được gắn với bất kì với một giấy phép truy cập mở nào. Một đề án xây dựng hạ tầng dữ liệu khác ở quy mô quốc gia là xây dựng Hệ tri thức Việt số hóa. Mặc dù không được đề cập trực tiếp, nhưng toàn bộ mục tiêu và nội dung của Đề án hoàn toàn phù hợp với mô hình xây dựng một hệ sinh thái dữ liệu và tài nguyên truy cập mở tại Việt Nam. Hiện nay các sản phẩm của Đề án được công bố và đưa vào vận hành khai thác tại địa chỉ https://itrithuc.vn. Các dự án thành phần của Đề án hiện nay gồm có: Kho dữ liệu mở, Kho ứng dụng, Kho chia 327PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở sẻ kiến thức, Kho tài nguyên giáo dục, Kho di sản số hóa, Nền tảng dữ liệu bản đồ Việt Nam, và Nền tảng dữ liệu tiếng Việt. Tuy nhiên cách tiếp cận xây dựng của các dự án chưa thực sự đáp ứng được các yêu cầu phát triển bền vững dựa trên mô hình của hệ sinh thái mở. Các lí do cụ thể được mô tả sau đây. Thứ nhất, chỉ có Dự án “Kho dữ liệu mở” là đã được công bố mở gắn với giấy phép CC BY-NC (không được thương mại hóa). Tất cả các dự án khác đều chưa được công bố mở. Do vậy sẽ rất khó khăn cho việc phát triển hệ sinh thái, cho phép đổi mới sáng tạo ra các nội dung, dịch vụ và ứng dụng mới dựa trên các dữ liệu được chia sẻ. Các nhà phát triển và người sử dụng sẽ gặp phải các vướng mắc bởi vấn đề pháp lí khi bản quyền sử dụng không rõ ràng. Thứ hai, chưa hình thành được mạng lưới tổ chức hỗ trợ cộng đồng dữ liệu mở. Hiện nay toàn bộ Đề án đang được điều hành bởi Cục Thông tin khoa học & công nghệ quốc gia trực thuộc Bộ Khoa học & Công nghệ. Cơ quan này chỉ nên đóng vai trò thực hiện chức năng quản lý của nhà nước trong việc thúc đẩy các chính sách về xây dựng hệ sinh thái dữ liệu mở. Các hoạt động cụ thể của Đề án chỉ có thể xã hội hóa được khi có một tổ chức phi lợi nhuận đảm nhiệm vai trò xây dựng mạng lưới, thực hiện tư vấn, tập huấn cho các tổ chức, cá nhân tham gia đóng góp vào việc tạo lập dữ liệu. Tổ chức phi lợi nhuận này cần hoạt động như doanh nghiệp để có thể thu hút được nhiều nguồn tài trợ cả trong và ngoài chính phủ phục vụ triển khai các dự án mở theo đúng các chuẩn mực quốc tế. Thứ ba, chưa có các chính sách cụ thể để khuyến khích hình thành các mô hình kinh doanh dựa trên hệ sinh thái dữ liệu mở. Đây là yếu tố then chốt quyết định tới sự phát triển bền vững của các dự án triển khai trong Đề án. Tham gia vào hệ sinh thái sẽ không chỉ có các đơn vị tạo lập và chia sẻ dữ liệu, mà cần có cả các đối tác phát triển ứng dụng, cung cấp các dịch vụ giá trị gia tăng trên cơ sở khai thác dữ liệu mở. Họ sẽ liên tục đổi mới, sáng tạo ra những mô hình kinh doanh mới tạo ra giá trị kinh tế để đóng góp ngược trở lại cho hệ sinh thái. 328 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ Thứ tư, các nguyên tắc FAIR chưa được tuân thủ để hướng tới tạo dựng được hạ tầng kĩ thuật đạt chuẩn mức độ 5 hỗ trợ dữ liệu liên kết mở. Hiện tại các dữ liệu được công bố trong Kho dữ liệu mở của Đề án mới đạt chuẩn mức độ 1 (còn sử dụng định dạng pdf không dùng được cho máy đọc). Chuẩn dữ liệu sử dụng trong các kho dữ liệu khác của Đề án thì chưa có các mô tả cụ thể được công bố. Để tránh lãng phí nguồn lực, tất cả các dự án xây dựng mới dữ liệu được khuyến cáo phải xem xét đạt chuẩn tối thiểu mức độ 4. Dữ liệu là nguyên liệu tạo ra các tri thức cho tương lại. Xây dựng hệ sinh thái dữ liệu mở là hướng đi theo đúng xu thế chung trên toàn thế giới. Tuy nhiên nó là công việc rất phức tạp, đòi hỏi sự nhất quán và kiên trì theo đuổi để đạt được mục tiêu trong dài hạn. Khó có thể tạo ra được hệ sinh thái dữ liệu mở có thể mang lại ngay lợi ích kinh tế trong thời gian ngắn hạn. Các cách tiếp cận làm dự án dữ liệu mở chạy theo phong trào sẽ nhanh chóng lỗi thời, hết giá trị sử dụng do không được nuôi dưỡng bởi một hệ sinh thái. Mặc dù có rất nhiều thách thức, nhưng Việt Nam là nước đi sau nên có cơ hội học hỏi kinh nghiệm các nước đi trước để chọn ra được các cách làm đúng, tránh được sự lãng phí trong các đầu tư. TÀI LIỆU THAM KHẢO 1. The World Bank Group, “Starting an Open Data Initiative”, truy cập ngày 20/8/2019 tại https://opendatatoolkit.worldbank.org/en/starting.html 2. European Data Portal, “Creating Value through Open Data”, truy cập ngày 20/8/2019 tại https://www.europeandataportal.eu/en/highlights/ creating-value-through-open-data 3. James Manyika, Michael Chui, Diana Farrell, Steve Van Kuiken, Peter Groves, and Elizabeth Almasi Doshi, “Open data: Unlocking innovation and performance with liquid information”, truy cập ngày 20/8/2019 tại https://www.mckinsey.com/business-functions/digital-mckinsey/our- insights/open-data-unlocking-innovation-and-performance-with-liquid- information 4. Lê Trung Nghĩa, “Rất cần khoa học mở cho CMCN 4.0”. Tạp chí Tia sáng, truy cập ngày 20/8/2019 tại tao/Rat-can-khoa-hoc-mo-cho-CMCN-40--10878 329PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở 5. Thanh Nhàn, “Mở dữ liệu chính phủ - Kinh nghiệm từ Vương quốc Anh”, Tạp chí Thông tin và Truyền thông, truy cập ngày 20/8/2019 tại http:// ictvietnam.vn/tuong-tac/mo-du-lieu-chinh-phu-kinh-nghiem-tu-vuong- quoc-anh.htm 6. Zeleti, F. A., Ojo, A., & Curry, E. (2014). “Emerging Business Models for the Open Data Industry: Characterization and Analysis”. In Proceedings of the 15th Annual International Conference on Digital Government Research (pp. 215–226). 7. Wilkinson, M. D. et al. “The FAIR Guiding Principles for scientific data management and stewardship”, Scientific Data. Vol 3, 2016.

Các file đính kèm theo tài liệu này:

  • pdfxay_dung_he_sinh_thai_du_lieu_mo_cung_cach_mang_cong_nghiep.pdf
Tài liệu liên quan