Lập chỉ mục cho nguồn tài nguyên giáo dục mở (OER)

Việc sử dụng máy tính cho đào tạo đã dẫn đến một sự thay đổi đáng

kể trong giảng dạy. Sự phát triển này đã dẫn đến sự gia tăng nguồn tài

nguyên học tập kỹ thuật số. Để tìm kiếm nguồn tài nguyên này một cách

đầy đủ và chính xác cần có thêm sự hỗ trợ của các chuyên gia thông

tin – thư viện bởi họ sẽ là người giúp cho nguồn tài nguyên này được

sắp xếp, lưu trữ và phổ biến dễ dàng nhất đến người sử dụng. Trong quá

trình tìm kiếm, sử dụng nguồn tài nguyên OER, để kiểm soát nội dung,

để tránh nội dung trùng lặp hay để tìm một khía cạnh trong nội dung

trong OER, cần thiết phải tạo cho chúng một bảng chỉ mục. Bảng chỉ

mục giúp người dùng lựa chọn lĩnh vực, nội dung cần tìm.

pdf7 trang | Chia sẻ: Thục Anh | Ngày: 19/05/2022 | Lượt xem: 248 | Lượt tải: 0download
Nội dung tài liệu Lập chỉ mục cho nguồn tài nguyên giáo dục mở (OER), để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
LẬP CHỈ MỤC CHO NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ (OER) Nguyễn Thị Minh Phượng1 MỞ ĐẦU Việc sử dụng máy tính cho đào tạo đã dẫn đến một sự thay đổi đáng kể trong giảng dạy. Sự phát triển này đã dẫn đến sự gia tăng nguồn tài nguyên học tập kỹ thuật số. Để tìm kiếm nguồn tài nguyên này một cách đầy đủ và chính xác cần có thêm sự hỗ trợ của các chuyên gia thông tin – thư viện bởi họ sẽ là người giúp cho nguồn tài nguyên này được sắp xếp, lưu trữ và phổ biến dễ dàng nhất đến người sử dụng. Trong quá trình tìm kiếm, sử dụng nguồn tài nguyên OER, để kiểm soát nội dung, để tránh nội dung trùng lặp hay để tìm một khía cạnh trong nội dung trong OER, cần thiết phải tạo cho chúng một bảng chỉ mục. Bảng chỉ mục giúp người dùng lựa chọn lĩnh vực, nội dung cần tìm. 1. KHÁI NIỆM LẬP CHỈ MỤC Lập chỉ mục hay index là thuật ngữ được sử dụng để diễn tả về quá trình thu thập, thu dữ liệu từ máy tìm kiếm đối với các trang web hiện nay. Sau khi thu thập được dữ liệu từ các trang này, máy tìm kiếm sẽ bắt đầu đưa ra những đánh giá cũng như là lưu chúng lại trong cơ sở dữ liệu mà mỗi công cụ tìm kiếm. Khi chỉ mục đã được lập, thông tin đã được lưu trữ, lúc này khi người dùng họ tìm kiếm với các từ khóa, các kết quả sẽ được hiển thị và những kết quả này sẽ được truy xuất từ nguồn dữ liệu đã được lưu trữ, lập chỉ mục trước đó. Theo Viện Công nghệ Thông tin, trong Thuyết minh tiểu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn văn) [1]: 1 Thư viện Học viện Hành chính Quốc gia. 356 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ “Thuật ngữ tạo lập chỉ mục trong ngôn ngữ của ngành thông tin – thư viện được gọi là định chỉ mục. Định chỉ mục là một quy trình xử lý nội dung tài liệu được áp dụng rộng rãi trong các thư viện và cơ quan thông tin nhằm tạo ra các bảng chỉ mục cho phép người dùng có thể truy cập thông tin và có thể tìm kiếm, thu thập thông tin có nghĩa theo chủ đề và từ khóa” (tr.5). 2. TẠI SAO CẦN LẬP CHỈ MỤC TÀI NGUYÊN GIÁO DỤC MỞ? Tài nguyên giáo dục mở là nguồn tài nguyên được sử dụng trong quá trình giảng dạy, đào tạo, học tập. Tài nguyên này có những đặc điểm sau: - Tự do mở (trên web) - Tái sử dụng - Dễ thích nghi, độ tin cậy cao, dễ quản lý - Có thể hoán đổi, đánh giá, tái sử dụng - Được mô tả bởi các siêu dữ liệu Đối với các OER có kích thước vừa và nhỏ, việc lập chỉ mục (index) là không cần thiết, thậm chí càng làm cho tài liệu thêm rắc rối, phức tạp. Thế nhưng trong các OER có khối lượng văn bản lớn, khi muốn tìm đọc lại một chi tiết liên quan đến chủ đề nào đó ta sẽ phải lật qua lật lại dò tìm rất tốn thời gian. Vì thế, để dễ dàng tìm kiếm, cần tổ chức một bảng chỉ mục mà ở đó các đề mục, các từ chuyên môn được sắp xếp theo vần ABC, kèm theo những chỉ dẫn cho biết được đề cập ở trang nào. Tại sao phải lập chỉ mục tài nguyên giáo dục? Câu trả lời là để tìm thấy chúng. OER có sẵn một cách tự do trên web. Việc sử dụng chúng là rất quan trọng nhưng cũng đặt ra một số vấn đề: Làm thế nào để tìm ra nguồn tài nguyên này? Đây có phải là nguồn OER mới được cập nhật hay không? v.v... Chính những mô tả về OER thông qua lập chỉ mục mà người dùng có thể nhận biết được. Lập chỉ mục đảm bảo khả năng tiếp cận thông qua trao đổi, khả năng tương tác giữa các hệ thống. Việc lập chỉ mục cho OER giúp: - Lập chỉ mục nhằm quy định các nguồn OER; - Xác định vai trò, đặc điểm của OER trong việc phân phối, tái sử dụng; 357PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở - Lập chỉ mục giúp việc quản lý nguồn OER dễ dàng, có độ tin cậy cao; - Bảo đảm tính bền vững, khả năng tương tác và cởi mở của các nguồn OER. - Quản lý và thực hiện tốt việc học tập, giáo dục và đào tạo. Do đó mà việc lập chỉ mục cho OER là cần thiết. 3. THỰC HIỆN VIỆC LẬP CHỈ MỤC CHO OER Chỉ mục là bảng dữ liệu hay cấu trúc dữ liệu dùng để xác định vị trí của các dòng tệp theo điều kiện nào đó hay nói cách khác chỉ mục là một cách tìm kiếm thông tin. Xây dựng chỉ mục là một trong những nhiệm vụ quan trọng nhất khi xây dựng một CSDL. Trong đó, mỗi tài liệu chứa một thuật ngữ chỉ mục và mỗi một thuật ngữ chỉ mục xuất hiện ở một dòng. Việc sử dụng các tiêu chuẩn là bắt buộc. Do đó, OER phải được xây dựng theo chuẩn và phải có chỉ dẫn để dễ dàng tìm ra, trong đó bắt buộc các siêu dữ liệu phải tuân theo tiêu chuẩn. Tiêu chuẩn cụ thể cho phép dễ dàng tìm kiếm các nguồn tài nguyên giáo dục chính là việc mô tả siêu dữ liệu theo Dublin Core hay Learning Object Metadata (LOM). Dù mô tả theo tiêu chuẩn nào, tài nguyên giáo dục mở cũng phải đề cập đến các yếu tố: - Nguồn gốc OER - Phiên bản khác nhau của OER - Mối quan hệ với các nguồn khác - Các tính năng giáo dục khái quát của đối tượng có liên quan Một ví dụ đơn giản. Cần tìm một bài giảng dưới dạng PowerPoint. Điều gì sẽ xảy ra nếu bài giảng này biến mất? Có thể do phiên bản đang thay đổi hoặc tài liệu không còn có thể đọc được hoặc đã bị mất. Nếu dữ liệu nguồn vẫn được giữ, nội dung bài giảng vẫn truy cập được ngay cả khi màn hình bị mất. Tương tự như vậy, để chỉ mục tồn tại trong phần mềm và phần cứng nó phải theo nền tảng tiêu chuẩn. Tiêu chuẩn giúp duy trì tính bền vững của tài nguyên. Chỉ mục đảm bảo khả năng tiếp cận và thông qua trao đổi, khả năng tương tác giữa các hệ thống. Tài nguyên sau đó có thể được tái sử dụng và thích nghi. 358 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ Trong một thế giới mở, nơi khả năng tương tác là cần thiết, trong đó tổng hợp các nguồn tài nguyên được yêu cầu, việc sản xuất các siêu dữ liệu là điều cần thiết để có thể tìm ra nguồn lực. Chỉ mục tìm kiếm chứa thông tin từ tất cả các nguồn OER đó. Chỉ mục tìm kiếm được xây dựng bằng cách tìm kéo nội dung trên mỗi nguồn OER. Trình tìm kéo chọn nội dung và siêu dữ liệu từ các tài liệu trong biểu mẫu được tìm kéo thuộc tính. Để lấy nội dung và siêu dữ liệu từ các tài liệu được chỉ mục tìm kiếm, các thuộc tính được tìm kéo phải được ánh xạ thuộc tính được quản lý. Thuộc tính được quản lý chỉ được giữ trong chỉ mục. Điều này có nghĩa là người dùng chỉ có thể tìm kiếm trên thuộc tính được quản lý. Điều đó giúp người dùng thuận tiện trong việc cập nhật nguồn OER mới hay cũ, đã được cập nhật hay chưa. Khi đã thay đổi thuộc tính được quản lý, hoặc khi đã thay đổi việc tìm kéo và được quản lý thuộc tính, trang phải được tìm kéo lại trước khi thay đổi và sẽ được phản ánh trong chỉ mục tìm kiếm. Vì các thay đổi được thực hiện trong lược đồ tìm kiếm, chứ không phải cho trang thực tế, trình tìm kéo sẽ không tự động lại lập chỉ mục cho nguồn OER. Để đảm bảo rằng các thay đổi được tìm kéo và đầy đủ lại chỉ mục, phải yêu cầu một lập lại chỉ mục của trang. Nội dung trang được tìm kéo lại và lại chỉ mục sao cho có thể bắt đầu sử dụng các thuộc tính được quản lý trong truy vấn, quy tắc truy vấn và hiển thị mẫu. “Nếu tạo một Index trên cột khóa chính và sau đó tìm kiếm một dòng dữ liệu dựa trên một trong các giá trị của cột này: - Đầu tiên SQL Server sẽ tìm giá trị này trong Index. - Sau đó sử dụng Index để nhanh chóng xác định vị trí của dòng dữ liệu cần tìm. Các loại Index gồm có: Clustered Index: lưu trữ và sắp xếp dữ liệu vật lý trong table hoặc view dựa trên các giá trị khóa của chúng. Các cột khóa này được chỉ định trong định nghĩa index. Mỗi table hoặc view chỉ có duy nhất một Clusterd Index vì bản thân các dòng dữ liệu được lưu trữ và sắp xếp theo thứ tự vật lý dựa trên các cột trong loại Index này. 359PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở Khi dữ liệu trong table hoặc view cần được lưu trữ và sắp xếp theo một thứ tự nhất định chính là lúc cần dùng đến Clustered Index. Một bảng có một Clusted Index thì table được gọi là Clustered Table. Nếu không, các dòng dữ liệu của bảng được lưu trong một cấu trúc không được sắp xếp gọi là HEAP. Non-Clustered: có một cấu trúc tách biệt với dòng dữ liệu trong table hoặc view. Mỗi một Index loại này chứa các giá trị của các cột khóa trong khai báo của Index, và mỗi một bản ghi giá trị của khóa trong index này chứa một con trỏ tới dòng dữ liệu tương ứng của nó trong table. Mỗi con trỏ từ một dòng của Non-Clustered Index tới một dòng dữ liệu trong table được gọi là “row locator”. Cấu trúc của row locator phụ thuộc vào việc các trang dữ liệu được lưu trong HEAP hay trong một Clustered Table. Đối với HEAP, row locator là một con trỏ tới dòng dữ liệu, với clustered table, row locator chính là khóa index của clustered index. Unique Index: Là kiểu Index dùng để đảm bảo tính duy nhất trong các cột được tạo Index. Nếu Index loại này được tạo dựa trên nhiều cột, thì tính duy nhất của giá trị được tính trên tất cả các cột đó, không chỉ riêng rẽ từng cột. Composite Index: Là kiểu Index có nhiều hơn 1 cột. Trong SQL Server 2005 và 2008, có thể có đồng thời tối đa 16 cột trong một Index, miễn là kích thước của Index không vượt quá giới hạn 900 byte. Cả hai kiểu index cơ sở là Clustered Index và Non Clustered Index cũng có thể đồng thời là là kiểu Composite Index.” (xem slide bài giảng thiết kế cơ sở dữ liệu, Đỗ Thị Mai Hường). Lập chỉ mục cho các từ khi chúng xuất hiện chính xác trong tìm kiếm. Chỉ ra và nhập các lĩnh vực trên chỉ mục. Do đó cần sử dụng các từ vựng có kiểm soát. Không sử dụng các tiền tố và hậu tố. Ví dụ như trong tiếng Anh, không dùng các mạo từ như: a, an, the... Trong tiếng Pháp không dùng: un, une, des, le, la, les... trong các từ chỉ mục. Vì vậy, cần thiết phải lập từ điển hỗ trợ nhằm bảo đảm tính thống nhất. Với tài liệu tiếng nước ngoài, hiện nay nhiều thư viện trên thế giới đang sử dụng công nghệ Rosette Linguistics Platform để xử lý việc tách từ 360 XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ tự động cho các ngôn ngữ. Đây là công nghệ được thiết kế cho các hệ thống quy mô lớn để xác định, phân loại, phân tích, lập chỉ mục và tìm kiếm văn bản bằng các ngôn ngữ châu Á, châu Âu. Mô hình Rosette Linguistics Platform Nguồn truy cập chi-muc-voi-thu-vien.html ngày 30/07/2017/ 4. MỘT SỐ VẤN ĐỀ TRONG LẬP CHỈ MỤC OER Trong một số trường hợp khi đặt chỉ mục, mô tả, định dạng tập tin... sẽ gặp phải một số vấn đề liên quan đến việc chuyển dữ liệu. Nhắc đến việc lập chỉ mục đối với OER, ta sẽ nghĩ ngay đến google bởi google đang là công cụ hỗ trợ tìm kiếm mạnh nhất hiện nay. Index google là quá trình lưu lại số liệu, dữ liệu từ các website được các máy nhện thu thập, lưu lại trong cơ sở dữ liệu của google. Nếu lập chỉ mục trên google, các chỉ mục này được thống kê thành danh sách và khi tìm kiếm sẽ dễ dàng nhận được kết quả. Tuy nhiên, máy nhện chỉ làm nhiệm vụ thu thập về, nên kết quả tìm thường không chính xác hoặc không như mong muốn của người tìm. Tóm lại, OER vẫn là chủ đề đang được nghiên cứu để đưa vào ứng dụng trong giảng dạy tại Việt Nam. Để OER đi vào thực tiễn, rất cần 361PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở sự quan tâm, nghiên cứu của nhiều tổ chức ở mọi lĩnh vực và trong đó không thể thiếu ngành thông tin – thư viện. Ngành thông tin – thư viện cần nghiên cứu để việc xử lý, sắp xếp nguồn tài nguyên này, tạo thuận lợi cho người dùng trong việc khai thác và sử dụng hiệu quả để từ đó không ngừng nâng cao chất lượng giảng dạy và học tập. TÀI LIỆU THAM KHẢO 1. Viện Công nghệ Thông tin - Đại học Quốc gia (2017), Thuyết minh tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn văn) 2. Đỗ Thị Mai Hường (2016), Tập bài giảng thiết kế cơ sở dữ liệu, Khoa Thông tin, Học viện Kỹ thuật Quân sự. 3. Bourda Yolaine (2004), Pourquoi indexer les resources pedagogiques numériques?, 4. Commonwealth (2015), Lignes directrices pour les resources éducatives libres (REL) dans l’enseignement supérieure 5. Grégoire, Robert (2016), Référentiel de compétences REL (resources éducatives libres), Paris, 2016.

Các file đính kèm theo tài liệu này:

  • pdflap_chi_muc_cho_nguon_tai_nguyen_giao_duc_mo_oer.pdf
Tài liệu liên quan