Tìm hiểu về các loại cơ sở dữ liệu trong thông tin học
Cơ sở dữ liệu (CSDL) là tập hợp các dữ liệu về các đối tượng cần được quản lý, được lưu trữ đồng thời trên các vật mang tin của máy tính điện tử và được quản lý theo một cơ chế thống nhất, nhằm giúp cho việc truy nhập và xử lý dữ liệu được dễ dàng và nhanh chóng.
CSDL được quản lý bởi một hệ quản trị CSDL. Đó là một hệ thống các phần mềm, bao gồm các chương trình giúp người sử dụng quản lý và khai thác CSDL theo ba chức năng sau: Mô tả dữ liệu; Cập nhật dữ liệu; Tìm kiếm dữ liệu.
Có nhiều cách phân loại CSDL. Trong lĩnh vực thông tin - thư viện, căn cứ theo bản chất của thông tin được lưu giữ, người ta phân biệt ba loại CSDL chính sau:
CSDL thư mục
Dữ liệu trong CSDL thư mục là tin tức về bản thân tài liệu. Chúng chứa các thông tin cấp hai, tức là các dữ liệu thư mục và các dữ liệu bổ sung, chứ không phải là văn liệu gốc. CSDL thư mục được trình bày tương tự như trong ấn phẩm thư mục hay trong tạp chí tóm tắt. Nó bao gồm các dữ liệu thư mục (tác giả, nhan đề, các yếu tố xuất bản, các đặc trưng số lượng,...), các chỉ số phân loại, tóm tắt, chú giải, từ khóa... Đối tượng xử lý là các tài liệu chuyên khảo, bài trích báo, tạp chí, kỷ yếu hội nghị, hội thảo khoa học, báo cáo khoa học, luận án, sáng chế... Nói tóm lại là mọi đối tượng đã được tư liệu hoa.
CSDL thư mục bao gồm các tra cứu về tài liệu gốc, cùng với các chỉ dẫn giúp người dùng tin có thể nhận được tài liệu gốc ở một thư viện.
Các CSDL thư mục đưa lại nhiều lợi ích. Trước hết nó cho phép người sử dụng truy nhập trực tiếp và tức thì các thông tin thư mục trong kho dữ liệu và thông tin cần tìm hiển thị ngay trên màn hình. Mặt khác nó cho phép tạo ra nhiều sản phẩm trung gian như là những sản phẩm đầu ra của CSDL, đó là các ấn phẩm thư mục, các tạp chí tóm tắt, các bộ phiếu mục lục hay các tài liệu vi dạng (microfilm, microfiche).
CSDL dữ kiện
Khác với CSDL thư mục, CSDL dữ kiện chứa các thông tin cấp một. Nội dung thông tin chứa trong CSDL là các thông tin dữ kiện. Đó là các số liệu hay các dữ kiện cụ thể về các đối tượng, các quy trình hoặc phương pháp. Thông tin dữ kiện được lưu trữ chủ yếu dưới dạng số, ngoài ra cũng được trình bày dưới dạng văn bản, hình ảnh, biểu đồ, đồ thị,...
Trong CSDL dữ kiện, thông tin đã được xử lý, biên tập và có thể dùng trực tiếp, không cần tới một nguồn dữ liệu bổ sung nào. Lợi ích của nó là người dùng tin không cần mất thời gian tìm đến tài liệu gốc. Điều đó làm cho CSDL dữ kiện trở thành một công cụ hữu ích cho các nhà quản lý, các nhà khoa học và các kỹ sư.
CSDL toàn văn
CSDL toàn văn là sự mở rộng logic tới các hệ thống thông tin hiện đại. Chúng chứa các thông tin cấp một, đó là toàn văn bản của tài liệu cùng với các dữ liệu thư mục và các dữ liệu chủ đề khác. Ngày nay một số tạp chí và dịch vụ báo chí đã được cung cấp dưới dạng CSDL toàn văn. Đó là trường hợp của các báo điện tử.
CSDL toàn văn có nhược điểm là nó không chứa các bảng biểu và các hình ảnh minh họa. Ngoài ra CSDL toàn văn đòi hỏi phải có bộ nhớ với dung lượng lớn, đầu tư ban đầu tốn kém. Tuy nhiên ngày nay, với sự phát triển của CNTT, vấn đề này đã và đang được giải quyết.
Các CSDL toàn văn đã cải thiện đáng kể việc cung cấp các nguồn thông tin cấp một, mở ra triển vọng mới trong hoạt động của các hệ thống giao lưu thông tin.
Các phân loại CSDL khác
Theo phạm vi bao quát của đề tài, các CSDL phân thành: CSDL đa ngành, CSDL đơn ngành, CSDL theo chủ đề. Ví dụ: CSDL mỏ và địa chất, CSDL về môi trường, CSDL về dân số...
Các CSDL cũng có thể phân theo loại hình tài liệu. Những CSDL này thường hướng vào một loại hình tài liệu cụ thể và thường có nội dung đa ngành. Ví dụ: CSDL sách, CSDL tạp chí, CSDL về các phát minh sáng chế, CSDL về các công trình khoa học, v.v...
Các CSDL được lưu trữ trong bộ nhớ của máy tính điện tử, tức là ghi trên các băng từ, đĩa từ. Từ đó CSDL cũng có thể được xuất bản dưới dạng một ấn phẩm, tức là được ghi ra trên giấy. Ngày nay, với sự phát triển của công nghệ thông tin hiện đại, CSDL còn được ghi và lưu trữ trên đĩa quang CD-ROM. Các CSDL toàn văn trên CD-ROM có thể lưu trữ các thông tin dưới dạng văn bản, âm thanh, hình ảnh tĩnh và động và truy nhập rất thuận lợi.
Với những ưu điểm nổi bật như kích thước nhỏ, dung lượng lớn, độ bền cao, có phần mềm khai thác thông tin ghi ngay trên đĩa... các CD-ROM cơ sở dữ liệu trở thành một sản phẩm thông tin quan trọng, không thể thiếu được trong các dịch vụ phổ biến thông tin hiện nay.
Những CSDL đầu tiên xuất hiện vào cuối những năm 60 và nhanh chóng trở thành một nguồn thông tin mới bên cạnh các kho lưu trữ thông tin truyền thống của các thư viện và cơ quan lưu trữ. Sự ra đời và phát triển của các CSDL tạo nên một biến chuyển về chất trong hoạt động của các cơ quan thông tin - thư viện.