Số hóa tài liệu lưu trữ

11/12/2015

Bạn đang băn khoan về việc lưu trữ tài liệu, không biết nên lưu trữ như thế nào để an toàn và đảm bảo. Sau đây EcoIT sẽ  cho bạn biết thêm thông tin về các giải pháp số hóa và số hóa tài liệu lưu trữ.

Thông thường chúng ta có những văn bản tài liệu viết bằng tay, những hợp đồng được in trên giấy, hay những bức ảnh kỷ niệm ..vv chúng ta có thể cất giữ cẩn thận để tránh hỏng, mất, và lưu lại làm kỷ niệm hay sử dụng sau này. Nhưng vấn đề đó chỉ giải quyết khi tài liệu của chúng ta ít, và có không gian để bảo quản, giả sử chúng ta muốn lưu trữ kho kiến thức của nhân loại, hay đơn giản một công ty muốn lưu giữ tất cả hợp đồng tài liệu cho các phòng ban của công ty bao gồm kế toán, HCNS,kinh doanh … mỗi phòng sẽ phải cử một người lập và có nhiệm vụ lưu trữ dữ liệu nhưng với một công ty lớn có rất nhiều phòng ban khác nhau các hợp đồng có thể phải sử dụng chung tình trạng thất thoát, mất có thể tránh khỏi.

Số hóa dữ liệu lưu trữ là biện pháp tối ưu,với số hóa dữ liệu giúp giải quyết việc lưu trữ, truy xuất, chia sẻ hay tìm kiếm thông tin hết sức dễ dàng. Cắt giảm chi phí tối đa cho việc quản lý và không gian lưu trữ. Ngoài ra số hóa dữ liệu giúp chúng ta có thể chỉnh sửa và tái sử dụng tài liệu, linh hoạt trong việc chuyển đổi sang các dạng tài liệu số khác nhau.

I. ĐẶC ĐIỂM TÀI LIỆU SỐ HÓA

1. Mục tiêu của việc số hóa tài liệu lưu trữ

Thông qua các công việc cụ thể của việc số hóa dữ liệu, chúng ta mong muốn đạt được các mục đich là xử lý các quy trình nghiệp vụ lưu trữ được tối ưu. Muốn đạt được những mục tiêu đó, các kho lưu trữ phải thực hiện các thao tác thuộc quy trình số hóa tài liệu là chuyển đổi tài liệu lưu trữ dạng thông thường, vẫn quen gọi là tài liệu có “tín hiệu tương tự” (analog) sang dạng tài liệu số, hoặc dữ liệu số (digital). Từ đó, chúng ta đạt được những mục tiêu cơ bản như:

a) Đồng nhất các loại hình tài liệu
Với phương pháp quản lý tài liệu lưu trữ truyền thống, chúng ta phải bảo quản tài liệu với các vật mang tin của từng loại hình tài liệu lưu trữ riêng, như: tài liệu giấy, tài liệu phim ảnh, phim điện ảnh, tài liệu ghi âm…, vì các chế độ bảo quản tài liệu như chế độ nhiệt độ, độ ẩm, ánh sáng khác nhau; hoặc thiết bị phục vụ khai thác, sử dụng từng tài liệu đó cũng khác nhau. Nhưng với dữ liệu số, chúng ta đã loại trừ được hầu hết sự khác biệt đó, tạo thuận lợi cho người sử dụng.
b) Quản lý, khai thác tập trung
Với sự tối ưu đã phân tích trên, đương nhiên, toàn bộ các dữ liệu số hóa, không phân biệt chúng có nguồn gốc từ tài liệu có vật mang tin gì, đều có thể quản lý trong một cơ sở dữ liệu, tạo sự tối ưu cho người sử dụng. Thông qua việc số hóa tài liệu lưu trữ, độc giả không phụ thuộc vào các kho bảo quản riêng biệt tài liệu lưu trữ khác nhau, và không phải gắn mình vào một không gian nhất định của một phòng đọc khi khai thác, sử dụng tài liệu lưu trữ. Từ đó, các cơ quan lưu trữ có thể tạo cho độc giả tăng khả năng tiếp cận, sử dụng tài liệu được nhanh chóng, chính xác và tiện lợi.
c) Kéo dài tuổi thọ của tài liệu lưu trữ bản gốc.
Đây cũng chính là giải pháp của quy trình bảo quản và bảo hiểm tài liệu lưu trữ mà bấy lâu, cơ quan quản lý ngành lưu trữ vẫn đang trăn trở.

2. Khái quát chung

Các năm gần đây, một trong các biện pháp quản lý tài liệu lưu trữ đã được nhắc đến là số hóa tài liệu và trong xã hội đã manh nha thị trường các dịch vụ số hóa tài liệu lưu trữ. Trong bài viết này, tác giả muốn là rõ khái niệm, nội dung số hóa tài liệu, trong đó có tài liệu lưu trữ và những công việc có liên quan đến số hóa tài liệu lưu trữ.
Luật lưu trữ do Quốc hội thông qua ngày 11/11/2011 đã quy định về tài liệu lưu trữ điện tử, không quy định chi tiết đến tài liệu lưu trữ số hóa.
Chúng ta có thể hiểu tóm tắt tài liệu điện tử là một bản ghi được tạo ra, gửi, chuyển giao, nhận được, hoặc lưu trữ, sử dụng bằng phương tiện điện tử. Tài liệu điện tử được hình thành từ hai nguồn chính:
– Một là, bản ghi các thông diệp dữ liệu được khởi tạo từ đầu;
– Hai là, bản ghi các dữ liệu số từ tài liệu truyền thống.
Vậy, tài liệu số hóa có nguồn gốc từ tài liệu điện tử, nhưng không đồng nhất với tài liệu điện tử. Tài liệu số hóa trở thành tài liệu điện tử qua quá trình số hóa dữ liệu. Đây là quá trình chuyển các dạng dữ liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh… sang chuẩn dữ liệu trên các phương tiện điện tử và được các phương tiện đó nhận biết được gọi là số hóa dữ liệu và chúng trở thành dữ liệu số. Từ đó, về mặt lý thuyết, ta hiểu số hóa dữ liệu là quá trình chuyển các dạng dữ liệu truyền thống sang chuẩn dữ liệu trên máy tính và được máy tính nhận biết.

3. Thuận lợi và khó khăn khi số hóa tài liệu lưu trữ

Khi đặt yêu cầu số hóa tài liệu lưu trữ, cũng không nên tuyệt đối hóa một chiều về sự tối ưu của chúng, để chúng ta biết trước các điều kiện nào cần có, để có thể xây dựng được một đề án số hóa tài liệu lưu trữ cho cơ quan mình. Với mục tiêu được đặt ra, ta cần biết được chi tiết những ưu điểm và hạn chế của dữ liệu số hóa.

Giải pháp số hóa

a) Ưu điểm là:
– Giúp việc lưu trữ, truy xuất, chia sẻ, tìm kiếm thông tin một cách dễ dàng. Ưu điểm này bao gồm tổng hoà các thuận tiện trong công tác quản lý, bảo quản, bảo vệ, khai thác và sử dụng tài liệu lưu trữ với một ngân hàng dữ liệu số;
– Linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau. Sự chuyển đổi phổ biến nhất là chuyển đổi định dạng các file tài liệu. Ví dụ, ta đang có một file word, có thể chuyển sang định dạng PDF nhờ một chương trình ứng dụng để chuyển đổi nó. Ứng dụng đó có thể là một chương trình độc lập, hoặc là một kỹ thuật nhúng tích hợp vào chương trình word, hoặc là một ứng dụng on line…Dữ liệu sau khi chuyển đổi sẽ được sử dụng linh hoạt hơn.
– Giảm chi phí tối đa cho việc quản lý tài liệu lưu trữ. Chúng ta hiểu tiết kiệm không gian bảo quản tài liệu lưu trữ một cách tương đối, vì theo quy định của Luật lưu trữ, tài liệu lưu trữ đã được số hóa, vẫn phải bảo quản an toàn tài liệu bản gốc.
– Có khả năng chỉnh sửa và tái sử dụng dữ liệu. Ở thuận lợi này ta cần hiểu “khả năng chỉnh sửa” theo đúng nguyên tắc quản lý tài liệu lưu trữ là không được chỉnh sửa nội dung tài liệu, mà chỉ chỉnh sửa chất lượng mang tin, như tài liệu bị mờ, bị hư hỏng nặng cần chỉnh sửa…
b) Những hạn chế cần khắc phục của tài liệu số hóa là:
– Khi bắt đầu xây dựng một đề án số hóa tài liệu lưu trữ, cần phải đầu tư ban đầu về công nghệ, cơ sở hạ tầng công nghệ thông tin và các thiết bị khác, ví dụ, cần phải đầu tư mua sắm, hoặc thuê từng phần các thiết bị phần cứng như máy tính, máy in, máy quét ảnh và các chương trình phần mềm để quản lý và tra tìm tài liệu. Khi đã có đầy đủ các thiết bị phần cứng, phần mềm, việc thực hiện số hóa tài liệu có thể thuê các cơ quan chuyên môn thực hiện. Ngoài ra, điều rất quan trọng là phải đầu tư cho yêu cầu đào tạo con người theo các mức độ khác nhau như đào tạo công chức làm quản lý, công chức, viên chức tác nghiệp và những cán bộ kỹ thuật, cán bộ chuyên tin.
– Bất tiện thứ hai là dữ liệu số hóa dễ bị sao chép và sửa đổi trái phép. Điều này có thể khắc phục giản đơn đối với những người chuyên làm công tác quản trị mạng, nhưng không giản đơn đối với toàn bộ công chức, viên chức của cả một cơ quan, tổ chức có sử dụng cơ sở dữ liệu số hóa. Với phương pháp bảo vệ dữ liệu ở ba cấp: cấp mạng, cấp cơ sở dữ liệu và cấp người sử dụng, người ta có thể loại trừ được sự bất tiện này. Nhưng một cơ quan đông người, rất khó có thể quản lý được từng người ở từng cấp. Ví dụ, cấp độ 3 là bảo vệ dữ liệu ở người sử dụng, một số người trong cơ quan tổ chức được quyền miễn trừ nguyên tắc này để họ có đủ quyền, kể quyền quản trị cơ sở dữ liệu. Nhưng chính một số cá nhân có quyền quản trị mạng lại sao chép cho riêng mình toàn bộ cơ sở dữ liệu thì sao (?)…
– Khó khăn thừ ba, cũng như đã đề cập một phần ở phần viết trên là, việc triển khai sử dụng cơ sở dữ liệu số hóa phải đào tạo đồng bộ và có hệ thống để tất cả cán bộ công chức, viên chức của cơ quan, tổ chức đều có thể sử dụng được tài liệu số đúng phương pháp và nguyên tắc.
– Một khó khăn có liên qua đến vấn đề đã nêu, là chế độ bảo mật dữ liệu. Thông thường, tài liệu còn chế độ mật thì chưa được số hóa. Nhưng sự phân biệt giữa tài mật và không mật chỉ là tương đổi. Nhiều tài liệu được sử dụng rộng rãi, nhưng qua diễn biến xã hội ở trong nước và quan hệ quốc tế, tài liệu đó có thể phục hồi độ mật. Vì vậy, trong một sơ sở dữ liệu, có thể không bị mất dữ liệu, hoặc không bị sao chép, nhưng bị lộ thông tin tài liệu mật.

>> Xem thêm bài viết khác :  Giải pháp về chính quyền điện tử

II. QUY TRÌNH SỐ HÓA TÀI LIỆU

Do mục tiêu số hóa tài liệu khác nhau, mà có thể đặt ra các bước số hóa tài liệu khác nhau phù hợp đối với từng cơ quan, tổ chức. Cục Văn tthư và Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu lưu trữ chỉ giản đơn có 5 bước là:

Bước 1. Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa. Việc lựa chọn này là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu trữ. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, thì tài liệu được chọn phải là tài liệu thuộc diện quý, hiếm theo quy định của pháp luật.

Bước 2. Chuẩn bị tài liệu. Công việc bao gồm:
– Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu; Phân loại TL, tách riêng những TL rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ thuật scan từng tờ tài liệu. Nếu việc số hóa các tư liệu lưu trữ dạng đóng quyển, thì có thể áp dụng công nghệ mới tiến bộ hơn như Bookscan cho việc số hóa tài liệu lưu trữ.

Bước 3. Scan và thiết lập hệ thống ảnh; đặt tên file; đặt định dạng; đóng, ghim lại theo tổ chức tài liệu ban đầu; tạo siêu siêu dữ liệu (metadata).
Đây là bước quyết định nhất để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được lập và nhúng (gắn) và tài liệu thông qua một phần mềm ứng dụng và tạo ra metadata. Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước.

Bước 4. Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh không đạt yêu cầu.

Bước 5. Nghiệm thu, bàn giao tài liệu lưu trữ.
Công việc bao gồm bàn giao tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa là tài liệu lưu trữ của một Lưu trữ lich sử thì với những văn bản không đóng quyển trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để bảo đảm đầy đủ như tài liệu ban đầu đã nhận ở bước 1.

Vậy số hóa tài liệu lưu trữ là gì?

Số hóa dữ liệu lưu trữ là hình thức chuyển đổi dữ liệu từ dạng văn bản hệ thống bên ngoài thành những dữ liệu dạng tín hiệu số được máy tính hiểu và lưu trữ.
Mô hình chuyển đổi dữ liệu từ dạng văn bản giấy tờ sang dạng số :

Số hóa dữ liệu lưu trữ là giải pháp tốt nhất cho một văn phòng điện tử :
– Giảm không gian lưu
– Tránh việc mất, nhàu nát tài liệu trong quá trình lưu trữ
– Lưu trữ, quản lý tài liệu vĩnh viễn
– Giảm thời gian tìm kiếm tài liệu
– Chia sẻ thông tin nhanh chóng
– Tăng cường khả năng bảo mật thông tin
– Nâng cao hiệu quả công việc do tập hợp các thông tin đưa đến một cách nhanh chóng và kịp thời.
– Chi phí vận hành và quản lý thấp và hiệu quả.
Đã đến lúc doanh nghiệp bạn chuyển đổi cách lưu trữ văn bản truyền thống sang dạng lưu trữ điện tử để giảm tải không gian và tiết kiệm chi phí bảo quản. Hiện nay thị trường số hóa dữ liệu lưu trữ là mới đối với các doanh nghiệp Việt Nam vì vậy các doanh nghiệp cần đánh giá, lựa chọn các nhà cung cấp có uy tín, có khả năng cung cấp giải pháp số hóa một cách tổng thể chứ không đơn thuần dừng lại ở việc cung cấp các máy scan tài liệu đồng thời khách hàng cũng cần hiểu rõ nhu cầu để có sự lựa chọn phù hợp:
– Bạn sẽ số hóa những loại tài liệu gì?
– Số lượng tài liệu cần số hóa dữ liệu trong khoảng thời gian bao lâu.
– Mục đích số hóa dữ liệu chính của bạn là gì? (truy cập, vận hành hiệu quả, tăng doanh thu…)
– Kích thước tài liệu bạn muốn scan?
– Bạn cần chất lượng scan? (độ phân giải?, 1 mặt hay 2 mặt?…)
– Loại định dạng đầu ra mong muốn của bạn? (TIFF, JPEG, PDF…?)
– Ngân sách để tiến hành số hóa dữ liệu?

Ngày nay, sự phát triển mạnh mẽ của công nghiệp, công nghệ thông tin đã tạo ra hàng loạt các sản phẩm công nghệ phần cứng, công nghệ phần mềm và công nghệ nội dung. Các loại hình sản phẩm này đã tác động và làm biến đổi về chất các loại hình thư viện truyền thống. Dần hình thành loại hình “Thư viện số”/“Thư viện điện tử (electronic library)/ “Thư viện ảo” (virtual library),… Một trong các yếu tố để xây dựng, duy trì và phát triển loại hình thư viện này là nguồn tài liệu số/tài nguyên tri thức dạng số. Có thể nói, nguồn tài nguyên thông tin số là huyết mạch/linh hồn của thư viện số. Mục tiêu của bất kỳ Thư viện số nào là tạo ra một cổng thông tin truy cập trực tuyến đến tài nguyên số không chỉ của thư viện đó mà đến bất kỳ Thư viện số nào khác ở bất cứ đâu. Do đó, việc triển khai xây dựng Bộ sưu tập tài nguyên thông tin số là bước đi đầu tiên, quan trọng nhất để phát triển thư viện số. Khi các thư viện đã có Bộ sưu tập số sẽ tiến hành liên thông chia sẻ phục vụ cộng đồng người dùng tin trực tuyến.

Khi nói về thư viện số và nguồn tài nguyên tri thức số, ngay từ năm 1998, Liên đoàn thư viện số (Digital Libraries Federation V DLF) đã khẳng định: “Các thư viện số là các tổ chức cung cấp nguồn lực, trong đó bao gồm các chuyên gia (những người có kiến thức và kỹ năng làm việc trong môi trường số), để lựa chọn thông tin, cấu trúc hóa, đưa ra các phương thức truy cập và phân phối thông tin hiệu quả, cũng như đảm bảo sự toàn vẹn và của bộ sưu tập số sao cho chúng luôn sẵn sàng và kinh tế để phục vụ một cộng đồng cụ thể hoặc một nhóm cộng đồng

Công tác số hóa tài liệu là khâu thực sự quan trọng của một thư viện điện tử
Công tác số hóa tài liệu là khâu thực sự quan trọng của một thư viện điện tử

Để có Bộ sưu tập số hay nói cách khác muốn tạo lập, phát triển kho tài nguyên tri thức dạng số có 03 cách:

Cách thứ nhất: Truy cập, khai thác từ việc liên kết đến các nguồn tài liệu số có cùng nội dung thông tin/thông tin chuyên biệt (thông tin Y học, thông tin về Luật học) trên Internet

Cách thứ hai: Mua tài nguyên thông tin điện tử từ các nhà cung cấp/xuất bản/cá nhân (trước khi in ra giấy) hoặc trao đổi với các đối tác

Cách thứ ba: Tổ chức số hóa nguồn tài nguyên thông tin truyền thống bằng phương pháp quét hay nhập lại thông tin từ bàn phím của máy tính điện tử.

Trong ba cách trên, cách thứ ba là quan trọng nhất bởi lẽ: Mỗi một cơ quan thông tin, thư viện đều có thế mạnh riêng/bản sắc riêng nhờ vào đặc điểm vốn tài liệu mình đang lưu giữ. Đặc biệt là đặc điểm về nội dung của các loại hình tài liệu (Tài liệu quý, xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế & xã hội hiếm, có giá trị chất xám cao). Nếu số hóa được nguồn tài liệu này, xây dựng được bộ sưu tập số là vốn quý để duy trì và phát triển thư viện của mình. Từ đây, nhiều người của cộng đồng truy cập sẽ biết đến để chia sẻ khai thác nhiều lần, sử dụng nhiều lần.

>> Xem thêm thông tin:  Giải pháp nhận dạng dữ liệu

Trên đây là những chia sẻ của ecoIT về số hóa tài liệu lưu trữ. Các bạn có thể xem thêm thông tin chi tiết tại http://ecoit.asia/