Con người giải quyết bài toán bùng nổ thông tin
Kiến thức - Học thuật - Ngày đăng : 20:15, 11/08/2024
Con người giải quyết bài toán bùng nổ thông tin
Để đáp ứng với dòng thông tin tư liệu gia tăng không ngừng do bùng nổ thông tin gây ra, những cơ quan thông tin được phát triển theo ba hướng.
Đầu tiên là mở rộng số lượng và quy mô; tiếp đó là đa dạng hoá và chuyên môn hoá; cuối cùng là tiếp thu và sử dụng các kỹ thuật và công nghệ thông tin mới.
Áp lực với khối lượng thông tin nhiều như núi
Sự mở rộng về số lượng và quy mô dẫn đến việc hình thành những kho sách khổng lồ của những thư viện lớn. Theo số liệu cách đây 20 năm, hồi tháng 1.2005, Thư viện Quốc hội Mỹ (Library of Congress) sở hữu 128 triệu đầu tài liệu, trong đó có 29 triệu sách và tài liệu in khác, 12 triệu ảnh, 4,8 triệu bản đồ, 57 triệu bản viết tay, 2,7 triệu đĩa băng ghi âm, ghi hình. Các tài liệu này xếp trên giá dài tới 700 km. Trong khi đó Thư viện Nhà nước Anh (The Bristish Library) quản lý 150 triệu đầu tài liệu, xếp trên giá dài tới 625 km, và mỗi năm giá sách này lại dài thêm 12 km. Các Thư viện Quốc gia Pháp, Thư viện Nhà nước Nga cũng quản lý những khối lượng tài liệu rất lớn.
Sự đa dạng hoá và chuyên môn hoá thể hiện ở sự mở rộng chức năng, gia tăng công chúng phục vụ, những sản phẩm thông tin và phạm vi hoạt động. Nhiều tổ chức thông tin mới hình thành như những cơ sở dữ liệu và ngân hàng dữ liệu. Chúng lưu trữ thông tin ở mức độ rộng lớn chưa từng thấy.
Cuối cùng là sự đổi mới kỹ thuật. Thật vậy, sự bùng nổ thông tin tương đương với sự bùng nổ công nghệ. Đặc biệt trên ba lĩnh vực liên hệ chặt chẽ với công tác thông tin tư liệu là: tin học, viễn thông và vi xử lý.
Sự xuất hiện của máy tính điện tử trong việc xử lý thông tin tư liệu mới diễn ra trong vòng 40 năm nay. Được tạo thành bởi những thiết bị vào ra dữ liệu, vận hành với tốc độ cực nhanh, với những bộ nhớ gần như không hạn chế, một bộ tính toán không thể nhầm lẫn, máy tính điện tử đã mở ra hướng mới, đầy triển vọng cho việc xử lý thông tin.
Hệ quả của việc sử dụng máy tính điện tử trong công tác thông tin tư liệu thật là to lớn: tập trung thông tin trong những bộ nhớ lớn, những cơ sở dữ liệu và ngân hàng dữ liệu; tăng nhanh tốc độ ở tất cả các công đoạn xử lý thông tin; đảo ngược quá trình chuyển giao thông tin (không phải người dùng tin và tư liệu di chuyển mà là thông tin di chuyển); yêu cầu thông tin có thể đặt ra từ xa, xuất phát từ một đầu cuối, nối với bộ phận trung tâm.
Sự phát triển của những bộ nhớ lớn truy đạt trực tiếp tạo cho khả năng tra cứu ngay, tại thời điểm bất kỳ những thông tin mà người dùng tin yêu cầu. Sự tiến bộ về chất trong quan hệ giữa người và máy, cùng với giá thành ngày càng hạ giúp cho việc sử dụng máy tính trong công tác thông tin tư liệu ngày càng trở nên phổ cập.
Sự kết hợp giữa máy tính và viễn thông hình thành nên ngành tin học viễn thông (télématique) là một trong những yếu tố cho sự phát triển các hệ thống và mạng lưới thông tin tự động hoá. Các hệ thống này được phát triển theo hai hướng:
Thứ nhất là các mạng truyền dữ liệu, là mạng thông tin được tạo thành bằng cách nối các nguồn tin với nhau sao cho các dữ liệu có thể lưu thông tự do giữa chúng.
Thứ hai là các mạng thông tin máy tính, được tạo thành bởi các thiết bị đầu cuối và máy tính trung tâm gọi là máy chủ, cho phép người dùng tin ở đầu cuối có thể tiếp cận các thông tin trong các cơ sở dữ liệu được lưu trữ trên mạng.
Thời kỳ đầu, giá thành cao của các thiết bị xử lý thông tin tự động hoá và phần mềm của các hệ thống này đòi hỏi phải có sự hợp tác của nhiều cơ quan. Điều đó đã tạo điều kiện cho việc điều chỉnh các phương pháp và hợp lý hoá việc phân phối nhiệm vụ và sản phẩm. Như vậy người ta đã làm chuyển hoá các hệ thống cũ, tập trung ngăn cách thành những mạng lưới tiếp nhận tư liệu thông suốt và mở ra nhiều điểm tiếp cận thông tin.
Cùng với sự phát triển mạnh mẽ của các kỹ thuật vi xử lý, việc sử dụng ngày càng nhiều các vi phim, vi phiếu đã loại bỏ được những khó khăn về sự quá tải của kho chứa và tạo điều kiện thuận lợi cho việc chuyển giao và phân phối thông tin.
Công nghệ lưu trữ hiện đại
Ngày nay, công nghệ lưu trữ đã phát triển rất mạnh để ứng phó dễ dàng với bùng nổ thông tin. Một thư viện sách khổng lồ nếu số hóa hoàn toàn thì chỉ cần một chiếc thẻ nhớ dung lượng lớn là đủ lưu trữ hết thông tin.
Để lưu trữ dữ liệu người ta có thể dùng nhiều thiết bị khác nhau, nhiều công nghệ khác nhau. Các kho dữ liệu có thể là dùng đĩa cứng, dùng băng từ, dùng đĩa quang... Tuỳ theo yêu cầu cụ thể của bài toán đặt ra mà lựa chọn công nghệ và thiết bị cho phù hợp. Theo cơ chế lưu trữ, hiện nay có một số loại hình lưu trữ dữ liệu cơ bản như:
DAS (Direct Attached Storage) là cơ chế lưu trữ với thiết bị gắn trực tiếp vào máy chủ. Đây được coi là công nghệ lưu trữ truyền thống được nhiều doanh nghiệp sử dụng. Với cơ chế DAS, mỗi máy chủ sẽ có một hệ thống lưu trữ và phần mềm quản lý lưu trữ riêng biệt.
NAS (Network Attached Storage) là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào mạng LAN như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS cũng được gán các địa chỉ IP cố định và được người dùng truy nhập thông qua sự điều khiển của máy chủ. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của máy chủ.
SAN (Storage Area Network) là một mạng riêng tốc độ cao dùng cho việc truyền dữ liệu giữa các máy chủ tham gia vào hệ thống lưu trữ cũng như giữa các thiết bị lưu trữ với nhau. SAN cho phép thực hiện quản lý tập trung và cung cấp khả năng chia sẻ dữ liệu và tài nguyên lưu trữ. Hầu hết mạng SAN hiện nay dựa trên công nghệ kênh cáp quang, cung cấp cho người sử dụng khả năng mở rộng, hiệu năng và tính sẵn sàng cao.
Mỗi loại hình lưu trữ dữ liệu có những ưu nhược điểm riêng và được dùng cho những mục đích nhất định.
Ưu điểm của giải pháp DAS là khả năng dễ lắp đặt, chi phí thấp, hiệu năng cao. Nhược điểm của DAS là khả năng mở rộng hạn chế: khi dữ liệu tăng đòi hỏi số lượng máy chủ cũng tăng theo. Điều này sẽ tạo nên những vùng dữ liệu phân tán, gián đoạn và khó khăn khi sao lưu cũng như bảo vệ hệ thống lưu trữ.
Giải pháp NAS và SAN giải quyết được các hạn chế của DAS. Với kiểu lưu trữ NAS và SAN, việc lưu trữ được tách ra khỏi server, hợp nhất trong mạng, tạo ra một khu vực truy cập rộng cho các server, cho người sử dụng và cho các ứng dụng truy xuất hay trao đổi. Nó tạo nên sự mềm dẻo và năng động. Việc quản trị và bảo vệ dữ liệu sẽ trở nên đơn giản, độ tiện lợi sẽ cao hơn, chi phí tổng thể sẽ nhỏ hơn. NAS thích hợp cho môi trường chia sẻ file nhưng hạn chế trong môi trường có các hệ cơ sở dữ liệu. Hơn nữa, với việc sử dụng hạ tầng mạng chung với các ứng dụng khác, NAS làm chậm tốc độ truy cập mạng và ảnh hưởng đến hiệu năng của toàn hệ thống.
Giải pháp mạng lưu trữ SAN giải quyết được hạn chế của NAS và đặc biệt thích hợp với các ứng dụng cần tốc độ cao với độ trễ nhỏ. Hơn nữa, SAN có khả năng đáp ứng nhanh chóng với những thay đổi về yêu cầu hoạt động của một tổ chức cũng như yêu cầu kỹ thuật của hệ thống mạng. Tuy nhiên nhược điểm của SAN là chi phí đầu tư ban đầu cao hơn so với hai giải pháp DAS và NAS.