Theo tạp chí Nucleic Acids Research, trong hệ gien của con người, lượng thông tin được mã hóa có thể ít hơn 20% so với mức đánh giá trước đây. Trong một nghiên cứu mới, một nhóm khoa học quốc tế đã chứng minh được rằng chỉ có 80% số gien trong ADN của con người là thực sự mã hóa một protein nào đó và 20% còn lại đã mất khả năng này.
Trong bộ gien người có 23 cặp nhiễm sắc thể, còn trong các nhiễm sắc thể có khoảng 28.000 gien. Tuy nhiên, không phải tất cả chúng đều mang thông tin di truyền, cần thiết cho quá trình tổng hợp protein. Một số gien thực hiện vài loại chức năng phụ trợ, trong khi những gien khác không làm gì cả.
Các đoạn gien này được gọi là gien giả (pseudogene) - chúng phát triển từ các gien thông thường, nhưng trong quá trình tiến hóa và nhiều đột biến, chúng mất khả năng mã hóa protein. Một nhóm khoa học Tây Ban Nha, Anh và Mỹ đã phát hiện ra rằng 1/5 bộ gien của con người là các gien giả không có chức năng.
Các tác giả đã so sánh các cơ sở dữ liệu từ 3 dự án nghiên cứu hệ gien khác nhau: GENCODE / Ensembl, RefSeq và UniProtKB. Tổng cộng, các nhà khoa học đã tìm thấy 22.210 gien mang thông tin về một protein nào đó. Nhưng chỉ có 19.446 trong số đó là có ở trong cả 3 cơ sở dữ liệu. Sau đó, các nhà nghiên cứu bắt đầu phân tích 2.764 gien còn lại và phát hiện ra rằng hầu như tất cả chúng đều là gien giả, nghĩa là chúng không mã hóa bất kỳ protein nào. Hơn nữa, con số này còn có thêm 1.470 gien, từng được nêu trong cả 3 cơ sở dữ liệu.
Tổng cộng, các nhà khoa học đã tìm thấy 4.234 gien giả. Thông tin này đã được thêm vào cơ sở dữ liệu của dự án quốc tế GENCODE. Bây giờ, các nhà khoa học sẽ phải xác minh dữ liệu này bằng cách nghiên cứu kỹ lưỡng từng loại gien giả được phát hiện.
Vũ Trung Hương