Trang Business dẫn lời người đứng đầu nhóm kỹ sư dữ liệu Google Daniel Rizea chia sẻ những điều cần biết khi muốn làm công việc này.
Với hơn 15 năm kinh nghiệm làm việc cho các công ty công nghệ toàn cầu, ông Rizea nhấn mạnh nhóm kỹ sư dữ liệu đóng vai trò rất quan trọng trong hoạt động kinh doanh.
12 năm trước, mọi người chủ yếu sử dụng dịch vụ đám mây. Nhưng tình hình thay đổi đem lại cơ hội việc làm mới khi các công ty phát triển nhanh hơn, hoạt động hiệu quả hơn, tạo ra nhiều dữ liệu hơn. Lĩnh vực xử lý dữ liệu bắt đầu được chú ý đến.
Tiến bộ mới nhất của công nghệ trí tuệ nhân tạo (AI) khiến dữ liệu càng thêm quý giá, vì chất lượng dữ liệu quyết định chất lượng nền tảng AI. Cơn sốt chạy đua xây dựng mô hình ngôn ngữ lớn làm tăng nhu cầu về công việc xử lý dữ liệu.
Mọi tổ chức đều sở hữu lượng lớn dữ liệu ẩn chứa hiểu biết có giá trị chưa được sắp xếp. Hiểu biết này có thể khiến lợi nhuận tăng nhanh chóng, cắt giảm chi phí vận hành hay cải thiện phúc lợi. Nhưng vấn đề là chúng bị chôn vùi nên cần người giỏi chuyên môn sắp xếp và xử lý.
Không thích tìm hiểu về kinh doanh có thể không thích công việc kỹ sư dữ liệu
Theo ông Rizea, nếu thích viết mã mà lại chẳng thích kinh doanh thì sẽ thấy công việc của kỹ sư dữ liệu vừa thú vị vừa đáng thất vọng.
Kỹ sư dữ liệu có thể phát huy tài năng thiết lập hệ thống quy mô lớn, nhưng trước khi bắt tay viết mã họ phải hiểu về tình hình công ty mà mình làm việc cho cũng như sản phẩm của đơn vị. Họ cần hợp tác chặt chẽ với giám đốc quản lý sản phẩm và chuyên gia phân tích kinh doanh, đôi khi cần tìm đến rất nhiều người để hiểu hết mọi phòng ban. Hệ thống dữ liệu mà họ thiết lập phải phục vụ tất cả.
Ông Rizea chỉ ra có 3 câu hỏi cơ bản nên làm rõ trước khi bắt tay viết mã: Loại dữ liệu nào cần được thu thập? Đơn vị dự tính sử dụng dữ liệu như thế nào? Dữ liệu phải mới đến mức độ nào?
3 câu hỏi trên đều có ý nghĩa về mặt kỹ thuật, cấu trúc lẫn tính hiệu quả. Một kỹ sư dữ liệu giỏi sẽ cân bằng được giữa nhu cầu, chi phí với tiến độ; còn người giỏi nhất biết tính đến cả nhu cầu trong tương lai.
Kỹ sư dữ liệu là công việc thay đổi nhanh chóng
Ông Rizea nhấn mạnh nếu không muốn bị thử thách liên tục thì không nên làm kỹ sư dữ liệu. Xử lý dữ liệu là lĩnh vực phát triển rất nhanh đòi hỏi người trong ngành phải theo kịp.
Dữ liệu đang tăng lên theo cấp số nhân, vì vậy cần có hệ thống cùng kỹ thuật mới đủ sức xử lý. Hệ thống của ngày hôm qua đã lỗi thời.
Để theo kịp sự phát triển, mỗi tuần Rizea dành ra vài giờ tìm kiếm thông tin ngành. Ông cố gắng cập nhật nhiều nhất có thể.
Hiện tại loạt xu hướng mới nhất là AI tạo sinh, cơ sở dữ liệu véc tơ và kỹ thuật tăng cường truy xuất. Ông Rizea khuyên người muốn trở thành kỹ sư dữ liệu nên đăng ký nhận bản tin công nghệ để nắm bắt xu hướng mới, dám thử nghiệm, dám thử điều mới mẻ.
Tuân thủ quy định
Ông Rizea lưu ý rằng kỹ sư dữ liệu phải đảm bảo quyền riêng tư của dữ liệu, tuân thủ yêu cầu pháp lý và quy định liên quan khi thiết lập hệ thống cho doanh nghiệp.
Đảm bảo dữ liệu người dùng được an toàn, mọi quá trình xử lý và chính sách đều minh bạch với người dùng sẽ giúp xây dựng niềm tin. Không quản lý tốt dữ liệu chắc chắn làm mất khách hàng. Vì vậy kỹ sư dữ liệu cần hợp tác với giám đốc quản lý sản phẩm cũng như chuyên gia pháp lý khi thiết lập hoặc cập nhật hệ thống.
Tạo ra sản phẩm vô hình
Sản phẩm mà kỹ sư dữ liệu tạo ra là hệ thống và tính năng nền tảng. Họ có nhiều khách hàng nội bộ, từ các nhóm phần mềm đến giám đốc quản lý sản phẩm, nhà phân tích, giám đốc điều hành.
Về cơ bản, kỹ sư dữ liệu chỉ làm việc cho khách hàng một cách gián tiếp. Tuy nhiên, sản phẩm của họ cung cấp phân tích lẫn hiểu biết sâu sắc về thị trường lẫn về hành vi người dùng.