Đại dịch COVID-19 đã ảnh hưởng đến toàn bộ Trái Đất và các nhà nghiên cứu phải tiếp tục điều tra sự nguy hiểm của vi rút SARS-CoV-2 và các biến thể của nó.
Vì vi-rút có thể tiến hóa nhanh chóng, đôi khi trở nên nguy hiểm hơn và dễ lây truyền hơn trong quá trình này, điều quan trọng là phải nhanh chóng xác định biến thể nào là biến thể đáng lo ngại (Vì vi-rút có thể tiến hóa nhanh chóng, đôi khi trở nên nguy hiểm hơn và dễ lây truyền hơn trong quá trình này, điều quan trọng là phải nhanh chóng xác định biến thể nào là biến thể đáng lo ngại (VOC). Việc phát hiện VOC một cách nhanh chóng có thể giúp con người sống sót khỏi đại dịch bằng cách cho các nhà khoa học thời gian để phát triển vắc-xin và phương pháp điều trị hiệu quả — nhưng các phương pháp theo dõi các biến thể hiện tại có thể chậm.
Một nhóm các nhà nghiên cứu tại Phòng thí nghiệm quốc gia Argonne, cùng với các cộng tác viên của trường đại học đã giải quyết vấn đề theo dõi các biến thể của vi rút Covid bằng cách sử dụng trí tuệ nhân tạo (AI). Siêu máy tính Polaris mạnh mẽ của ALCF, cùng với bộ tăng tốc phần cứng AI của Cerebras và hệ thống Selene được tăng tốc GPU của NVIDIA, đã hỗ trợ nghiên cứu. Polaris cũng được trang bị GPU và khả năng điều phối khối lượng công việc của Altair® PBS Professional®. Quản lý khối lượng công việc hiệu quả là rất quan trọng đối với khối lượng công việc lớn, phức tạp. Ramanathan cho biết: “Thách thức chính trong vấn đề này là xử lý độ dài trình tự dài và giải quyết các mô hình nền tảng này ở quy mô bộ gen của virus. Polaris có thể xử lý khối lượng, bao gồm dữ liệu bộ gen đáng giá trong năm mà nhóm đã sử dụng cho dự án.
Công việc của nhóm dự án là đào tạo các mô hình ngôn ngữ lớn (LLM) cho công việc có ý nghĩa ngoài COVID-19 và cho công việc của họ mô hình hóa cách xác định và phân loại vi-rút gây đại dịch — đặc biệt là SARS-CoV-2, họ đã giành được giải Gordon 2022 danh giá của ACM Giải thưởng Đặc biệt Bell cho Nghiên cứu COVID-19 dựa trên máy tính hiệu suất cao. Học máy đóng một vai trò quan trọng trong nghiên cứu và các nhà nghiên cứu đã phân tích 1,5 triệu trình tự bộ gen SARS-CoV-2 hoàn chỉnh, chất lượng cao — một quá trình trước đây tốn nhiều thời gian và công sức, kiểm tra từng protein và lập bản đồ đột biến riêng lẻ. Thay vào đó, nhóm đã hợp lý hóa quy trình bằng cách phát triển mô hình ngôn ngữ quy mô bộ gen đầu tiên (GenSLM).
Sau đó, nhóm nghiên cứu đoạt giải đã được công nhận tại SC22 ở Dallas và bài báo của họ sẽ được xuất bản trên Tạp chí Quốc tế về Ứng dụng Điện toán Hiệu năng Cao (IJHPCA).
Các nhà nghiên cứu của Argonne và các cộng tác viên của họ đã mở đường cho việc hiểu rõ hơn, chi tiết hơn về quá trình đột biến của vi rút, cho phép các nhà khoa học trên toàn thế giới hành động đối với các biến thể mới nổi và phát triển loại vaccine có thể giảm mức độ nghiêm trọng và làm chậm sự lây lan, cuối cùng là cứu sống nhiều mạng người.