2/25/09

Lược sử Linux và ngành nghiên cứu vũ trụ

Lược sử Linux và ngành nghiên cứu vũ trụ


By Richard Hillesley, 5 Jun 2008 at 12:21


Lược dịch: zxc232 (nhấn vào tên bài để đến link gốc)




Mười lăm năm trước, các nhà khoa học chỉ dùng giấy kẻ li và mực để tính toán và xử lý dữ liệu.

Cuộc cách mạng máy tính lần thứ nhất vào những năm 70, 80 đã mang lại nhiều khả năng mới. Nhưng cuộc cách mạng máy tính thứ hai diễn ra vào thập niên trước mới thật sự biến đổi công việc của hầu hết các cơ sở khoa học.

Các công nghệ mạng băng thông rộng và thiết bị lưu trữ đã tạo điều kiện lưu trữ được nhiều dữ liệu hơn. Việc thu thập dữ liệu (từ vũ trụ) đã trở nên tinh vi hơn. Các máy tính đã có thể xử lý lượng dữ liệu vài năm trước đây không hình dung nổi và có thể thực hiện các bước tính toán lặp mà chỉ mới gần đây là không thể.

Tỷ lệ chi phí/tốc độ trước đây bị hạn chế nay đã cải thiện đáng kể dưới tác dụng của định luật Moore và sự xuất hiện của phần mềm nguồn mở (PMNM). Đối với phần lớn chúng ta, điều đó không có ý nghĩa gì đáng kể. Nhưng trong thế giới khoa học, điều đó có nghĩa rằng những giới hạn của kiến thức có thể khám phá được đã được mở rộng ra đáng kể.

Một trong những đóng góp đặc biệt của PMNM vào lĩnh vực tính toán khoa học là sự ra đời của công nghệ ảo hóa và cụm máy tính (virtualisation and clustering technologies). Nhờ các công nghệ đó, một số máy tính có thể chạy vô số phiên bản máy ảo Linux và đạt tới tốc độ tính toán của một supercomputer. Những công nghệ đó bắt đầu từ dự án Beowulf do Donald Becker và Thomas Sterling khởi xướng năm 1993 “phác thảo một cụm máy tính (cluster system) từ các máy tính thông thường như một phương án rẻ tiền thay thế cho các siêu máy tính.”

Linux hấp dẫn các công ty phần cứng chuyên chế tạo các hệ thống tính toán cao tốc (High Performance Computing – HPC) một phần vì các lý do kỹ thuật: khả năng tính toán, tính module, linh hoạt, xem được mã nguồn; một phần do giấy phép sử dụng khuyến khích chia sẻ mã nguồn. Cuối cùng thì trong TOP 500 siêu máy tính, Linux là hệ điều hành chính của 439 máy (số liệu tháng 11/2008)

Vũ trụ hình bánh rán.

Cụm máy tính chạy Linux đầu tiên của dự án Beowulf do các nhà khoa học NASA và CESDIS xây dựng đặt tại Trung tâm các chuyến bay không gian Goddard ở Greenbelt, bang Maryland để giải quyết các bài toán trong dự án Khoa học Không gian và Trái đất của NASA (Earth and Space Sciences project – ESS).

Một trong những mục tiêu của dự án ESS là “xác định tính khả thi của việc dùng hàng loạt các máy tính chạy song song để giải các bài toán của cộng đồng khoa học không gian và trái đất.” Dự án Beowulf phục vụ những người sử dụng nó và là dự án đầu tiên thuộc loại này nhưng chịu thách thức lớn vì các sản phẩm công nghệ thương mại mà nó sử dụng không phải cái nào cũng nguồn mở thật sự.

Những công nghệ nói trên (ảo hóa và cụm máy tính) đã mở rộng khả năng cho các nhà khoa học dành cả đời mình để chạy các mô hình mô phỏng những sự kiện ở biên giới vũ trụ của chúng ta. Những công nghệ đó cũng đã chứng tỏ có hiệu quả tương đương với những hệ thống máy tính thương mại chuyên môn hóa có khả năng toán học và/hoặc khả năng phân tích cực lớn.

Một trong những dự án như vậy là dự án COSMOS do Stephen Hawking lãnh đạo. Hawking là giáo sư toán học của đại học tổng hợp Cambridge, có lẽ là nhà khoa học được thừa nhận nhất thế giới sau Einstein, nổi tiếng với những người thường vì là tác giả cuốn Lược sử thời gian, một trong những cuốn sách bán chạy nhất mà nhiều người có nhưng ít người đọc được và cũng nổi tiếng vì những thành tựu mà ông đạt được đối mặt với những bất hạnh cá nhân khó tưởng tượng được đối với phần lớn chúng ta.

Hawking cũng là một trong những nhà vật lý lý thuyết xuất sắc nhất, giữ cương vị nhà nghiên cứu chính của dự án COSMOS, tập hợp các nhà vũ trụ học trong cái gọi là Tổ hợp Vũ trụ học Tính toán vương quốc Anh (UK Computational Cosmology Consortium – UK CCC) có mục đích tối cao là đi tìm nguồn gốc cuộc sống, vũ trụ và mọi thứ khác dựa trên một siêu máy tính Altix chạy hệ điều hành Linux.

Khi bắt đầu dự án, Hawking tuyên bố rằng COSMOS “ sẽ cho phép chúng ta tính toán lý thuyết tiên đoán giai đoạn đầu của vũ trụ và kiểm tra lý thuyết đó với những kết quả quan sát mới nhất.” Nghiên cứu vũ trụ học về nguồn gốc sự sống và vũ trụ vẫn còn là một lĩnh vực nghiên cứu hiếm mà nước Anh đang dẫn đầu thế giới.

Sự bắt đầu của kết thúc

Dự án COSMOS tìm cách thám hiểm giới hạn của vĩnh cửu và các lý thuyết ở giới hạn hiểu biết của con người về nguồn gốc sự sống và vũ trụ, một lĩnh vực “quá nhiều lý thuyết nhưng lại không đủ dữ liệu”. Một lĩnh vực nghiên cứu then chốt của UK CCC là khảo sát khoa học nền vi sóng vũ trụ, những bức xạ dư còn lại từ vụ nổ Big Bang.

Lý thuyết Vụ nổ lớn (Big Bang) cho rằng khoảng 14 tỷ năm trước, vũ trụ nóng và cô đặc đã bùng nổ và phát ra những luồng vật chất bức xạ cực mạnh tạo nên các thiên hà rải rác và những đám mây khí lạnh có thể quan sát được từ các đài thiên văn vũ trụ hiện nay. Big Bang để lại một lớp bức xạ tràn ngập khắp vũ trụ tạo dấu vết cho các nhà vật lý tìm kiếm nguồn gốc các thiên hà và các vì sao và nguồn gốc sự phân tán vật chất trong vũ trụ.

Dự án này liên kết chặt chẽ với Cơ quan Vũ trụ châu Âu (European Space Agency) và tạo ra nhiều dữ liệu từ các thông tin thu được bởi các vệ tinh châu Âu. Các nhà nghiên cứu phát biểu ba mục tiêu chính dưới dạng đơn giản hóa thì như sau:

  • Thu thập và phân tích dữ liệu từ các nguồn khác nhau để tạo nên một bức tranh toàn cảnh vũ trụ khoảng 300.000 đến 400.000 năm sau vụ nổ Big Bang.

  • Dùng các luồng dữ liệu vũ trụ liên tục đi tới trái đất để dựng mô hình vũ trụ dựa trên các lý thuyết hiện đại về nguồn gốc sự sống, ngoại suy đến hiện tại, thử và chỉnh sửa các lý thuyết đó theo những dữ liệu đã biết, chứng minh hoặc bác bỏ các lý thuyết đó trên cơ sở các thực tế đã xác lập.

  • Theo dõi sự hình thành và biến mất của các thiên hà, xác định nguồn gốc của chúng, xác định “kích thước và hình dáng các thành phần của vũ trụ”


Năm 1989, NASA phóng vệ tinh COBE nhằm mục đích “đo lường sự khuếch tán các bức xạ hồng ngoại và vi sóng từ khi hình thành vũ trụ đến những giới hạn có thể đạt tới bởi ngành vật lý thiên văn.” Vệ tinh này mang theo ba thiết bị: máy đo phổ hồng ngoại tuyệt đối để so sánh phổ bức xạ nền vi sóng vũ trụ với hố đen, máy đo vi sóng vi sai để bắt các bức xạ vũ trụ yếu và thiết bị thực nghiệm nền hồng ngoại khuếch tán để tìm các bức xạ nền hồng ngoại vũ trụ. Theo NASA “mỗi thiết bị của COBE sẽ tạo nên một phát hiện vũ trụ học cơ bản.”

Những bức ảnh của vệ tinh COBE là những bức ảnh đầu tiên chỉ ra rằng trên phông nền vi sóng vũ trụ trơn tru có những gợn sóng nhỏ. Những gợn sóng nguyên thuỷ đó liên hệ với cấu trúc của vũ trụ, các thiên hà và các vì sao mà ta nhìn thấy hiện nay. Nhiệm vụ cơ bản của dự án COSMOS là thử tìm ra nguyên nhân của các gợn sóng đó. Các nhà vật lý kiểm định lý thuyết của họ bằng cách chạy các chương trình mô phỏng vụ nổ Big Bang rồi so sánh kết quả mô phỏng với những kết quả quan sát thực tế của COBE để kiểm tra độ chính xác của lý thuyết.

“Vũ trụ học là một ngành phát triển nhanh và có tính cạnh tranh cao, căn cứ vào các kết quả,” Hawking nói. “ Siêu máy tính của dự án COSMOS cho phép chúng ta biến các ý tưởng thành các dự đoán cụ thể đảm bảo cho các nhà vũ trụ học Anh có những đóng góp hàng đầu thế giới.” Với thời gian “Câu hỏi chúng tôi đang thử trả lời bây giờ đã chính xác hơn rất nhiều,” Tiến sỹ Paul Shellard, giám đốc dự án COSMOS cho biết.

“Mười năm trước, chúng ta có nhiều lý thuyết về vũ trụ nguyên thuỷ, nhưng hiện nay, ngành vũ trụ học trở thành một ngành khoa học có tính định lượng hơn nhiều. Chúng tôi cần phải tính được các dự đoán dựa trên lý thuyết có tính định lượng và tính chính xác có thể so sánh được với các kết quả quan sát của các vệ tinh và kính thiên văn mới nhất; bản thân các kết quả quan sát đó cũng cần có máy tính mạnh hơn nhiều để phân tích. Vì thế nên máy tính mới quan trọng đến vậy. ...”

Chia sẻ bộ nhớ.

Để phân tích và xử lý hàng terabyte dữ liệu cơ bản của dự án, COSMOS dùng một siêu máy tính SGI Altix chạy Linux. Hệ thống này có bộ nhớ chung chia sẻ, tích hợp ảo hóa, ổ cứng phân cấp và phụ thuộc rất nhiều vào tài trợ từ Hội đồng Nghiên cứu. “Chúng tôi hiện đang bị quá tải,” tiến sỹ Paul Shellard cho biết, “vì vậy chúng tôi đang tìm cách kết hợp Altix với các tài nguyên nhóm - cluster resources (nghĩa là nâng cấp lên kiến trúc ICE mới nhất). Trong khi chờ đợi, chúng tôi cố gắng hợp lý hóa hạ tầng hệ thống để cho user nhiều dung lượng nhớ hơn.”

Shellard nói rằng hệ thống “đã có một ngưỡng tốc độ bộ nhớ chia sẻ hoàn toàn mới … và “sẽ cho chúng tôi khả năng kiểm định trơn tru mô hình toán học vũ trụ so với khối lượng dữ liệu khổng lồ mà các quan sát vũ trụ thu thập được.”

…...

Dự án dựa vào Linux để chạy các workstations. “Ưu điểm mạnh nhất của Linux là tính mở làm cho nó có tính cạnh tranh cao (so với các hệ điều hành khác) với một cộng đồng user rộng (đặc biệt là trong lĩnh vực tính toán cao tốc) . Linux là chuẩn mặc định được chọn cho các hệ thống tính toán cao tốc.

Các phương án hệ điều hành khác là Solarix, HPUX, OSX và Windows, nhưng trong lĩnh vực tính toán cao tốc, cộng đồng người dùng các hệ điều hành đó rất nhỏ so với cộng đồng người dùng Linux do bản chất nguồn đóng của các hệ điều hành đó. Một vài hệ điều hành nói trên có thể tốt hơn Linux trong những lĩnh vực rất đặc biệt nhưng không tốt đối với cách hoạt động của dự án COSMOS: phạm vi các ứng dụng và các nhiệm vụ nghiên cứu rất rộng. Theo quan điểm của đội ngũ hỗ trợ COSMOS, không có phương án hệ điều hành nào tốt hơn Linux đối với các ứng dụng tính toán cao tốc.”