GIỚI THIỆU SIÊU MÁY TÍNH
Các thuật ngữ liên quan đến siêu máy tính
Để hiểu SMT là gì và phân biệt giữa các loại SMT, trước hết, cần nắm rõ sự khác biệt giữa một số thuật ngữ chính.
Hz, MHz, GHz, …: Các đơn vị tần số dùng để đo số chu kì tính toán của các thiết bị điện tử (hay còn gọi là xung nhịp)
Máy tính với tốc độ 1 MHz có khả năng thực hiện 1 nghìn tỷ vòng lặp tính toán mỗi giây Mặc dù tần số cao hơn thường tương ứng với tốc độ xử lý nhanh hơn trong cùng một dòng chip, nhưng việc so sánh sức mạnh giữa các dòng chip khác nhau chỉ dựa trên tiêu chí này là không khả thi Điều này là do mỗi chu kỳ tính toán bao gồm một số lượng phép toán nhất định, và con số này khác nhau tùy thuộc vào từng loại chip.
Flops (Floating point operations per second), Megaflops, Gigaflops, … : Số phép tính thực hiện được trong mỗi giây
Máy tính với tốc độ xử lý 1 Megaflop có khả năng thực hiện 1 triệu phép toán trên tập số thực mỗi giây Flops là một đại lượng đặc trưng cho tốc độ xử lý, vượt trội hơn xung nhịp ở hai điểm quan trọng.
Thứ nhất, số phép tính trên giây có thể được so sánh trực tiếp trên các loại chip khác nhau
Hầu hết các SMT hiện nay được xây dựng từ một hệ thống gồm nhiều vi xử lý, vì vậy, chỉ số Flops, một đại lượng cộng dồn, sẽ cung cấp kết quả chính xác hơn so với đơn vị đo xung nhịp.
Siêu máy tính là gì?
SMT là một loại máy tính với khả năng xử lý vượt trội và tốc độ siêu nhanh Bên trong SMT, có một hệ thống các máy tính mạnh mẽ hoạt động song song để tối ưu hóa hiệu suất làm việc.
Hiện nay, công nghệ SMT đạt tốc độ xử lý lên đến hàng ngàn teraflop, tương đương với khả năng thực hiện một ngàn tỷ phép tính mỗi giây Điều này cho thấy sự tiến bộ vượt bậc trong hiệu suất xử lý dữ liệu, với 1 teraflop tương ứng với 1000 gigaflop và các đơn vị nhỏ hơn như megaflop và kiloflop.
Sequoia, hệ thống siêu máy tính của IBM, được cấu thành từ nhiều hệ thống Blue Gene thế hệ thứ 3, với khả năng vận hành trên 1,6 triệu vi xử lý Hệ thống này đạt tốc độ xử lý ấn tượng lên tới 20 petaflop, tương đương với 20.300 phép tính mỗi giây, hay 10^15 phép tính/giây.
Hình 1-1 Sequoia – SMT mạnh nhất thế giới năm 2012
Toàn bộ SMT yêu cầu 3.000 gallon (hơn 11.356 mét khối) nước mỗi phút để làm mát và tiêu tốn trung bình từ 6 đến 7 megawatt, có thể lên tới 9,5 megawatt điện Chi phí năng lượng cho hoạt động này rất cao, tương đương
Mỗi năm, chi phí lên tới 6 đến 7 triệu USD cho 1,6 triệu nhân xử lý được phân bổ trên 96 giá đỡ khác nhau Mỗi giá đỡ nặng gần 5000 pound (khoảng 2.667 kg) và tiêu thụ trung bình 100 kilowatt năng lượng.
Siêu máy tính dành cho ai?
SMT là công cụ quan trọng cho các nhà nghiên cứu, những người có vai trò đa dạng và phức tạp Họ nghiên cứu từ việc mô phỏng các phản ứng trong mặt trời đến việc xây dựng mô hình cho các hệ thống vật lý như động cơ máy bay, khí hậu trái đất và hệ thống mạch máu của con người.
Các quyết định chính sách quan trọng thường dựa vào kết quả tính toán của các nhà nghiên cứu, đòi hỏi độ chính xác cao Điều này tạo ra thách thức lớn, và SMT trở thành yếu tố hỗ trợ hiệu quả cho các nghiên cứu này.
Một siêu máy tính giá bao nhiêu?
Khoảng 6 đến 7 triệu USD chi phí cho năng lượng hàng năm, một SMT có chi phí lắp đặt ban đầu từ 100 đến 250 triệu USD để thiết kế và lắp ráp Đó là chưa kể đến chi phí bảo trì chúng.
Siêu máy tính có thể mạnh hơn thêm bao nhiêu?
Sequoia cần tới 1,6 triệu nhân xử lý vì vi xử lý hiện tại đã đạt đến giới hạn về sức mạnh Các định luật vật lý hạn chế khả năng tăng tốc độ xung nhịp, và việc tăng xung quá mức có thể gây ra hiện tượng quá nhiệt, làm hỏng vi xử lý Do đó, để cải thiện hiệu suất, giải pháp là sử dụng nhiều chip hơn, dẫn đến việc các hệ thống máy tính (SMT) ngày càng trở nên mạnh mẽ và lớn hơn.
Trên lý thuyết, việc tạo ra một siêu máy tính (SMT) với 100 triệu nhân xử lý và tiêu thụ 100 megawatt điện là điều khó khả thi Chính vì vậy, các nhà nghiên cứu đang kỳ vọng vào sự phát triển của công nghệ mới, giúp máy tính đạt tốc độ tính toán lên tới 10^18 phép tính/giây.
1.6 "Tuổi thọ" của siêu máy tính?
SMT thường có "vòng đời" ngắn, chỉ từ 2 đến 5 năm, thậm chí còn thấp hơn cả chiếc máy Xbox 360 Sau khoảng thời gian này, hiệu quả của chúng giảm sút và không còn lý do để duy trì do chi phí bảo trì và vận hành quá cao Do đó, sau khi hết "vòng đời", việc xây dựng một SMT mới là cần thiết.
Siêu máy tính Roadrunner, được phát triển bởi IBM vào năm 2008, đã được sử dụng để mô hình hóa sự phân hủy của kho vũ khí hạt nhân của Mỹ Tại thời điểm ra mắt, Roadrunner sở hữu sức mạnh tính toán vượt trội, đạt 1 petaflop (1 triệu tỷ phép tính mỗi giây), trở thành siêu máy tính mạnh nhất thế giới trong các thời điểm tháng 6 và tháng 11 năm 2008, cũng như tháng 6 năm 2009 Tuy nhiên, sau 5 năm hoạt động, Roadrunner đã trở nên lỗi thời và hiện đang trong kế hoạch bị phá bỏ hoàn toàn.
LỊCH SỬ PHÁT TRIỂN CỦA SIÊU MÁY TÍNH
Giai đoạn trước năm 1990
Thuật ngữ SMT (supercomputer) lần đầu tiên được nhắc đến trong một bài báo của tờ New York World vào năm 1929, chỉ các bảng tính khổng lồ mà IBM thiết lập tại Đại học Columbia Đến những năm 1960, kiến trúc SMT được thiết kế bởi kỹ sư Seymour Cray, làm việc cho tổ chức Control Data Corporation (CDC), và chiếc CDC 6600 ra mắt năm 1964 được xem là siêu máy tính đầu tiên trên thế giới Seymour Cray được tôn vinh là cha đẻ của SMT.
Sau một thời gian làm việc tại CDC, Cray muốn rời khỏi công ty cùng với một số đồng nghiệp nhưng bị CEO William Norris từ chối do ông đang thực hiện một dự án cho Hải quân Mỹ Đến năm 1972, Cray mới có thể thực hiện ý định của mình và thành lập công ty riêng mang tên Cray Research Sau này, Cray Research được đổi tên thành Cray Inc., trở thành một trong những nhà cung cấp hệ thống máy tính hàng đầu thế giới hiện nay.
Năm 1976, Cray đã giới thiệu siêu máy tính Cray-1 với CPU 80MHz, nổi bật với thiết kế hình trụ giúp duy trì khoảng cách đồng đều giữa vi xử lý và các thành phần khác trong hệ thống Đến năm 1985, Cray-2 ra mắt với 8 vi xử lý, sử dụng hệ thống làm mát bằng chất lỏng và chất flourinert của 3M, đạt tốc độ tính toán 1,9 gigaflops, giữ vị trí siêu máy tính nhanh nhất thế giới cho đến những năm 1990.
Hình 2-1 SMT Cray-1 Với những SMT trong giai đoạn này có thể đánh giá là khả năng tính toán cũng giống như con người.
Giai đoạn sau năm 1990
Hình 2-2 Biểu đồ tốc độ xử lý của siêu máy tính từ tháng 6/1993 đến tháng 6/2009
Vào những năm 1990, công nghệ SMT đã phát triển vượt bậc với việc trang bị hàng nghìn bộ vi xử lý, đặc biệt là tại Mỹ và Nhật Sự gia tăng này đã dẫn đến tốc độ tính toán của máy tính SMT tăng nhanh chóng, điển hình là chiếc SMT trong hầm gió của Fujitsu với 166 vi xử lý vector đạt tốc độ 1,7 gigaflops mỗi chip vào năm 1994 Hai năm sau, máy Hitachi SR2201 gây ấn tượng với tốc độ 600 gigaflops nhờ vào 2048 bộ xử lý Intel cũng không kém cạnh khi giới thiệu SMT Paragon với khoảng 1000 bộ xử lý, đánh dấu bước tiến lớn trong công nghệ máy tính.
4000 chip i860 và nó từng đạt danh hiệu nhanh nhất thế giới vào năm 1993
Vi xử lý vector là loại CPU được trang bị các bộ chỉ dẫn đặc biệt, cho phép xử lý hiệu quả dữ liệu một chiều Loại CPU này có khả năng nâng cao hiệu suất cho một số tác vụ nhất định, đặc biệt trong lĩnh vực giả lập số và thực hiện các tác vụ tương tự Mặc dù vi xử lý vector từng phổ biến vào những năm 1970-1980, nhưng hiện nay chúng đã gần như biến mất hoàn toàn khỏi thị trường.
Trong 25 năm qua, tốc độ và khả năng của siêu máy tính (SMT) đã tăng lên hàng triệu lần Theo biểu đồ trong hình 2-3, tốc độ xử lý đã gần như gấp đôi mỗi năm kể từ năm 2010 Để đạt được sự tăng trưởng mạnh mẽ này, số lượng bộ vi xử lý cũng đã được cải thiện đáng kể.
Số lượng Cores Rpeak (TFlop/s) tăng lên tương ứng, nhưng hiện nay các định luật vật lý đã đạt đến giới hạn, khiến việc tăng tốc độ xử lý bằng cách gia tăng số lượng vi xử lý trở nên không khả thi và hiệu quả So với giai đoạn đầu khi SMT xuất hiện, tốc độ tính toán hiện nay đã tăng đáng kể Để dễ dàng so sánh, chúng ta sẽ xem xét một số ví dụ cụ thể.
Vào đầu những năm 1960, máy tính điều khiển Apollo của NASA chỉ có bộ nhớ 64 kilobyte và xung nhịp 0,043 MHz, trong khi điện thoại iPhone 5S hiện nay sở hữu xung nhịp lên tới 1,5 GHz.
Vào năm 1975, SMT Cray-1 được công nhận là một trong những siêu máy tính mạnh mẽ với tốc độ 80MHz, chủ yếu phục vụ cho nghiên cứu khoa học Đáng chú ý, Cray-1 từng góp mặt trong quá trình sản xuất bộ phim Tron phiên bản 1982 Tuy nhiên, sức mạnh của Cray-1 chỉ đạt 80 triệu FLOPS, khiêm tốn so với 76,8 GFLOPS của iPhone 5S, tức lớn hơn gần một nghìn lần Mười năm sau, Cray-2 ra mắt và trở thành máy tính nhanh nhất thế giới cho đến năm 1990, nhưng với 1,9 GFLOPS, nó vẫn thua xa iPhone 5S theo tiêu chí đo lường này.
Deep Blue là hệ thống máy tính nổi tiếng nhất khi đánh bại vua cờ Garry Kasparov, với khả năng xử lý 11,38 GFLOPS và định vị 200 nghìn vị trí trên bàn cờ mỗi giây Sau 17 năm, Samsung Galaxy S5 đã đạt mức GFLOPS 142, vượt xa Deep Blue Hiện nay, SMT ngày càng phổ biến và xuất hiện ở nhiều quốc gia, với sự thay đổi đáng kể về hệ điều hành, kiến trúc và phần cứng so với vài thập kỷ trước.
KIẾN TRÚC VÀ PHẦN CỨNG SIÊU MÁY TÍNH
Kiến trúc
Thiết kế SMT (Simultaneous Multithreading) đã trải qua nhiều thay đổi đáng kể gần đây Những chiếc SMT đầu tiên của Seymour Cray sử dụng kỹ thuật tính toán song song và thiết kế nhỏ gọn để đạt hiệu suất cao Điện toán song song, khái niệm sử dụng nhiều CPU để thực hiện một loạt phép tính đồng thời, là nền tảng cho sự phát triển này Có hai phương pháp chính thường được áp dụng trong lĩnh vực này.
3.1.1 Kiểu điện toán phân tán
Grid computing sử dụng một mạng lưới nhiều máy tính phân tán ở các địa điểm khác nhau để xử lý dữ liệu, với khoảng cách địa lý giữa chúng tương đối xa Khi một máy tính trong mạng lưới được kích hoạt, nó trở thành một phần của hệ thống tính toán song song, giúp tăng tốc độ xử lý khi có nhiều máy tính tham gia Hệ thống này có một máy chính (Control Node) đóng vai trò điều khiển và phân bổ tác vụ cho các máy con Hai phương pháp cụ thể trong grid computing sẽ được trình bày chi tiết ở chương 5.
Hình 3-1 Mô hình kiểu điện toán phân tán
3.1.2 Kiểu điện toán tập trung
Computer cluster là hệ thống điện toán tập trung, sử dụng nhiều CPU đặt gần nhau trong các máy tính tương tự, gọi là các node Những CPU này được kết nối để tạo thành một hệ thống lớn hơn, hoạt động như một SMT duy nhất Để đảm bảo hiệu suất, các nhà thiết kế cần chú ý đến tốc độ và tính linh hoạt trong kết nối giữa các máy tính Theo số liệu từ TOP500, SMT cluster hiện chiếm 82,2% thị phần SMT toàn cầu, trong đó SMT IBM Blue Gene/Q là một ví dụ điển hình về việc sử dụng dạng cluster.
Từ các vi xử lí, các nhà sản xuất/cung ứng SMT sẽ tích hợp nó lên một chiếc
"Card máy tính" là linh kiện quan trọng, thường đi kèm với RAM và có thể tích hợp thêm nhiều thành phần khác để tạo nên một máy tính gần như hoàn chỉnh Nhiều card máy tính được lắp vào các khay, sau đó các khay này được đặt trong các tủ chứa (rack) Từ đó, nhiều rack sẽ tạo thành một hệ thống SMT hoàn chỉnh.
Hình 3-2 Cấu trúc một hệ thống SMT kiểu điện toán tập trung
SMT dạng Massively Parallel Processors (MPP) là một hệ thống máy tính lớn với hàng nghìn CPU và thanh RAM, được kết nối qua mạng siêu tốc đặc biệt thay vì sử dụng cluster thông thường Mỗi CPU trong MPP có bộ nhớ và bản sao hệ điều hành/ứng dụng riêng, giúp tối ưu hóa hiệu suất Theo TOP500, MPP hiện chiếm 17,8% thị phần SMT, trong đó SMT IBM Blue Gene/L, đứng thứ 5 thế giới vào năm 2009, là một ví dụ tiêu biểu cho thiết kế này.
Hình 3-3 Mô hình SMT dạng Massively Parallel Processors (MPP)
Phần cứng
Vào những năm 1970, SMT chỉ sử dụng một số ít bộ xử lý, nhưng đến những năm 1990, số lượng CPU đã tăng lên hàng nghìn và hiện nay, con số này có thể đạt vài triệu Trong các hệ thống SMT dạng cluster, nhiều "nút" (node) nhỏ được kết hợp để tạo thành một hệ thống lớn, mỗi nút tương đương với một máy tính hoàn chỉnh có một hoặc nhiều CPU, GPU, RAM, quạt tản nhiệt và các thành phần khác Các nút này được kết nối qua nhiều phương thức, từ cáp đồng đến cáp quang, nhằm đảm bảo băng thông tối ưu Sức mạnh của SMT là tổng hợp từ tất cả các node kết nối với nhau.
Trong hệ thống SMT Titan, việc kết nối dây rất quan trọng, đặc biệt là trong việc sử dụng ổ lưu trữ Các ổ HDD và SSD không được gắn trực tiếp vào máy như trên PC, mà thường được bố trí trong một tủ riêng gọi là mạng lưu trữ (storage area network - SAN) Hệ thống này có kết nối mạng riêng và dung lượng lưu trữ lớn, đáp ứng nhu cầu xử lý dữ liệu hiệu quả.
Hiện nay, ngoài việc sử dụng CPU truyền thống, các GPGPU (general purpose graphic processor unit) đã trở thành một phần quan trọng trong việc nâng cao sức mạnh cho SMT (supercomputing technology) GPGPU không chỉ được biết đến với khả năng xử lý đồ họa mà còn có thể xử lý dữ liệu và thực hiện các tác vụ tương tự như CPU Với giá thành giảm và hiệu suất tăng cao, ngày càng nhiều SMT tận dụng GPGPU để cải thiện hiệu suất mà không làm tăng chi phí quá nhiều Ví dụ, SMT mạnh nhất thế giới tính đến ngày 23/5/2013, mang tên Titan, sử dụng 18.688 GPU NVIDIA Tesla K20 và 18.688 CPU AMD Opteron 16 nhân, tổng cộng đạt 299.008 nhân CPU, một con số ấn tượng so với các máy tính chỉ có 2 hoặc 4 nhân.
Một node của SMT Titan bao gồm 4 CPU AMD Opteron với 16 nhân và 4 GPU NVIDIA Tesla K20 sử dụng kiến trúc Kepler Mỗi node được trang bị 32GB RAM và 6GB bộ nhớ GDDR5 từ card đồ họa, mang lại tổng dung lượng bộ nhớ trong lên đến 710 Terabyte cho hệ thống Titan.
Việc sử dụng GPGPU để tăng cường hiệu suất của CPU vẫn là một chủ đề gây tranh cãi trong giới khoa học Nhiều chuyên gia cho rằng GPGPU có thể cải thiện đáng kể khả năng của SMT và đạt điểm benchmark cao hơn Tuy nhiên, thực tế cho thấy việc tối ưu hóa phần mềm để khai thác tối đa sức mạnh của kiến trúc kết hợp này đòi hỏi rất nhiều công sức và thời gian.
Cấu trúc của hệ thống Titan được phát triển bởi hãng Cray, kết hợp giữa hai loại máy Cray XK6 và XE6 Trong đó, máy XK6 được trang bị hai card đồ họa NVIDIA cùng với bộ nhớ RAM và CPU AMD Opteron 64.
Châu Âu đang phát triển dự án SMT mang tên Mont-Blanc, sử dụng 256 bộ vi xử lý bốn nhân NVIDIA Tegra 3 và 256 bộ xử lý đồ họa GeForce 520MX, cùng với 1TB bộ nhớ RAM DDR3 Với cấu hình này, hệ thống có khả năng đạt 38 teraflops mỗi giây, tiêu tốn chỉ 1W cho mỗi 7,5 gigaflops NVIDIA khẳng định đây là SMT đầu tiên kết hợp CPU ARM với GPU của hãng, hứa hẹn mang lại hiệu suất cao gấp 4 đến 10 lần so với các đối thủ vào năm 2014.
Hình 3-7 Chi tiết phần cứng CPU Tegra 3 v2 GPU GeForce
Hình 3-8 Cấu trúc SMT dùng CPU Tegra 3 v2 GPU GeForce
Tản nhiệt, tiêu thụ năng lượng
Trong nhiều thập kỷ qua, vấn đề tiêu thụ năng lượng và tản nhiệt đã trở thành thách thức lớn đối với các hệ thống SMT dạng tập trung Mỗi SMT tiêu thụ một lượng điện năng đáng kể, phần lớn chuyển hóa thành nhiệt, gây ra hiện tượng quá nhiệt, làm giảm hiệu suất và rút ngắn tuổi thọ linh kiện Các nhà khoa học đã nghiên cứu nhiều giải pháp như bơm chất làm mát Flourinert, làm mát bằng chất lỏng, không khí, và hệ thống lai giữa chất lỏng và không khí, đặc biệt là trong các SMT có nhiều tủ chứa Ngoài ra, một số SMT còn áp dụng vi xử lý năng lượng thấp để đối phó với nhiệt độ cao, như chiếc Blue Gene của IBM.
IBM Aquasar nổi bật với khả năng sử dụng nước nóng để tản nhiệt, đồng thời dòng nước này còn được tận dụng để sưởi ấm toàn bộ tòa nhà trong mùa đông.
IBM's SMT Blue Gene có khả năng thực hiện 2.10^15 phép tính mỗi giây, tương đương 2 gigaflop/s trên mỗi Watt điện Khi mẫu thử Mont-Blanc hoàn thiện, nó sẽ đạt tới 7 gigaflop/s trên mỗi Watt, gấp hơn hai lần so với Blue Gene, và sẽ sử dụng khoảng 2.000 - 4.000 bộ xử lý Thay vì sử dụng ít vi xử lý với mức tiêu thụ điện năng cao, các nhà khoa học sẽ áp dụng nhiều vi xử lý nhỏ với mức tiêu thụ điện năng trung bình.
Chip Tegra 3 tiêu thụ khoảng 4W, trong khi các CPU Intel Xeon có thể tiêu tốn từ 50W đến 100W khi hoạt động Để SMT hoạt động trên GPU và CPU Tegra 3, phần mềm cần được viết lại NVIDIA đã giới thiệu bộ phát triển cho phép lập trình viên xây dựng phần mềm SMT cho các sản phẩm của họ Đặc biệt, NVIDIA cũng bắt đầu sản xuất chip thế hệ tiếp theo của Tegra 3, bao gồm bộ xử lý 64-bit dựa trên nhân ARM Cortex A15, giúp SMT hoạt động mạnh mẽ hơn với khả năng tính toán nhanh gấp 4 lần nhưng vẫn duy trì mức tiêu thụ 4W cho mỗi CPU.
Hình 3-9 Hệ thống tản nhiệt bằng nước của Titan
Siêu máy tính tiêu thụ lượng điện lớn, điển hình là Tianhe-1A của Trung Quốc với công suất 4,04 megawatt, khiến cơ quan quản lý phải chi khoảng 400 USD mỗi giờ, tương đương 3,5 triệu USD mỗi năm Do đó, chi phí vận hành siêu máy tính (SMT) trở thành một thách thức phức tạp Để đánh giá hiệu suất năng lượng của SMT, người ta sử dụng chỉ số FLOPS trên Watt, với giá trị càng cao càng tốt, cho thấy khả năng tính toán nhiều phép tính hơn với mỗi Watt điện tiêu thụ Ví dụ, vào năm 2008, siêu máy tính Roadrunner của IBM đạt 376 MFLOPS/W, trong khi Blue Gene/Q vào năm 2010 đạt 1684 MFLOPS/W và Blue Gene tại New York vào năm 2011 đạt 2097 MFLOPS/W.
Các hãng sản xuất SMT đã triển khai nhiều giải pháp nhằm tiết kiệm năng lượng và cải thiện tản nhiệt Một ví dụ điển hình là hệ thống làm mát bằng nước ấm Aquasar của IBM, được lắp đặt tại Viện kỹ thuật liên bang Thụy Sĩ (ETH Zurich) Hệ thống này tiêu thụ ít năng lượng hơn 40% so với các máy làm mát bằng không khí và giảm 85% lượng khí thải CO2 bằng cách sử dụng nhiệt thải từ máy tính để làm nóng hệ thống sưởi của tòa nhà.
Một bộ khung chứa SMT sẽ được làm mát bằng không khí để so sánh trực tiếp, trong khi bộ khung còn lại sử dụng hệ thống làm mát bằng ống chất lỏng lắp đặt trên các bộ xử lý Một số bộ phận bên trong SMT sẽ được làm mát bằng nước ấm với nhiệt độ khoảng 60 độ C.
Hình 3-10 Mô hình SMT làm mát bằng nước ấm
Nước ấm giúp các bộ xử lý hoạt động hiệu quả dưới ngưỡng nhiệt độ tối đa, với khả năng tản nhiệt gấp 4.000 lần so với hệ thống làm mát bằng không khí Nhiệt thải từ hệ thống SMT được chuyển sang hệ thống sưởi ấm của tòa nhà, góp phần quan trọng vào sự phát triển của các hệ thống SMT hiệu năng cao như Aquasar Trong tương lai, hiệu quả của máy tính sẽ được đánh giá qua mức tiêu thụ năng lượng và lượng khí CO2 thải ra.
Aquasar đã đạt hiệu năng 6 teraflops khi kiểm tra bằng hệ thống benchmark LINPACK, với mức tiêu hao năng lượng khoảng 450 megaflops/watt Đặc biệt, hệ thống vẫn cung cấp 9 kilowatt nhiệt năng cho hệ thống sưởi của tòa nhà.
HỆ ĐIỀU HÀNH VÀ PHẦN MỀM
Hệ điều hành
Từ đầu thế kỉ 20, hệ điều hành cho SMT đã trải qua nhiều thay đổi, tương tự như sự tiến hóa của kiến trúc supercomputer Những hệ điều hành đầu tiên được tùy chỉnh cho từng SMT nhằm tăng tốc độ nhưng tiêu tốn nhiều thời gian, công sức và chi phí Hiện nay, xu hướng sử dụng các hệ điều hành chung như Linux cho SMT đang phổ biến, thay thế cho UNIX như trong những năm 90 Biểu đồ dưới đây minh họa rõ xu hướng chuyển dịch này.
Trong số 500 SMT nhanh nhất thế giới, Linux chiếm ưu thế với 93,8% thị phần, cho thấy sự ưa chuộng ngày càng tăng đối với hệ điều hành nguồn mở này UNIX cũng được sử dụng nhưng chỉ nắm 4% thị phần, không phổ biến bằng Linux Các hệ điều hành khác như Windows và BSD có số lượng không đáng kể do thiếu độ tin cậy và ảnh hưởng của chi phí bản quyền Trước đây, OS X của Apple cũng từng được sử dụng cho SMT, chủ yếu trong các siêu máy tính phân tán.
Công cụ phần mềm
Với kiến trúc tính toán song song của SMT, cần áp dụng các kỹ thuật lập trình đặc biệt để tận dụng tối đa sức mạnh của nó, sử dụng các hàm API như MPI, PVM, VTL và các giải pháp phần mềm nguồn mở như EBowulf PVM và MPI thường được áp dụng cho các hệ thống cluster, trong khi OpenMP thích hợp cho hệ thống có bộ nhớ chia sẻ Để tối ưu hóa hiệu suất, các thuật toán cần được cải thiện, vì SMT hoạt động trên nhiều CPU và GPU, và các tủ SMT thường tách biệt nhau Các nhà khoa học cũng cần giảm thiểu thời gian rỗi của CPU khi chờ dữ liệu từ các node khác Đối với SMT sử dụng GPGPU, mô hình CUDA của NVIDIA được áp dụng để nâng cao hiệu suất máy.
SIÊU MÁY TÍNH KIẾU PHÂN TÁN
Phương pháp cơ hội - opportunistic
Điện toán grid là một hình thức mà trong đó nhiều máy tính cá nhân phối hợp để tạo thành một mạng lưới lớn nhằm thực hiện các tác vụ tính toán khổng lồ Phương pháp này đã giúp giải quyết nhiều vấn đề liên quan đến điện toán song song, tuy nhiên, nó cũng có những hạn chế, chẳng hạn như không thể xử lý một số tác vụ cổ điển như mô phỏng dòng chảy.
Mạng lưới điện toán grid Folding@Home, phát triển bởi đại học Stanford, là hệ thống mạnh nhất tính đến tháng 3/2012 với sức mạnh 8,1 petaflops, sử dụng vi xử lý x86 Trong đó, 5,8 petaflops đến từ các máy tính sử dụng GPU khác nhau, 1,7 petaflops từ máy chơi game PlayStation 3, và phần còn lại từ CPU Năm 2011, hệ thống grid BOINC đạt sức mạnh 5,5 petaflops với 480.000 máy tính tham gia Năm ngoái, Simon Cox đã phát triển hệ thống Iridis-Pi với 64 chiếc Raspberry Pi, có chi phí 2500 Bảng Anh và bộ nhớ 1TB, sử dụng 16GB thẻ SD cho mỗi Raspberry Pi.
Phương pháp cận cơ hội - quasi-opportunistic
Điện toán quasi-opportunistic nâng cao chất lượng dịch vụ so với điện toán opportunistic bằng cách kiểm soát chặt chẽ các tác vụ của từng máy đơn lẻ và quản lý hiệu quả tài nguyên phân tán Hệ thống thông minh đi kèm đảm bảo sự hiện diện và ổn định của các máy thành viên Để tối ưu hóa phương pháp này, các máy tính cần thiết lập "hợp đồng phân bổ tài nguyên" kết hợp với các hình thức liên lạc và chống lỗi phức tạp.
CHƯƠNG 6 : ĐO ĐẠC HIỆU NĂNG
Khả năng và dung lượng
SMT được thiết kế để tối ưu hóa khả năng tính toán, nhằm giải quyết các phép tính phức tạp trong thời gian ngắn nhất Với khả năng xử lý vượt trội, SMT có thể thực hiện những tác vụ mà máy tính thông thường không thể đảm đương, như mô phỏng vụ nổ hạt nhân, dự báo thời tiết và nghiên cứu lượng tử.
Nếu cần xử lý một khối lượng lớn dữ liệu, người ta thường sử dụng máy tính mainframe thay vì SMT Mainframe có khả năng tiếp nhận dữ liệu đầu vào khổng lồ, nhưng các phép tính thực hiện không phức tạp như SMT Máy tính mainframe chủ yếu được dùng để giải quyết nhiều vấn đề nhỏ đồng thời.
Đo đạc hiệu năng siêu máy tính
Trên các thiết bị như PC, laptop, tablet và smartphone, người dùng thường thực hiện benchmark để đánh giá hiệu suất máy Tương tự, trên SMT, khả năng tính toán cũng được đo bằng FLOPS (FLoating Point Operations Per Second), tức số phép tính dấu chấm động thực hiện trong mỗi giây Trong khi đó, máy tính thông thường được đo bằng MIPS (instructions per second), tức số chỉ dẫn thực hiện trong mỗi giây FLOPS có thể được bổ sung bằng các tiền tố trong hệ đo lường SI như tera- (TFLOPS, tương đương 10^12 FLOPS, đọc là teraflops) và peta (10^15 FLOPS).
Hiện nay, các siêu máy tính (SMT) hàng đầu thế giới đã đạt ngưỡng Petaflops, với IBM Roadrunner năm 2008 đạt 1,105 Petaflops, Fujitsu K năm 2011 với 10,51 Petaflops, và Cray Titan hiện tại mạnh nhất với 17,59 Petaflops Dự đoán rằng trong khoảng 10 năm tới, SMT sẽ tiến tới ngưỡng Exaflops (10^18 FLOPS) nhờ vào sự phát triển vượt bậc của công nghệ CPU và GPGPU, cùng với việc giảm giá thành và cải thiện hiệu năng tiêu thụ điện.
Các con số FLOPS được đo bằng phần mềm Linpack, nhưng không có con số nào đơn lẻ có thể phản ánh toàn bộ hiệu năng của máy tính, đặc biệt là SMT Khi nói đến SMT, có hai chỉ số quan trọng: hiệu năng tính toán dấu chấm động lý thuyết (Rpeak) và hiệu năng xử lý đầu vào (Rmax) Rpeak gần như không thể đạt được trong thực tế, trong khi Rmax hoàn toàn có thể đạt được khi SMT hoạt động Tất cả các con số FLOPS mà bạn thấy đều là Rmax.
Danh sách TOP500
Kể từ năm 1993, danh sách TOP500 đã ghi nhận những siêu máy tính (SMT) nhanh nhất thế giới dựa trên điểm số benchmark Trang web TOP500 tại http://top500.org cung cấp thông tin hữu ích về các siêu máy tính hàng đầu, bao gồm thống kê phân bổ hệ điều hành, số lượng SMT theo quốc gia, và kiến trúc SMT (MPP hay cluster).
Một số nhà khoa học tại Đại học Illinois không đồng tình với cách xếp hạng TOP500, cho rằng công cụ Linpack không phản ánh chính xác hiệu năng thực tế của hệ thống đa luồng (SMT) Do đó, họ đã quyết định không nộp hồ sơ để đưa siêu máy tính Blue Waters của mình vào danh sách này.
Danh sách này không hoàn toàn chính xác và không thiên vị, nhưng nó là một trong những nguồn phổ biến nhất được sử dụng để so sánh sức mạnh SMT tại một thời điểm nhất định.
Thứ hạng Tên hệ thống Số nhân Rmax
10 Tianhe-1A 186,368 2,566.00 4,701.00 4,040 Bảng 6-1 Danh sách 10 SMT mạnh nhất tháng 6/2014 (nguồn: phụ lục 2)
Vào tháng 6 năm 2014, trong danh sách TOP500 phiên bản thứ 41, SMT Tianhe-2 (hay còn gọi là Milky Way-2) của Trung Quốc đã trở thành siêu máy tính mạnh nhất thế giới, vượt qua SMT Titan của Mỹ Được trang bị 32.000 vi xử lý Intel Xeon E5-2600 v2 và 48.000 coprocessor Xeon Phi, Tianhe-2 có khả năng tính toán ấn tượng với tốc độ 33,85 petaflops, gấp đôi so với Titan.
Tianhe-2 không chỉ là siêu máy tính mạnh nhất trong TOP500 mà còn có hiệu suất năng lượng vượt trội với tổng công suất 17,8 megawatt Hệ thống này sử dụng "kiến trúc tân hỗn tạp", cho phép nhiều phần cứng với khả năng tính toán khác nhau được truy cập thông qua một mô hình lập trình chung Điều này không chỉ đơn giản hóa quá trình phát triển mà còn tối ưu hóa hệ thống, mang lại lợi thế mà các siêu máy tính sử dụng CPU kết hợp với GPU như Titan không có được.
ỨNG DỤNG VÀ NHỮNG THÔNG TIN KHÁC
Một số ứng dụng của siêu máy tính
Các ứng dụng của SMT hàng đầu trên thế giới thường rất nhạy cảm và được giữ bí mật, dẫn đến thông tin về chúng rất hạn chế Bốn nhóm ứng dụng chính của SMT bao gồm: vũ khí hạt nhân, năng lượng, quân sự và các hệ thống máy móc lớn.
Hình 7-1 Ảnh mô phỏng do SMT dựng ra của Cơ quan Khí tượng và Hải dương Mỹ
Bên cạnh đó, SMT còn được sử dụng để giúp chúng ta thực hiện nhiều công việc tưởng chừng như không thực hiện được như:
Dự báo thời tiết, nghiên cứu khí động học, nghiên cứu sự biến đổi khí hậu, mô phỏng động đất
Phân tích xác suất, dựng mô hình phóng xạ, mô phỏng vụ nổ hạt nhân trong không gian 3D
Lượng tử học, phân tử học, sinh học tế bào, nghiên cứu sự gấp khúc của protein, dựng mô hình lây lan của dịch bệnh
Nghiên cứu và dựng mô hình của các hiện tượng vật lý
Mô phỏng não người, nghiên cứu và mô phỏng trí tuệ nhân tạo
Nghiên cứu thiên văn học, tái tạo vụ nổ Bigbang (do SMT ở trung tâm Texas Advanced Computing Center thực hiện), nghiên cứu về vật chất tối
Chơi cờ vua! (SMT Deep Blue của IBM từng đánh bại đại kiện tướng Garry Kasparov vào năm 1997)
Và dưới đây là những ứng dụng cụ thể của các SMT trên thế giới hiện nay:
7.1.1 Siêu máy tính Titan - nghiên cứu về biến đổi khí hậu và nhiên liệu thay thế
Titan là phiên bản nâng cấp của Jaguar, ra mắt năm 2009 và từng là siêu máy tính mạnh nhất thế giới Với mục tiêu hỗ trợ các nhà nghiên cứu từ học viện, phòng thí nghiệm chính phủ và các ngành công nghiệp khác, Titan giúp nghiên cứu các vấn đề quan trọng như biến đổi khí hậu và phát triển nhiên liệu thay thế Các nhà khoa học cho rằng dự báo thời tiết sẽ chính xác hơn rất nhiều nhờ vào sức mạnh tính toán của SMT Titan.
Hiện tại, có sáu lĩnh vực chủ yếu được nhắm tới để khai thác sức mạnh Titan phục vụ công tác nghiên cứu:
Khoa học vật liệu tập trung vào việc nghiên cứu và tìm kiếm các vật liệu ở cấp độ nguyên tử, nhằm hiểu rõ các thuộc tính của chúng Ngoài ra, lĩnh vực này còn liên quan đến việc phát triển các vật liệu mới với những đặc tính vượt trội.
Biến đổi khí hậu đang diễn ra mạnh mẽ, và các nhà nghiên cứu đang nỗ lực tìm hiểu nguyên nhân cũng như cách thức để thay đổi và thích ứng với những tác động của nó.
Nhiên liệu sinh học là quá trình chuyển đổi các loại thực vật, như cỏ, thành ethanol thông qua việc sử dụng chất xúc tác enzym, một loại chất xúc tác sinh học chủ yếu được cấu tạo từ protein.
Năng lượng hạt nhân là công nghệ tiên tiến có khả năng kích thích nơtron trong các phản ứng tổng hợp và phân hạch Công nghệ này không chỉ cung cấp những dạng năng lượng an toàn và sạch hơn mà còn hứa hẹn những loại nhiên liệu mới có thời gian đốt cháy lâu hơn và hiệu quả hơn.
Titan cho phép mô phỏng các quá trình đốt cháy, giúp các nhà nghiên cứu tối ưu hóa nhiên liệu, quy trình và thiết kế động cơ Điều này hướng tới việc phát triển nhiên liệu cháy sạch hơn, góp phần bảo vệ môi trường và nâng cao hiệu suất năng lượng.
7.1.2 Siêu máy tính Roadrunner - mô hình hóa sự phân hủy của kho vũ khí hạt nhân của Mỹ
Vào năm 2008, IBM đã phát triển chiếc SMT Roadrunner nhằm mô hình hóa sự phân hủy của kho vũ khí hạt nhân của Mỹ Trong suốt 5 năm hoạt động, Roadrunner đã đóng góp quan trọng cho Cục An ninh hạt nhân quốc gia và chương trình Stockpile Stewardship, tập trung vào nghiên cứu kho vũ khí hạt nhân Hệ thống này không chỉ mạnh mẽ trong các công việc tính toán liên quan đến ngăn chặn hạt nhân mà còn đóng vai trò thiết yếu trong nhiều chương trình khoa học khác.
7.1.3 Siêu máy tính Blue Waters - vũ khí mới trong việc ngăn chặn virus HIV
Hiện nay, việc vô hiệu hóa hoàn toàn virus HIV và loại bỏ khả năng kháng thuốc của nó vẫn là một thách thức lớn đối với các nhà khoa học HIV lây nhiễm vào các tế bào quan trọng trong hệ thống miễn dịch như tế bào T - CD4+, đại thực bào và tế bào tua, dẫn đến sự giảm mạnh số lượng tế bào CD4+ thông qua ba cơ chế chính: virus giết chết tế bào nhiễm, tăng tỷ lệ chết rụng tế bào, và tế bào T độc (CD8) tiêu diệt tế bào T - CD4+ bị nhiễm Khi số lượng tế bào CD4+ giảm xuống dưới mức giới hạn, hệ miễn dịch bị suy yếu, tạo điều kiện cho các nhiễm trùng cơ hội Tuy nhiên, nhờ nỗ lực của các nhà nghiên cứu từ Đại học Pittsburgh và Đại học Illinois, hy vọng về việc tìm ra giải pháp cho vấn đề này vẫn tiếp tục được duy trì.
SMT Blue Waters, chúng ta đã thu được những thành quả nhất định trên con đường ngăn chặn tận gốc sự phát triển của loại virus nguy hiểm này
HIV có cấu trúc độc đáo khác biệt so với các retrovirus khác, với hình dạng cầu và đường kính khoảng 120 nm, nhỏ hơn 60 lần so với tế bào hồng cầu nhưng vẫn được coi là lớn trong thế giới virus Virus này chứa 2 bản sao ARN chuỗi đơn dương mã hóa 9 gen, được bao bọc bởi lớp vỏ capsid hình nón với khoảng 2.000 bản sao protein p24 Các RNA sợi đơn liên kết với protein nucleocapsid p7 và các enzyme thiết yếu như enzyme phiên mã ngược, protease, ribonuclease và integrase Capsid không chỉ bảo vệ RNA mà còn giúp virus né tránh hệ thống miễn dịch của vật chủ và xâm nhập vào tế bào người Khi vào bên trong tế bào, capsid sẽ phân chia để giải phóng các thành phần cần thiết cho quá trình tái tạo virus, cho thấy capsid là "điểm then chốt" trong việc tìm kiếm phương thuốc hiệu quả để tiêu diệt HIV.
Hình 7-2 Cấu trúc virus HIV
Virus HIV có cấu trúc bao ngoài gồm một lớp màng lipid kép, bên dưới là các glycoprotein gp120 với trọng lượng phân tử 120 kilođanton (KD) Vỏ protein của virus có hình cầu, được tạo thành từ các phân tử protein p18 có trọng lượng phân tử 18KD Lõi virus có dạng hình trụ, được bao bọc bởi một lớp protein p24.
Phó giáo sư tiến sĩ Peijun Zhang, trưởng khoa sinh học cấu trúc tại Trường Đại học y khoa Pittsburgh, nhấn mạnh tầm quan trọng của capsid trong sự sinh sôi của virus HIV Ông cho rằng việc hiểu rõ cấu trúc chi tiết của capsid có thể dẫn đến phát triển dược phẩm mới, giúp chữa trị hoặc ngăn chặn lây nhiễm HIV Capsid bảo vệ bộ gen HIV khi xâm nhập vào cơ thể và sau đó phân chia để giải phóng các thành phần, tạo điều kiện cho virus tái tạo Do đó, phát triển thuốc gây rối loạn chức năng capsid bằng cách ngăn chặn lắp ráp hoặc tháo rời có thể làm giảm khả năng sinh sản của virus trong cơ thể người bệnh.
Hình 7-3 Cấu trúc capsid của virus HIV
Một thách thức lớn trong việc giải mã cấu trúc caspid là kích thước lớn, tính không đối xứng và không đồng bộ của nó, khiến cho các kỹ thuật như kính hiển vi điện tử cryo-electron, chụp cắt lớp cryo-EM và X-quang cấu trúc tinh thể không đạt được kết quả tích cực Điều này vẫn nằm ngoài khả năng của khoa học hiện tại do thiếu kỹ năng tính toán mô hình hóa ở cấp độ nguyên tử Để giải quyết vấn đề này, nhóm nghiên cứu của phó giáo sư Peijun Zhang đã quyết định hợp tác với Trung tâm ứng dụng SMT của Đại học Illinois tại Urbana-Champaign.
Nhóm nghiên cứu từ Đại học Pittsburgh, nhờ sự hỗ trợ của SMT, đã thành công trong việc tính toán cách 1.300 protein kết nối để hình thành lớp vỏ capsid hình nón của virus HIV Họ vừa công bố cấu trúc capsid hoàn chỉnh trong báo cáo trên tạp chí Nature, cho rằng việc hiểu rõ cấu trúc này sẽ giúp các nhà khoa học khám phá cơ chế hoạt động của virus và tìm ra phương pháp tấn công để ngăn chặn khả năng nhân rộng của nó.
Hình 7-4 Lớp vỏ capsid hình nón của virus HIV
Phó giáo sư Zhang nhấn mạnh rằng sự biến đổi nhanh chóng của virus HIV đã dẫn đến khả năng kháng thuốc mạnh mẽ Nghiên cứu của chúng tôi hứa hẹn sẽ phát triển một phương pháp chữa trị mới, thay thế các liệu pháp hiện tại, vốn tập trung vào việc tấn công các enzyme nhất định hoặc tách virus HIV ra khỏi tế bào ADN, qua đó giúp hệ miễn dịch tiêu diệt virus này.
7.1.4 Siêu máy tính Watson – siêu máy tính đa năng
Một số hãng sản xuất và cung cấp siêu máy tính
IBM, HP, and Cray are currently the leading companies in the field of SMT, with Dell, Intel, NEC, Lenovo, Acer, Fujitsu, and Oracle also participating in this sector.
Hình 7-5 Biểu đồ tỉ lệ % số lượng máy tính do các công ty sản xuất SMT
Các nước có siêu máy tính
STT Quốc gia Số lượng
Bảng 7-1 Danh sách 10 quốc gia có số lượng SMT lớn nhất tháng 6/2014 (nguồn: phụ lục 3)
Hình 7-6 Biểu đồ tỉ lệ % số lượng SMT của các nước trên thế giới tháng 6/2014
Mỹ hiện đang dẫn đầu với gần một nửa số lượng SMT trong top 500 toàn cầu, trong khi Trung Quốc đang chứng kiến sự tăng trưởng mạnh mẽ và hiện là quốc gia có SMT phát triển nhất thế giới.