NVIDIA Nemotron 3 Super vượt mặt DeepSeek và GPT-OSS
NVIDIA vừa ghi dấu ấn mạnh mẽ trong cuộc đua AI mã nguồn mở khi mô hình Nemotron 3 Super vươn lên vị trí số 1 trên bảng xếp hạng các mô hình open-source. Theo các bài đánh giá mới nhất, mô hình này đạt điểm trung bình 27,3 và vượt qua nhiều đối thủ lớn như DeepSeek v3.2 hay GPT-OSS-120B. Điểm đáng chú ý của Nemotron 3 Super không chỉ nằm ở hiệu năng, mà còn ở kiến trúc. Đây là mô hình lai giữa Transformer và Mamba, sử dụng cơ chế Mixture-of-Experts với tổng 120 tỷ tham số nhưng chỉ kích hoạt khoảng 12 tỷ trong mỗi lần suy luận. Điều này giúp tối ưu chi phí tính toán mà vẫn giữ hiệu suất cao.

Ngoài ra, mô hình còn hỗ trợ context cực lớn, lên tới hàng trăm nghìn đến 1 triệu token, mở ra khả năng xử lý các tác vụ dài và phức tạp như phân tích tài liệu lớn, tự động hóa quy trình doanh nghiệp hay xây dựng AI agent đa bước. Việc NVIDIA công khai mô hình này với trọng tâm “AI mở” cho thấy xu hướng cạnh tranh ngày càng khốc liệt, đặc biệt khi các công ty Trung Quốc như DeepSeek đang nổi lên mạnh mẽ với chiến lược chi phí thấp. Nemotron 3 Super vì thế không chỉ là một sản phẩm công nghệ, mà còn là bước đi chiến lược nhằm giữ vị thế của NVIDIA trong hệ sinh thái AI toàn cầu.
Nguồn: Wccftech
AMD chuẩn bị tung mini PC AI Halo với RAM 128GB
AMD đang chuẩn bị tung ra một dòng mini PC hoàn toàn mới mang tên Ryzen AI Halo, dự kiến ra mắt vào tháng 6/2026. Thiết bị này được định vị là nền tảng dành cho lập trình viên và nhà phát triển AI, với trọng tâm là xử lý AI cục bộ (local AI). Sức mạnh của máy đến từ chip Ryzen AI Max+ 395, tích hợp CPU Zen 5, GPU RDNA 3.5 và NPU XDNA 2 với hiệu năng AI đạt khoảng 50 TOPS. Đặc biệt, hệ thống có thể trang bị tới 128GB RAM unified – một con số rất lớn đối với mini PC, cho phép chạy các mô hình AI nặng trực tiếp trên máy mà không cần cloud.

AMD cũng cho biết thiết bị hỗ trợ các công cụ phổ biến như LM Studio, ComfyUI hay Visual Studio Code, cùng hệ sinh thái ROCm nhằm tối ưu cho AI. Điều này cho thấy hãng đang muốn cạnh tranh trực tiếp với các giải pháp như NVIDIA DGX Spark, vốn có giá khá cao. Xu hướng “AI chạy tại chỗ” đang ngày càng rõ ràng, khi doanh nghiệp và cá nhân đều quan tâm tới bảo mật dữ liệu và giảm chi phí cloud. Ryzen AI Halo có thể trở thành một lựa chọn đáng chú ý nếu mức giá nằm trong khoảng 2.000–3.000 USD như dự đoán.
Nguồn: TechSpot
DDR6 bắt đầu phát triển, dự kiến ra mắt 2028–2029
Ngành công nghiệp bộ nhớ đang chuẩn bị cho bước nhảy tiếp theo với DDR6 – thế hệ RAM kế nhiệm DDR5. Theo các nguồn tin mới, các nhà sản xuất đã bắt đầu quá trình phát triển và đặt mục tiêu thương mại hóa vào giai đoạn 2028–2029. DDR6 được kỳ vọng sẽ mang lại băng thông vượt trội, đáp ứng nhu cầu ngày càng tăng từ AI, data center và gaming cao cấp. Trong bối cảnh các mô hình AI ngày càng lớn và yêu cầu xử lý dữ liệu nhanh hơn, bộ nhớ trở thành một trong những yếu tố then chốt quyết định hiệu năng hệ thống.

Không chỉ cải thiện tốc độ, DDR6 còn hướng tới tối ưu điện năng và khả năng mở rộng, đặc biệt quan trọng trong các hệ thống máy chủ và AI training. Điều này phù hợp với xu hướng hiện tại khi các công ty công nghệ đang đầu tư mạnh vào hạ tầng AI quy mô lớn. Dù còn vài năm nữa mới ra mắt, nhưng việc DDR6 đã được khởi động phát triển cho thấy ngành phần cứng đang chạy đua để theo kịp tốc độ phát triển của AI và các ứng dụng dữ liệu lớn.
Nguồn: VideoCardz
ASUS được cho là cắt giảm RTX 5070 Ti để ưu tiên RTX 5080
Một báo cáo mới cho biết ASUS đang điều chỉnh chiến lược sản xuất GPU, trong đó giảm nguồn cung RTX 5070 Ti để tập trung nhiều hơn vào RTX 5080. Động thái này được cho là nhằm tối ưu lợi nhuận và đáp ứng nhu cầu thị trường, khi các dòng GPU cao cấp thường có biên lợi nhuận tốt hơn. Ngoài ra, nhu cầu cho các tác vụ AI và gaming cao cấp cũng đang tăng nhanh, khiến các hãng ưu tiên sản xuất GPU mạnh hơn.

Việc cắt giảm nguồn cung có thể dẫn đến tình trạng khan hàng hoặc tăng giá ở phân khúc tầm trung, đặc biệt trong giai đoạn đầu vòng đời sản phẩm. Điều này từng xảy ra ở các thế hệ GPU trước, khi thị trường bị ảnh hưởng bởi nhu cầu đào coin và AI. Xu hướng này cũng phản ánh sự dịch chuyển của thị trường GPU: từ gaming thuần túy sang phục vụ AI, sáng tạo nội dung và xử lý dữ liệu – những lĩnh vực sẵn sàng chi trả cao hơn cho phần cứng mạnh.
Nguồn: VideoCardz
Xuất hiện PC “khổng lồ” có thể chứa cả người và RTX 6090
Một nhà sáng tạo công nghệ đã gây chú ý khi chế tạo một chiếc PC khổng lồ đủ lớn để một người có thể chui vào bên trong. Dự án này không chỉ mang tính giải trí mà còn là cách để hình dung về tương lai của phần cứng. Chiếc PC được thiết kế để có thể chứa các linh kiện siêu lớn, thậm chí hướng tới những GPU thế hệ tương lai như RTX 6090. Điều này phản ánh một thực tế: phần cứng ngày càng lớn, tiêu thụ điện cao và cần hệ thống tản nhiệt phức tạp hơn.

Dù mang tính thử nghiệm, dự án này cũng đặt ra câu hỏi thú vị về giới hạn vật lý của máy tính. Khi hiệu năng tăng lên, liệu kích thước và năng lượng tiêu thụ có tiếp tục phình to, hay ngành công nghệ sẽ tìm ra hướng đi mới như tối ưu kiến trúc, chiplet hay điện toán lượng tử? Ở góc độ truyền thông, đây là một ví dụ điển hình của content viral trong giới công nghệ – nơi những ý tưởng “điên rồ” lại giúp thu hút sự chú ý và kích thích trí tưởng tượng về tương lai.
Nguồn: VideoCardz
Đừng quên theo dõi HACOM để cập nhật những tin tức công nghệ mới nhất mỗi ngày!
Xem thêm:















