Yell HN / Những bài viết hay nhất trên Hacker News, kể lại theo cách của tôi.

Bài viết với thẻ #quantization

Tìm thấy 1 bài viết

johndcook.com — 16 con số để chạy mô hình ngàn tỉ tham số
29 thg 5, 2026 1.4k 1.4k

16 con số để chạy mô hình ngàn tỉ tham số

FP4, định dạng số thực 4-bit với đúng 16 giá trị, đang là chuẩn mặc định để chạy các mô hình ngôn ngữ lớn trên GPU Blackwell của NVIDIA.

machine-learning floating-point nvidia quantization ai-inference
johndcook.com

© 2026 Hoang Yell

Những bài viết hay nhất trên Hacker News, kể lại theo cách của tôi.