Bài viết với thẻ #machine-learning
Tìm thấy 2 bài viết
947 276
Kiến trúc đơn giản đến khó tin đứng sau cơn sốt AI
Một bài bóc tách từ gốc cách các LLM transformer thật sự hoạt động: token, embedding, attention và vòng lặp đoán từ kế tiếp - không phương trình.
0xkato.xyz
1.4k 1.4k
16 con số để chạy mô hình ngàn tỉ tham số
FP4, định dạng số thực 4-bit với đúng 16 giá trị, đang là chuẩn mặc định để chạy các mô hình ngôn ngữ lớn trên GPU Blackwell của NVIDIA.
johndcook.com