Bài viết với thẻ #machine-learning

Tìm thấy 2 bài viết

Kiến trúc đơn giản đến khó tin đứng sau cơn sốt AI

Một bài bóc tách từ gốc cách các LLM transformer thật sự hoạt động: token, embedding, attention và vòng lặp đoán từ kế tiếp - không phương trình.

FP4, định dạng số thực 4-bit với đúng 16 giá trị, đang là chuẩn mặc định để chạy các mô hình ngôn ngữ lớn trên GPU Blackwell của NVIDIA.