Tencent mở mã nguồn hệ thống bộ nhớ AI — kiến trúc 4 tầng tương đẳng bộ nhớ con người

Tencent vừa mở mã nguồn TencentDB-Agent-Memory — hệ thống bộ nhớ dài hạn cho tác nhân AI chạy hoàn toàn cục bộ, không phụ thuộc API bên ngoài. Kiến trúc 4 tầng tiến triển: Tầng 0 lưu toàn bộ hội thoại gốc, không lọc. Tầng 1 tự trích xuất sự kiện, sở thích, ràng buộc từ tín hiệu ồn. Tầng 2 gom nhóm theo dự án, chủ đề, kịch bản — nhớ theo ngữ cảnh. Tầng 3 xây hồ sơ ổn định về người dùng, giúp tác nhân làm việc theo thói quen. Đây chính là mô hình tương đẳng với cách não người củng cố ký ức: từ ký ức tình tiết sang ký ức ngữ nghĩa rồi đến ký ức bản sắc. ...

26 tháng 5, 2026 · 2 min · Lộc Đặng

Chi phí suy luận AI giảm 1000 lần — mô hình kinh doanh đang viết lại

Năm 2022, chạy 1 triệu token AI tốn khoảng 400 đô la. Năm 2026, con số đó chỉ còn 0,40 đô la. Không phải giảm dần — mà là sụp đổ giá. Khi chi phí suy luận rơi tự do ở tốc độ này, mọi mô hình kinh doanh xây trên “AI đắt đỏ” đều bị đảo ngược. DeepSeek V4-Pro ra mắt với giá 0,30 đô la triệu token, mở mã nguồn giấy phép MIT, chạy 80,6% thước đo chuẩn SWE-bench. Qwen 3.6 Plus chỉ bằng 1/30 giá Claude Opus mà đạt 78,8%. Đây không còn là cuộc đua “ai giỏi hơn” — nó là cuộc đua “ai rẻ hơn”. Chip H100 giảm giá 94% trên thị trường thứ cấp. Việc huấn luyện và chạy mô hình không còn là đặc quyền của công ty tỷ đô. Người làm một mình giờ có thể xây sản phẩm AI mà chi phí hạ tầng thấp hơn tiền cà phê hàng tháng. Hệ quả: giá trị không còn nằm ở mô hình — nó chuyển sang dữ liệu độc quyền, quy trình tinh chỉnh, và trải nghiệm người dùng. ...

20 tháng 5, 2026 · 2 min · Lộc Đặng