Suy nghĩ về AI, khởi nghiệp, và cuộc sống
Agentic Commerce: AI agent sẽ thay thế thanh tìm kiếm của bạn
TikTok dự báo 112 tỷ đô GMV năm 2026. Nhưng con số quan trọng hơn nằm ở cách người mua tìm sản phẩm: AI agent đang thay thế tìm kiếm bằng từ khóa. Thay vì gõ “sữa rửa mặt cho da dầu”, người dùng mô tả “da mình hay đổ dầu ở vùng chữ T, nhạy cảm với hương liệu” — AI agent hiểu và đề xuất. Sự dịch chuyển này giống hệt cuộc cách mạng SEO 2005-2010. Khi Google thay đổi cách người tìm thông tin, hàng triệu doanh nghiệp phải thích nghi. Khi AI agent thay đổi cách người mua sản phẩm, hàng triệu danh mục sản phẩm phải thích nghi. Song lần này tốc độ nhanh hơn nhiều. Nếu SEO mất 5 năm để trưởng thành, tìm kiếm bằng AI agent sẽ trưởng thành trong 18 tháng. ...
AWS Agent Toolkit: MCP servers chính thức xóa bỏ lớp phát triển middleware
AWS phát hành Agent Toolkit bản chính thức với MCP servers sẵn cho S3, Lambda, DynamoDB, Bedrock — tích hợp trực tiếp vào Claude Code, Cursor, Windsurf. Điều này nghĩa là bạn không cần viết MCP server riêng cho hạ tầng AWS nữa. Trước đây, kết nối AI agent với hạ tầng AWS cần middleware tùy chỉnh: viết API wrapper, quản lý xác thực, xử lý lỗi. Công việc lặp lại, nhàm chán, dễ sai. AWS Agent Toolkit loại bỏ hoàn toàn lớp đó. MCP server sẵn có nghĩa là Claude Code có thể đọc S3, kích hoạt Lambda, truy vấn DynamoDB bằng ngôn ngữ tự nhiên — không code trung gian. ...
China chạy 100+ livestream song song 24/7 bằng AI avatar — chi phí giảm 95%
Một thương hiệu Trung Quốc chạy hơn 100 luồng livestream đồng thời, 24 giờ mỗi ngày, bằng AI avatar. Chi phí giảm 95% so với thuê người nổi tiếng thật. Đây không phải concept — đây đang diễn ra ngay bây giờ trên Douyin và TikTok Shop Trung Quốc. Mô hình này xóa bỏ giới hạn lớn nhất của thương mại livestream: thời gian và nhân lực. Trước đây, mỗi phiên live cần người dẫn, thiết lập, vận hành — giới hạn ở vài giờ mỗi ngày. AI avatar bỏ qua giới hạn đó hoàn toàn. 100 luồng chạy song song nghĩa là 100 kênh tiếp cận khách hàng cùng lúc, mỗi kênh cá nhân hóa theo phân khúc khác nhau. DeepSeek V4-Pro với giá $0.30/MTok làm cho chi phí chạy AI host 24/7 còn rẻ hơn tiền điện cho studio. ...
Cuộc chiến mô hình đã kết thúc — người thắng là builder biết tích hợp
GPT-5.5 và DeepSeek V4-Pro cách nhau đúng 2-3% trên SWE-bench, nhưng giá chênh nhau 10 lần. Số liệu này kể một câu chuyện rõ ràng: lợi thế mô hình không còn bền vững. AI đang lặp lại vòng lặp mà mọi nền công nghệ đều trải qua. Điện từ bóng đèn Edison trở thành lưới điện. Internet từ trang web trở thành dịch vụ đám mây. AI từ ChatGPT đang trở thành hạ tầng ngầm — người dùng cuối không cần biết mô hình nào đang chạy phía sau. Bằng chứng? Claude for Small Business tích hợp 15 quy trình QuickBooks, HubSpot, Google Workspace. AWS Agent Toolkit cung cấp MCP servers chính thức cho Claude Code, Cursor, Windsurf. Đây không phải tin mô hình — đây là tin phân phối. ...
DeepSeek V4-Pro: mô hình code giá rẻ đánh bại GPT trên SWE-bench
DeepSeek V4-Pro đạt 80.6% SWE-bench, giá $0.30 cho 1 triệu token, giấy phép MIT. Ba con số này kết hợp tạo ra một tín hiệu không thể bỏ qua: mô hình AI mở mã nguồn đã đạt ngưỡng “đủ tốt” cho hầu hết trường hợp sử dụng thực tế. Kiến trúc MoE 1.6T tham số với 80.6% SWE-bench nghĩa là mô hình này xử lý tác vụ lập trình phức tạp ở mức gần GPT-5.5 (chênh 2-3%). Nhưng giá rẻ hơn 10 lần. Giấy phép MIT nghĩa là bạn có thể tự host, sửa đổi, thương mại hóa không giới hạn. Ba yếu tố — hiệu năng, giá, tự do — kết hợp phá vỡ giả định rằng “phải dùng mô hình đắt nhất cho tác vụ quan trọng nhất.” ...
Inference chiếm 80% GPU spend — kỷ nguyên training kết thúc
Thị trường inference vượt 50 tỷ đô năm 2026. Tỷ lệ chi tiêu GPU đã đảo ngược: 80% inference, 20% training. Con số này kể từ năm 2022 đã thay đổi hoàn toàn cách tính toán ROI cho hạ tầng AI. Nguyên lý nền tảng: khi một thị trường chuyển từ training-dominant sang inference-dominant, động lực cạnh tranh thay đổi. Trước đây, ai có GPU nhiều nhất để huấn luyện mô hình lớn nhất, người đó dẫn đầu. Song giờ đây, ai phục vụ inference nhanh nhất và rẻ nhất, người đó chiếm thị phần. DeepSeek V4-Pro $0.30/MTok, Qwen3.6 Plus rẻ hơn Claude Opus 30 lần — giá inference đang rơi tự do, giảm 1000 lần so với 2022. H100 giảm giá 94% so với mức đỉnh. ...
WhatsApp commerce Ấn Độ: CVR 40%+, open rate 98% — bài toán Việt Nam
77% thương hiệu DTC Ấn Độ dùng WhatsApp làm kênh bán hàng. Tỷ lệ mở tin nhắn 98%. Tỷ lệ chuyển đổi thanh toán trong chat 40%+. Ba con số này vẽ ra một chân dung rõ ràng: WhatsApp là kênh thương mại hiệu quả nhất ở thị trường mà người dùng xem tin nhắn trước khi kiểm tra email. Mô hình hoạt động: WhatsApp Business API + danh mục sản phẩm + thanh toán UPI (thanh toán tức thì trong chat). Khách hàng xem sản phẩm, thêm vào giỏ, thanh toán — tất cả trong một cuộc trò chuyện. Không chuyển hướng, không mở ứng dụng bên ngoài. Ma sát bằng không. Tỷ lệ mở 98% (so với email 20%) nghĩa là thông điệp tiếp cận khách hàng gần như chắc chắn. Tỷ lệ chuyển đổi 40% nghĩa là gần nửa người xem tin nhắn mua hàng. ...
OpenDeepThink — reasoning training-free tăng 405 Elo trên benchmark lập trình
Một nhóm nghiên cứu từ UC San Diego, Princeton, UW, và UC Berkeley vừa chứng minh một điều trái trực giác: bạn không cần training thêm, không cần verifier, vẫn cải thiện reasoning đáng kể. OpenDeepThink dùng Bradley-Terry aggregation để xếp hạng kết quả reasoning theo hướng breadth thay vì depth. Thay vì để model suy nghĩ sâu hơn một đường duy nhất, OpenDeepThink tạo nhiều đường reasoning song song, rồi dùng pairwise comparison để tìm ra đường tốt nhất. Kết quả: tăng 405 Elo trên Gemini 3.1 Pro ở benchmark Codeforces, chỉ trong 8 vòng (~27 phút xử lý). ...
Genesis AI ra mắt robot manipulator trình độ người — gói $105 triệu seed
Robot vừa đập trứng một tay, đánh piano 130 BPM, và giải Rubik’s Cube — tất cả trong một demo. Genesis AI công bố GENE-26.5, foundation model đầu tiên cho phép robot đạt trình độ thao tác vật lý tương đương con người. GENE-26.5 không chỉ là model. Genesis AI tung ra full-stack: model AI + Genesis Hand 1.0 (20 degrees of freedom) + sensor glove + simulation environment. Cả một hệ thống hoàn chỉnh, từ brain đến hand. ...
Moonshot AI ra mắt Kimi WebBridge — AI agent điều khiển browser như người thật
Browser agent computing đang thành một category riêng, và Moonshot AI vừa gia nhập bằng một cách tiếp cận khác biệt. Kimi WebBridge là browser extension cho phép bất kỳ AI agent nào — không chỉ Kimi — điều khiển website như người thật: click, scroll, điền form, extract data. Điểm khác biệt lớn nhất: chạy local, không cần cloud. Không lock-in vào ecosystem nào. WebBridge đóng vai trò middleware — kết nối AI agent với browser, bất kể agent đó là model nào. Đây là hướng đi mở, trái ngược với các browser agent khác thường lock vào ecosystem riêng. ...