GLM 5.2: Mô Hình Mở Đánh Bại Claude Code Trên Benchmark Bảo Mật
GLM 5.2, model open-weight từ Zhipu AI, đạt 39% F1 trong phát hiện lỗ hổng IDOR — vượt Claude Code (32%). Chi phí chỉ 1/6 model frontier.
Những suy nghĩ, trải nghiệm và góc nhìn kỹ thuật trong hành trình làm phần mềm của mình.
Hashtag phổ biến
GLM 5.2, model open-weight từ Zhipu AI, đạt 39% F1 trong phát hiện lỗ hổng IDOR — vượt Claude Code (32%). Chi phí chỉ 1/6 model frontier.
DeepSeek vừa mở mã nguồn DSpark — hệ thống speculative decoding tăng tốc độ sinh token lên tới 85% trên V4-Flash mà không cần thêm GPU.
Model Context Protocol (MCP) không còn là một công cụ thử nghiệm của Anthropic mà đã trở thành chuẩn công nghiệp mới, định hình lại tương lai AI-driven DevOps.
Báo cáo mới từ Gartner cảnh báo mô hình tính phí theo token có thể khiến hóa đơn công cụ lập trình AI tăng vọt lên tới 5.000 USD một tháng.
Sáng kiến Patch the Planet của OpenAI kết hợp cùng Trail of Bits đã tự động tạo và merge hàng chục bản vá bảo mật cho các dự án mã nguồn mở lớn bằng GPT-5.5-Cyber.
AWS Blocks ra mắt bản Public Preview, mang lại trải nghiệm local-first với PostgreSQL WASM (PGlite) và thiết kế tối ưu hóa cho AI coding agent.
Không còn dừng lại ở việc chat, AI agent đang trực tiếp tham gia vận hành qua giao thức MCP, AWS Continuum và AWS DevOps Agent.
AI tìm ra 12 lỗi zero-day trong OpenSSL, nhưng curl lại phải khai tử bug bounty vì ngập trong báo cáo AI rác. Chào mừng bạn đến với kỷ nguyên nghẽn cổ chai kiểm thử.
Google, GitHub, Microsoft và Nvidia vừa bắt tay công bố chuẩn ARD (Agentic Resource Discovery) mở ra kỷ nguyên mới cho AI Agent tự tìm kiếm công cụ.
Một lập trình viên độc lập đã phát hiện chiến dịch malware khổng lồ giả mạo 10.000 kho lưu trữ trên GitHub nhằm lừa các công cụ tự động và nhà phát triển.
Google Chrome chuẩn bị tung ra phiên bản 150 và 151, loại bỏ hoàn toàn các flag hỗ trợ Manifest V2. Điều này đồng nghĩa với việc uBlock Origin bản đầy đủ sẽ chính thức khai tử trên Chrome.
Mã độc Miasma tấn công 73 repo của Microsoft, lợi dụng cơ chế hoạt động của Claude Code và Cursor để âm thầm đánh cắp credential của developer.