Thẻ: Claude Opus 4.7

  • Không thể chậm chân, Anthropic ra mắt Claude Design

    Nguồn: anthropic.com, TechCrunch, The New Stack, Gizmodo, 9to5Mac

    TL;DR

    Ngày 17/4/2026, Anthropic ra mắt Claude Design — một research preview cho phép tạo prototype, slide deck, one-pager, và website prototype hoàn chỉnh bằng cách… mô tả bằng lời. Powered by Opus 4.7, chỉ dành cho subscriber Pro/Max/Team/Enterprise, ăn token nhiều hơn bạn nghĩ, và đã khiến cổ phiếu Figma giảm thêm 5% ngay khi ra mắt.

    Bối cảnh — Không Phải Surprise Hoàn Toàn

    Trước khi Claude Design ra mắt chính thức, có hai tín hiệu rõ ràng mà ai theo dõi Anthropic đều đã thấy: thứ nhất, The Information đã report trước rằng Anthropic đang build một design tool. Thứ hai — và đây mới là thứ nói lên nhiều nhất — Mike Krieger, CPO của Anthropic, đã từ chối chỗ ngồi trong board của Figma ngay trước ngày ra mắt. Khi CPO của một công ty AI rời board của đối thủ trực tiếp, bạn biết chuyện gì sắp xảy ra.

    Figma (FIG) mất thêm 6.8% ngay sau khi Claude Design được công bố — con số này đặt trên nền một cổ phiếu đã giảm gần 50% trong 12 tháng qua. Không ai hoảng loạn, nhưng thị trường đã nói.

    Claude Design Là Gì Chính Xác?

    Claude Design là một tool mới cho phép tạo ra các visual như slide deck, app prototype và marketing one-pager bằng text prompt đơn giản. Nghe giống Canva hay Figma? Anthropic tự định vị khác đi một chút:

    “Claude Design gives designers room to explore widely and everyone else a way to produce visual work.”

    — Anthropic, official blog

    Target audience chính mà Anthropic nhắm đến: founder, product manager, marketer — những người có idea nhưng không có background design và không muốn mở Figma lên để vật lộn với frame. Nhưng Anthropic cũng nói rõ tool này dùng được cho cả designer thực sự muốn prototype nhanh mà không mất cả buổi chiều.

    Workflow Chi Tiết — Từ Prompt Đến File

    Bước 1: Onboarding & Tạo Design System

    Đây là thứ phân biệt Claude Design khỏi “AI tạo ảnh” thông thường. Trong quá trình onboarding, Claude đọc codebase và design file của team, rồi tự xây dựng một design system — màu sắc, typography, và các component — và tự động áp dụng cho mọi project tiếp theo.

    Team có thể refine design system theo thời gian và maintain nhiều hơn một. Tức là nếu bạn có nhiều brand hoặc nhiều product với visual identity khác nhau, không cần setup lại từ đầu mỗi lần.

    Bước 2: Tạo Output

    Có nhiều cách để bắt đầu một project: text prompt, upload ảnh và document (DOCX, PPTX, XLSX), point Claude vào codebase của bạn, hoặc dùng web capture tool để lấy element trực tiếp từ website — giúp prototype trông giống sản phẩm thật.

    Bước 3: Refine

    Đây là phần thú vị nhất. Sau khi Claude tạo ra version đầu tiên, bạn có 4 cách để tinh chỉnh:

    01
    Chat thuần

    Mô tả thay đổi bằng ngôn ngữ tự nhiên như đang pair với designer

    02
    Inline comment

    Click vào element cụ thể và comment trực tiếp lên đó — kiểu Figma comment

    03
    Direct edit

    Chỉnh text, background color, font trực tiếp không cần hỏi Claude

    04
    Custom sliders

    Claude tự generate slider và toggle cho bạn tweak spacing, màu, layout theo thời gian thực

    Cái thứ 4 — custom sliders — là feature khá lạ so với những gì mình từng thấy. Thay vì bạn phải prompt “tăng spacing lên một chút”, Claude tự tạo ra một UI control phù hợp với context của design đó. Kiểu như Claude không chỉ là worker mà còn tự build tool để bạn làm việc hiệu quả hơn.

    Bước 4: Export

    Khi xong, có thể export dưới dạng PDF, URL, PPTX, hoặc gửi thẳng sang Canva — nơi file có thể edit đầy đủ và collaborate. Claude Design cũng có thể bàn giao design cho Claude Code để biến thành sản phẩm chạy được.

    Chú ý: Canva, không phải Figma. Không phải ngẫu nhiên.

    Vấn Đề Token — Thứ Không Ai Nói To

    Đây là phần mà mọi bài viết giới thiệu đều glossed over, nhưng mình thấy quan trọng nhất với developer khi cân nhắc dùng production.

    Claude Design đi kèm weekly limit riêng cho paid plan (Pro, Max, Team, Enterprise) và hệ thống này tốn token đáng kể. Sau khi build một design system, một news website prototype, vài lần tweak và một explainer video, reviewer của The New Stack đã dùng hết hơn 50% weekly allotment. Khi vượt quá đó, bạn sẽ trả pay-as-you-go.

    ⚠️ Lưu ý thực tế: Design system + 1 prototype + vài tweak = 50%+ weekly quota. Nếu bạn định dùng nhiều, hãy tính trước budget hoặc dùng wireframe mode thay vì polished mockup để tiết kiệm token.

    Anthropic không công bố con số token cụ thể cho từng plan. Thứ biết chắc: wireframe tốn ít hơn polished mockup, và slide deck đơn giản tốn ít hơn interactive prototype. Chọn output type phù hợp với nhu cầu — đừng mặc định dùng full fidelity cho mọi thứ.

    Ai Có Thể Dùng — Availability

    PlanTrạng tháiGhi chú
    Claude Pro✓ CóResearch preview, weekly token limit
    Claude Max✓ CóResearch preview, weekly token limit
    Claude Team✓ CóResearch preview, weekly token limit
    Claude Enterprise✓ CóResearch preview, weekly token limit
    Claude Free✗ KhôngKhông available
    API (standalone)✗ ChưaChưa có thông tin

    Claude Design gia nhập bộ Mac tools của Anthropic cùng với Claude Cowork và Claude Code. Anthropic cũng tuyên bố sẽ mở rộng integration trong những tuần tới để connect với nhiều tool hơn mà team đang dùng.

    Versus — Nó Đứng Đâu Trong Thị Trường?

    Anthropic nói Claude Design bổ trợ Canva, không phải thay thế — đó là lý do export sang Canva được hỗ trợ còn Figma thì không. Nhưng thị trường không thực sự tin vào narrative đó, và Figma cũng không. Một vài điểm khác biệt thực tế:

    Tiêu chí
    Claude Design
    Figma / Canva
    Input
    Text prompt, file, codebase, web capture
    Manual drag-drop, template
    Design system
    Tự build từ codebase, auto-apply
    Manual setup, quản lý bằng tay
    Prototype chạy được
    ✓ HTML export, hand-off Claude Code
    Figma có, Canva không
    Collaboration realtime
    Chưa (research preview)
    ✓ Core feature
    Token cost
    Weekly limit + pay-as-you-go
    Subscription flat fee
    Dev handoff
    ✓ Native với Claude Code
    Inspect mode, Figma-to-code

    Điểm mạnh thực sự của Claude Design không phải là thay thế Figma cho designer chuyên nghiệp — mà là eliminating the design bottleneck cho team nhỏ không có designer, hoặc cho giai đoạn early prototype khi bạn cần validate idea nhanh hơn là cần pixel-perfect.

    Bức Tranh Lớn Hơn — Anthropic Đang Làm Gì?

    Claude Design không phải sản phẩm đứng riêng. Đặt nó trong context Q1 2026 của Anthropic:

    • January 2026: Ra mắt Claude Cowork — agentic assistant cho complex enterprise task
    • Late January: Thêm agentic plugin vào Cowork
    • April 8: Claude Cowork và Claude Code có thể remote-control Mac
    • April 10: Anthropic Labs công bố nhóm nghiên cứu riêng
    • April 14: Project Glasswing + Claude Mythos Preview (cyber AI)
    • April 16: Claude Opus 4.7 GA
    • April 17: Claude Design research preview

    Đây không phải là một công ty AI lab đang tung feature ngẫu nhiên. Đây là một công ty đang build full-stack product suite — từ code (Claude Code) đến task automation (Cowork) đến design (Claude Design) — tất cả powered bởi cùng một model, tất cả hand-off được cho nhau.

    Anthropic đạt khoảng $20 tỷ ARR vào đầu tháng 3/2026, tăng từ $9 tỷ cuối 2025, và vượt $30 tỷ vào đầu tháng 4/2026. Công ty đang trong các cuộc đàm phán sơ bộ với Goldman Sachs, JPMorgan và Morgan Stanley về IPO tiềm năng có thể diễn ra sớm nhất vào tháng 10/2026. Với trajectory như vậy, mỗi sản phẩm mới không chỉ là feature — nó là miếng ghép trong câu chuyện IPO.

    Đánh Giá Thực Tế — Nên Quan Tâm Không?

    ✓ Đáng thử ngay

    • Prototype từ prompt trong vài phút, không cần designer
    • Design system tự học từ codebase — thực sự hữu ích
    • Custom sliders là UX pattern mới thú vị
    • Hand-off sang Claude Code native — zero friction
    • Export PPTX và Canva cho presentation workflow

    ✗ Cần lưu ý

    • Research preview = không phải production-ready
    • Token drain nặng hơn kỳ vọng
    • Không có realtime collaboration (yet)
    • Export Figma không có — nếu team đang dùng Figma thì friction
    • Chưa rõ pricing khi hết weekly limit

    Kết luận của mình: Nếu bạn là developer cần pitch idea với stakeholder, build landing page prototype để validate trước khi code, hoặc làm một-mình và không muốn học Figma — Claude Design đáng test ngay hôm nay. Nếu bạn là designer chuyên nghiệp cần collaboration và pixel-perfect control, đây vẫn chưa phải tool thay thế workflow hiện tại của bạn.

    Research preview nghĩa là Anthropic đang thu feedback. Đây là lúc tốt nhất để dùng thử và ảnh hưởng đến roadmap — trước khi nó bị đóng gói thành paid feature cứng nhắc hơn.


    Nguồn: anthropic.com/news/claude-design-anthropic-labs · TechCrunch · The New Stack · Gizmodo

  • Claude Opus 4.7 — Đây Mới Là Bước Nhảy Developer Đang Chờ

    Ra mắt ngay hôm nay 16/4/2026, Claude Opus 4.7 không phải bản “update nhỏ cho có”. Từ benchmark coding đến vision, từ agentic workflow đến migration gotcha — tất cả dữ liệu thật, không phỏng đoán.

    TL;DR — Tóm Tắt Trong 30 Giây

    Nếu bạn đang dùng Opus 4.6 cho bất kỳ workflow coding hoặc agentic nào, Opus 4.7 là upgrade đáng làm ngay. Giá không đổi, performance tăng rõ rệt trên mọi benchmark thực chiến. Nhưng có hai thứ cần lưu ý trước khi bấm migrate: tokenizer mớiinstruction-following chặt hơn — cả hai đều có thể “break” behavior cũ của bạn theo cách không ngờ.

    ✓ Điểm nổi bật

    Cursor: 70% vs 58% trên CursorBench · Rakuten: giải quyết 3× nhiều production task hơn 4.6 · Vision: nhận ảnh lên tới 2,576px / ~3.75MP (gấp 3 lần trước) · Giá: $5/$25 per MTok — giống hệt 4.6

    Những Gì Mới Trong Opus 4.7

    Anthropic không viết hoa “revolutionary” hay “paradigm shift” trong blog chính thức — và mình trân trọng sự trung thực đó. Họ nói thẳng: đây là “notable improvement on Opus 4.6 in advanced software engineering, with particular gains on the most difficult tasks“. Tức là không phải bản vá lỗi, cũng không phải leap-of-faith tiếp thị — mà là cải tiến có đo lường được.

    🧠
    Instruction Following siêu chặt

    Opus 4.7 đọc instruction từng chữ. Nghe có vẻ hay, nhưng Anthropic cảnh báo thẳng: prompt cũ viết cho 4.6 — loại mà model tự “diễn giải” linh hoạt — có thể cho ra kết quả khác bây giờ. Bạn cần re-tune lại harness của mình.

    👁️
    Vision nâng cấp mạnh: 3.75 Megapixel

    Trước đây model chỉ xử lý ảnh khoảng 1MP. Giờ nhận ảnh lên tới 2,576px long edge (~3.75MP) — gấp hơn 3 lần. Mở ra rất nhiều usecase: đọc dense screenshot, extract bảng biểu từ PDF scan, computer-use agent cần pixel-perfect reference.

    🗂️
    Memory qua filesystem tốt hơn

    Trong các multi-session workflow, model ghi nhớ note quan trọng và tự carry context sang task tiếp theo — giảm đáng kể lượng context phải feed lại từ đầu.

    ⚙️
    Effort level mới: xhigh

    Nằm giữa highmax. Trong Claude Code, effort default đã được nâng lên xhigh cho tất cả plan. Cho coding và agentic task, Anthropic khuyến nghị bắt đầu với high hoặc xhigh.

    💸
    Task Budgets (Public Beta)

    Developer có thể guide Claude về token spend, giúp model ưu tiên công việc trong long-running task mà không bị “cháy” context vào chỗ không cần thiết.

    🔍
    /ultrareview trong Claude Code

    Slash command mới: model đọc toàn bộ thay đổi code và flag bugs + design issues — kiểu “senior reviewer” ảo. Pro và Max user nhận 3 ultrareview miễn phí để thử.

    🤖
    Auto mode mở rộng cho Max users

    Claude tự quyết định permission thay bạn — chạy task dài hơn với ít interrupt hơn. Trước đây chỉ có trên một số plan nhất định.

    Benchmark Thực Tế — Số Liệu Từ Partner

    Mình không lấy số benchmark “lab-made” của Anthropic để cho trông đẹp. Dưới đây là số thật từ các công ty đã chạy early-access với Opus 4.7 trên production workload của họ. Đây là loại số khó fake nhất.

    // Coding & Agentic Workflows
    Cursor · CursorBench
    Tỷ lệ resolve task coding
    4.7
    70%
    4.6
    58%
    Notion Agent · 93-task benchmark
    Resolution rate, ít token hơn, 1/3 tool errors
    gain
    +14%
    error
    1/3 errors
    Rakuten · Rakuten-SWE-Bench
    Production task resolution so với 4.6
    4.7
    3× hơn
    Factory Droids · Enterprise engineering
    Task success rate, ít tool error hơn
    gain
    +10–15%
    Bolt · Long-running app building
    Task success, không có regression
    gain
    +10% (best case)
    // Code Review
    CodeRabbit · Complex PR review
    Bug recall tăng, precision giữ nguyên
    recall
    >10%
    Harvey · BigLaw Bench (legal AI)
    Substantive accuracy at high effort
    4.7
    90.9%
    // Vision
    XBOW · Visual-Acuity Benchmark (computer-use agent)
    Độ chính xác nhận dạng thị giác
    4.7
    98.5%
    4.6
    54.5%
    📌 Context về XBOW

    XBOW là nền tảng autonomous penetration testing. Điểm 98.5% vs 54.5% trên visual-acuity không phải benchmark lab — đây là production workload thật. CEO của XBOW nói thẳng: pain point lớn nhất của Opus 4.6 “biến mất hoàn toàn” và mở ra cả một class usecase mà trước đây không dùng được.

    “Claude Opus 4.7 autonomously built a complete Rust text-to-speech engine from scratch — neural model, SIMD kernels, browser demo — then fed its own output through a speech recognizer to verify it matched the Python reference. Months of senior engineering, delivered autonomously.”

    — Sean Ward, CEO Cartesia

    Cái quote này nói lên rất nhiều về khả năng self-verification — model tự build xong rồi tự test lại output của mình. Không cần human in the loop ở từng bước.

    Cải Tiến Vision — Số Liệu Cụ Thể

    Nếu bạn đang build bất kỳ thứ gì liên quan đến image processing, computer-use agent, hay document extraction, đây là thứ quan trọng nhất trong release này với bạn.

    Thông sốOpus 4.6 (trước)Opus 4.7 (mới)
    Long edge tối đa~800px (ước lượng)2,576 px
    Megapixel tối đa~1 MP~3.75 MP
    Cách áp dụngAPI parameterModel-level (tự động)
    Token consumptionThấp hơnCao hơn nếu ảnh lớn
    ⚠️ Lưu ý về Token

    Vì vision upgrade là model-level, không phải API parameter, ảnh bạn gửi lên sẽ tự động được xử lý ở độ phân giải cao hơn. Nếu bạn không cần chi tiết đó, hãy downsample ảnh trước khi gửi để tránh tốn token không cần thiết.

    Giá Cả & Availability

    Một trong những điểm hay nhất của release này: giá không tăng. Anthropic giữ nguyên pricing từ Opus 4.6.

    Loại tokenGiá / 1M tokensSo sánh
    Input tokens$5Giữ nguyên từ Opus 4.6
    Output tokens$25Giữ nguyên từ Opus 4.6

    Model string khi gọi API: claude-opus-4-7

    // Platforms hỗ trợ

    Opus 4.7 available ngay hôm nay trên tất cả Claude products, API, Amazon Bedrock, Google Cloud Vertex AI, và Microsoft Foundry. Không cần waitlist, không cần request access đặc biệt — trừ Cyber Verification Program (xem mục Safety bên dưới).

    💡 Fast Mode vẫn available

    Fast mode (speed: "fast") từ Opus 4.6 vẫn hoạt động với Opus 4.7, cho output nhanh hơn 2.5× với premium pricing $30/$150 per MTok. Cùng model, cùng intelligence — chỉ inference nhanh hơn.

    Sử Dụng Qua API — Quick Start

    Nếu bạn đang dùng Opus 4.6, migrate về cơ bản chỉ cần đổi model string. Nhưng để tận dụng tính năng mới, đây là một số pattern recommended:

    // Basic call với adaptive thinking
    # Python SDK — adaptive thinking (không còn dùng budget_tokens nữa)
    import anthropic
    
    client = anthropic.Anthropic()
    
    response = client.messages.create(
        model="claude-opus-4-7",        # ← model string mới
        max_tokens=16000,
        thinking={"type": "adaptive"},  # ← không dùng "enabled" + budget_tokens nữa
        effort="xhigh",              # ← level mới: xhigh nằm giữa high và max
        messages=[{
            "role": "user",
            "content": "Review this codebase and find all race conditions"
        }]
    )
    // Task budget — control token spend
    # Task budgets — public beta
    response = client.beta.messages.create(
        model="claude-opus-4-7",
        max_tokens=32000,
        betas=["task-budgets-2026-04-01"],
        task_budget={
            "max_tokens": 20000     # Claude sẽ cố gắng complete trong budget này
        },
        messages=[...]
    )
    ⚠️ Deprecated: thinking type “enabled”

    thinking: {"type": "enabled", "budget_tokens": N} đã deprecated trên cả Opus 4.6 và 4.7. Vẫn chạy được nhưng sẽ bị remove trong future release. Migrate sang {"type": "adaptive"} với effort parameter.

    Migration Guide — Những Thứ Có Thể Break

    Anthropic rất thẳng thắn về hai thay đổi có thể ảnh hưởng đến workflow cũ của bạn. Đây không phải lý thuyết — đây là production gotcha thật.

    // Gotcha #1: Tokenizer mới

    Opus 4.7 dùng tokenizer cập nhật. Cùng một input text nhưng có thể tốn 1.0× đến 1.35× token tùy loại content. Với code-heavy workflow, con số 1.35× sẽ ảnh hưởng đến cost trực tiếp.

    Hành động: Đừng assume cost giống cũ. Measure token usage thật trên real traffic trước khi full migrate. Anthropic có migration guide tại platform.claude.com/docs/en/about-claude/models/migration-guide

    // Gotcha #2: Instruction Following “Too Literal”

    Đây là thứ subtle nhất và khó catch nhất. Opus 4.6 có xu hướng interpret instruction một cách linh hoạt — bỏ qua phần không rõ, tự “fill in the blanks” theo intent. Opus 4.7 làm ngược lại: nó đọc literal.

    Ví dụ: nếu prompt của bạn nói “reply in JSON” nhưng có một edge case mà bạn muốn model tự xử lý, Opus 4.6 có thể đã tự quyết. Opus 4.7 sẽ trả về JSON dù bất kể gì — đúng instruction, nhưng không phải intent.

    Hành động: Re-read tất cả system prompt và harness config. Bất kỳ instruction nào mà bạn đang dựa vào việc model “tự hiểu” — viết lại cho explicit.

    Tin tốt là: Anthropic report rằng tổng token usage across all effort levels vẫn improved trong internal coding evaluation — model xử lý được nhiều hơn với ít token hơn tính trên task được hoàn thành. Con số 1.35× overhead của tokenizer sẽ được offset bởi việc model cần ít attempt hơn.

    Safety, Alignment & Câu Chuyện Mythos

    Đây là phần thú vị nhất từ góc độ kỹ thuật — và cũng là phần mà nhiều bài viết khác bỏ qua.

    // Opus 4.7 & Project Glasswing

    Tuần trước Anthropic công bố Project Glasswing — highlighting rủi ro và lợi ích của AI trong cybersecurity. Đồng thời họ announce một model mạnh hơn gọi là Claude Mythos Preview, nhưng giữ release rất hạn chế vì cyber capability của nó quá mạnh.

    Opus 4.7 là testbed đầu tiên cho cách tiếp cận mới: Anthropic đã thử nghiệm giảm thiểu có chọn lọc cyber capability của model trong quá trình training, và deploy safeguard tự động detect + block các request liên quan đến prohibited cybersecurity use.

    🔒 Cyber Verification Program

    Security professional cần dùng Opus 4.7 cho legitimate purpose (vulnerability research, penetration testing, red-teaming) có thể đăng ký Cyber Verification Program tại claude.com/form/cyber-use-case. Không phải mọi cybersecurity usecase đều bị block — chỉ những thứ được classifier đánh giá là high-risk.

    // Safety Profile — Honest Assessment

    Anthropic publish alignment assessment thẳng thắn: Opus 4.7 có safety profile tương tự Opus 4.6. Cải thiện ở honesty và resistance to prompt injection. Yếu hơn nhẹ ở harm-reduction advice cho controlled substances. Kết luận overall: “largely well-aligned and trustworthy, though not fully ideal in its behavior“.

    Mythos Preview vẫn là model well-aligned nhất theo internal evaluation. Opus 4.7 không pretend otherwise.


    Kết Luận — Nên Dùng Không?

    // Verdict của mình
    Yes.
    Với điều kiện bạn đọc migration gotcha trước khi migrate

    Opus 4.7 không phải “update cho có”. Từ CursorBench 70% đến XBOW visual-acuity 98.5%, từ Rakuten 3× production task resolution đến Databricks 21% ít lỗi hơn trong document reasoning — đây là những con số từ production workload thật, không phải benchmark được thiết kế để model “chiến thắng”.

    Giá không đổi. Vision gấp 3 lần. Instruction following chặt hơn. /ultrareview trong Claude Code là bổ sung thực sự hữu ích cho workflow code review.

    Thứ duy nhất cần cẩn thận: đừng blind-migrate production. Test kỹ tokenizer overhead và re-audit system prompt. Đó là thứ mà dữ liệu thật khuyến cáo.

    ❌ Không phù hợp nếu

    Bạn cần cyber capability cao (→ chờ Mythos Preview) · Bạn có budget constraint chặt và chưa test tokenizer impact · Bạn cần model “diễn giải linh hoạt” instruction cũ

    ✓ Nên upgrade nếu

    Bạn đang chạy agentic coding workflow · Bạn cần xử lý ảnh resolution cao (scan, screenshot, diagram) · Bạn dùng computer-use agent · Bạn cần model follow instruction chính xác trong long-running task · Bạn muốn thử /ultrareview cho code review


    // Tài liệu tham khảo

    Tất cả số liệu trong bài đến từ: anthropic.com/news/claude-opus-4-7 (official blog, publish 16/4/2026) và documentation chính thức tại platform.claude.com.