Ảnh: Reve AI

Cuộc đua mô hình ngôn ngữ lớn (LLM) đang nóng lên trở lại khi các công ty AI hàng đầu tại Mỹ và Trung Quốc liên tiếp giới thiệu mô hình mới. Nhịp phát hành ngày càng rút ngắn, trong khi chi phí phát triển tăng cao làm dấy lên lo ngại về biên lợi nhuận của các hãng AI. Ở mảng AI lập trình, thị trường cũng đang được tái sắp xếp nhanh chóng theo hướng tập trung vào những doanh nghiệp có nguồn lực tài chính lớn.

OpenAI vừa công bố GPT-5.5 và bắt đầu cung cấp cho nhóm người dùng ChatGPT trả phí. Theo công ty, GPT-5.5 có tốc độ suy luận nhanh hơn, độ chính xác cao hơn và sử dụng ít token hơn so với GPT-5.4, qua đó giúp doanh nghiệp và người dùng khai thác hiệu quả hơn các tính năng AI tiên tiến. Trước đó, Anthropic cũng đã ra mắt Claude Opus 4.7, phiên bản mới nhất của dòng Opus.

Tại Trung Quốc, DeepSeek phát hành bản preview của mô hình V4. Một số đánh giá cho rằng V4 đạt trình độ của nhóm mô hình tiên tiến nhất, đi theo định hướng mã nguồn mở nhưng có chi phí thấp hơn đáng kể so với Opus 4.7 và GPT-5.5. Mô hình này được kỳ vọng có thể tạo hiệu ứng thậm chí lớn hơn cả R1, dòng mô hình suy luận mà DeepSeek giới thiệu năm ngoái. Startup MoonshotAI cũng công bố Kimi-K2.6, phiên bản mới nhất của dòng LLM mã nguồn mở Kimi.

Song song với cuộc đua LLM, thị trường AI lập trình đang chuyển dịch nhanh về nhóm doanh nghiệp có tiềm lực vốn mạnh. SpaceX do Elon Musk dẫn dắt đã giành được quyền mua lại startup AI lập trình Cursor với mức định giá 60 tỷ USD trong năm nay.

Google DeepMind cũng được cho là đã lập một nhóm chuyên trách để nâng cấp mô hình AI lập trình, trong bối cảnh ảnh hưởng của Anthropic ngày càng lớn. Theo các nguồn tin liên quan, một số nhà nghiên cứu tại Google DeepMind đánh giá các công cụ lập trình của Anthropic đang vượt lên trên Gemini của Google ở mảng này.

Trong khi đó, tại hội nghị thường niên Cloud Next, Google Cloud công bố loạt cập nhật mới về AI và điện toán đám mây. Google giới thiệu TPU 8t dành cho huấn luyện AI và TPU 8i dành cho suy luận, đồng thời bổ sung nhiều tính năng AI cho bộ công cụ năng suất theo gói thuê bao Workspace. Trọng tâm của đợt nâng cấp là Workspace Intelligence, nền tảng hỗ trợ tự động hóa công việc dựa trên dữ liệu từ Gmail, Google Calendar, Google Chat và Google Drive.

CEO Google Cloud Thomas Kurian bày tỏ tin tưởng vào chiến lược AI full-stack, tức tự phát triển toàn bộ từ chip, trung tâm dữ liệu, mô hình nền tảng đến sản phẩm cuối. Theo ông, cách tiếp cận này có thể giúp Google thu hẹp khoảng cách với Amazon Web Services trên thị trường đám mây.

Google Cloud cũng mở rộng hợp tác với các doanh nghiệp dịch vụ IT lớn tại Hàn Quốc. Tại sự kiện Google Cloud Next 2026, nhiều công ty trong lĩnh vực này đã công bố kế hoạch tăng cường liên minh với Google Cloud để đẩy mạnh AI và an ninh mạng.

Ở mảng gọi vốn, Anthropic tiếp tục thu hút nguồn tiền lớn từ các tập đoàn công nghệ. Chỉ trong tháng này, công ty đã nhận các khoản đầu tư trị giá hàng chục tỷ USD, kèm điều kiện liên quan, từ Amazon và Google. Trên cơ sở đó, Anthropic đặt mục tiêu tăng tốc mở rộng năng lực tính toán để đáp ứng nhu cầu ngày càng tăng đối với Claude.

Khi AI agent được ứng dụng rộng hơn, cán cân hạ tầng AI vốn tập trung vào GPU cũng bắt đầu dịch chuyển theo hướng CPU đóng vai trò lớn hơn. Nhiều tác vụ như xử lý logic ngoài suy luận, quản lý tệp, gọi mạng hay thực thi mã chủ yếu do CPU đảm nhiệm. Trong bối cảnh đó, Meta đã ký hợp đồng triển khai ở quy mô lớn CPU Graviton do AWS tự phát triển để phục vụ nhu cầu AI.

Các Big Tech cũng đẩy nhanh nỗ lực giúp doanh nghiệp quản lý hiệu quả số lượng AI agent ngày càng nhiều. Mỗi hãng đang theo đuổi cách tiếp cận khác nhau đối với bài toán quản trị và vận hành AI agent trong doanh nghiệp.

Adobe đã công bố CX Enterprise, nền tảng AI agent dành cho khách hàng doanh nghiệp nhằm tự động hóa các hoạt động như marketing số. Động thái này cho thấy công ty muốn chủ động ứng phó với những thay đổi của thị trường phần mềm dưới tác động của AI.

Oracle tăng cường hợp tác với Google Cloud và giới thiệu Oracle AI Database Agent, cho phép người dùng truy vấn cơ sở dữ liệu bằng ngôn ngữ tự nhiên mà không cần dùng SQL. Tencent cũng ra mắt phiên bản toàn cầu của QClaw, AI agent dựa trên OpenClaw. Trong khi đó, Snowflake cập nhật Snowflake Intelligence và Cortex Code; riêng Snowflake Intelligence được định vị là AI agent có khả năng nhận biết ngữ cảnh cho người dùng kinh doanh, cho phép đặt câu hỏi về dữ liệu doanh nghiệp và nhận lại các thông tin phân tích.

Trên thị trường quốc tế, Cohere của Canada và Aleph Alpha của Đức được cho là đang chuẩn bị sáp nhập. Aleph Alpha từng được chú ý như “OpenAI của Đức”, nhưng sau đó đã từ bỏ hướng phát triển LLM quy mô lớn như ChatGPT để chuyển sang AI chuyên biệt cho doanh nghiệp; Cohere cũng đang đi theo định hướng tương tự. Ở một diễn biến khác, Sierra, startup AI agent cho dịch vụ khách hàng, đã thâu tóm Fragment của Pháp, công ty chuyên hỗ trợ doanh nghiệp tích hợp AI vào quy trình làm việc.

Tại Hàn Quốc, startup agentic AI FortyTwoMaru sẽ hợp tác với Bộ Tư lệnh Hậu cần Lục quân trong lộ trình chuyển đổi AI cho lĩnh vực hậu cần quốc phòng. SK AX dự kiến trong 7 năm tới sẽ tích hợp quản lý toàn bộ hoạt động IT của Daishin Securities và từng bước mở rộng vận hành hạ tầng tài chính thông qua AI agent. Hancom cũng lên kế hoạch thương mại hóa trong năm nay hệ điều hành “twin-type agentic OS”, mô phỏng cách làm việc của người dùng để nâng cao năng suất.

LG AI Research và ban lãnh đạo Nvidia cũng đã thống nhất tăng cường liên minh công nghệ nhằm mở rộng hệ sinh thái K-EXAONE. Hai bên sẽ kết hợp mô hình AI EXAONE của LG với hệ sinh thái mở Nemotron của Nvidia, đồng thời mở rộng hợp tác sang các lĩnh vực như đồng phát triển mô hình chuyên biệt theo ngành.

Motif Technologies, doanh nghiệp phát triển mô hình nền tảng AI độc lập, đang tìm cách tạo khác biệt bằng nền tảng riêng thay vì sử dụng công cụ phần mềm của Nvidia. Công ty cho rằng nếu dùng các bộ công cụ phổ biến mà Nvidia cung cấp, sẽ khó cạnh tranh với Big Tech vốn vượt trội về năng lực tính toán. Vì vậy, Motif chọn tập trung vào việc xây dựng và vận hành LLM bằng bộ công cụ tự phát triển, với mục tiêu tối ưu bài toán hiệu quả chi phí.

MegazoneCloud cũng đã hoàn tất dự án thử nghiệm hệ thống AI agent kiểm tra quy định pháp lý xây dựng cùng Heerim Architects & Planners. Trong khi đó, TmaxSoft xác nhận tên thương hiệu cho dòng sản phẩm AI mới đang phát triển là Continuum AI và đồng thời công bố bộ nhận diện thương hiệu.

Google cũng đang mở rộng triển khai tại Hàn Quốc trình duyệt tích hợp AI Gemini in Chrome, qua đó tạo thêm áp lực cạnh tranh lên Naver, cổng thông tin lớn nhất nước này.

Trong bối cảnh kịch bản AI thay thế phần mềm doanh nghiệp, thường được gọi là “SaaSpocalypse”, ngày càng được nhắc đến nhiều hơn, các công ty phần mềm hiện hữu cũng bắt đầu phản công mạnh. Nhiều doanh nghiệp không chỉ tung ra nền tảng AI agent mà còn tích cực phản bác quan điểm cho rằng SaaS sẽ nhanh chóng bị AI thay thế hoàn toàn.

Cùng với làn sóng AI agent, mô hình tính phí theo mức sử dụng và mô hình định giá theo hiệu quả, tức chỉ thu phí khi AI hoàn thành đúng công việc, cũng đang lan nhanh trên thị trường phần mềm doanh nghiệp.

Từ khóa

#LLM #OpenAI #Anthropic #DeepSeek #Google Cloud #AI agent #AI lập trình
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.