SemiFive và ICY Tech ngày 7/5 thông báo đã hoàn tất tape-out chip edge AI dựa trên eMRAM 8 nm trên nền tảng Samsung Foundry. Theo hai công ty, đây là trường hợp đầu tiên tại châu Á công nghệ eMRAM 8 nm được đưa vào một sản phẩm hướng tới thương mại hóa. Với SemiFive, đây cũng là dự án thiết kế ASIC đầu tiên sử dụng eMRAM, trong đó công ty phụ trách hiện thực hóa chip ở cấp độ silicon để sẵn sàng cho sản xuất hàng loạt. Con chip được phát triển trên tiến trình 8LPU của Samsung Foundry.
MRAM (Magnetic Random Access Memory) là công nghệ bộ nhớ lưu trữ dữ liệu thông qua sự thay đổi điện trở của phần tử MTJ (magnetic tunnel junction). Khác với DRAM, MRAM không lưu điện tích nên vẫn giữ được dữ liệu ngay cả khi mất nguồn và không cần làm tươi định kỳ. So với flash, công nghệ này có tốc độ ghi nhanh hơn 1.000 lần và tiêu thụ điện năng thấp hơn, nhờ đó được xem là phù hợp cho chip AI và các thiết bị edge công suất thấp. eMRAM là bộ nhớ nhúng tích hợp MRAM vào các chip hệ thống như SoC và MCU, đồng thời được xem là một lựa chọn thay thế eFlash cho bộ nhớ on-chip.
Trong dự án này, hai bên kết hợp công nghệ PNM (Processing Near Memory) của ICY Tech với nền tảng thiết kế SoC của SemiFive. Mục tiêu là xây dựng kiến trúc có thể xử lý tác vụ AI ngay tại thiết bị edge mà không phụ thuộc vào kết nối mạng. Hệ thống được giới thiệu có khả năng xử lý mô hình tối đa 2 tỷ tham số trực tiếp trên thiết bị, đủ đáp ứng các tác vụ như tóm tắt văn bản, dịch thuật và suy luận hội thoại. Đây cũng là bài toán mà các chip edge AI dựa trên SRAM trước đây khó giải quyết do giới hạn về diện tích die và mức tiêu thụ điện.
ICY Tech được thành lập từ Trung tâm Từ học Ứng dụng thuộc Khoa Vật lý của Đại học Bắc Kinh, tập trung phát triển công nghệ MRAM cho suy luận AI dựa trên nền tảng từ học và spintronics. Công ty cho biết sở hữu năng lực thiết kế bitcell MRAM, mạch ngoại vi, công nghệ đọc băng thông cao và khả năng thực hiện phép nhân ma trận - vector tại chỗ (in-situ GEMV). Trong khi đó, SemiFive là đối tác giải pháp thiết kế chủ chốt (DSP) trong hệ sinh thái SAFE của Samsung Foundry và từng triển khai các dự án ASIC trong các lĩnh vực như AI, HPC và edge AI.
Kiến trúc mới được định hướng cho các thiết bị edge vận hành trong môi trường offline, gồm AI PC, AI agent cá nhân và robot hình người. Công nghệ này cũng được kỳ vọng có thể ứng dụng trong nhiều lĩnh vực như robot, bán dẫn ôtô gồm xe tự lái và hệ thống cockpit, cùng các thiết bị thông minh.
Ông Yves Zhu, CEO của ICY Tech, cho biết dự án hợp tác lần này là một thử thách kỹ thuật khi hiện thực hóa kiến trúc suy luận AI dựa trên spintronics trên tiến trình 8 nm (8LPU) của Samsung Foundry. Theo ông, việc tích hợp đặc tính tiết kiệm điện và không bay hơi của eMRAM vào bộ tăng tốc AI có thể trở thành một cột mốc mới của chip edge AI. Ông cũng nhấn mạnh dự án là cơ hội để chứng minh hiệu năng vượt qua giới hạn của các kiến trúc hiện có trên thị trường suy luận AI toàn cầu, đồng thời thiết lập lại chuẩn hiệu quả năng lượng.
Ông Jo Myung-hyun, CEO của SemiFive, nhận định rằng khi thiết kế ASIC mở rộng sang các lĩnh vực mới dựa trên công nghệ bộ nhớ thế hệ mới như eMRAM, vai trò của đối tác thiết kế AI ASIC có khả năng phụ trách toàn bộ quy trình sẽ càng quan trọng hơn. Ông cho biết hợp tác với ICY Tech có ý nghĩa trong việc giúp SemiFive mở rộng danh mục thiết kế sang mảng MRAM.