تراشه آنالوگ چین

تراشه جدید چین، «مشکل ۱۰۰ ساله» را حل کرد؛ ادعای سرعتی هزار برابر بیش‌تر از GPU‌های انویدیا

سه‌شنبه 13 آبان 1404 - 13:59مطالعه 5 دقیقه
محققان دانشگاه پکن اعلام کردند تراشه‌ی آنالوگ آن‌ها می‌تواند ۱۰۰۰ برابر سریع‌تر و ۱۰۰ برابر کم‌مصرف‌تر از GPU‌های بالارده انویدیا و ای‌ام‌دی عمل کند.
تبلیغات

پژوهشگران چینی تراشه‌ی جدیدی ساخته‌اند که ویژگی خاصی دارد: آنالوگ است، یعنی محاسبات را نه از طریق صفر و یک‌های باینری معمول پردازنده‌های دیجیتال استاندارد، بلکه روی مدارهای فیزیکی خودش انجام می‌دهد.

برای درک بهتر، تراشه‌های دیجیتال معمول (مثل انویدیا) مانند کلید برق کار می‌کنند: همه چیز یا خاموش است (صفر) یا روشن (یک). اما تراشه‌های آنالوگ مانند دیمر نور لامپ هستند؛ می‌توانند هر درجه‌ای از روشنایی را داشته باشند و مستقیماً با شدت و ضعف جریان الکتریسیته کار می‌کنند.

به ادعای تیم پژوهشگران، این تراشه‌ی جدید می‌تواند عملکردی تا هزار برابر سریع‌تر از پیشرفته‌ترین واحدهای پردازش گرافیکی شرکت‌های انویدیا و ای‌ام‌دی ارائه دهد.

خلاصه صوتی

در کامپیوترهای سنتی که براساس معماری «فون نویمان» کار می‌کنند، پردازنده (CPU) و حافظه (RAM) از هم جدا هستند. برای انجام محاسبات سنگین مانند حل معادلات ماتریسی، داده‌ها باید مدام بین حافظه و پردازنده جابجا شوند. این رفت و برگشت مداوم، یک گلوگاه به نام «گلوگاه فون نویمان» ایجاد می‌کند که سرعت کلی سیستم را به شدت کاهش می‌دهد و انرژی زیادی مصرف می‌کند.

محاسبات آنالوگ، راه حلی جایگزین است که در آن، به جای استفاده از صفر و یک‌های دیجیتال، از ویژگی‌های فیزیکی مدار برای انجام مستقیم محاسبات استفاده می‌شود. این روش به طور ذاتی سریع‌تر و کم‌مصرف‌تر است، اما همیشه با یک چالش بزرگ دست و پنجه نرم کرده: دقت پایین.

حالا، در پژوهشی که ۱۳ اکتبر در نشریه‌ Nature Electronics منتشر شد، گروهی از محققان دانشگاه پکن اعلام کردند که تراشه‌ی آن‌ها دو گلوگاه اساسی را برطرف کرده است: نخست، محدودیت انرژی و داده‌ای که تراشه‌های دیجیتال در حوزه‌های نوظهوری مانند هوش مصنوعی و فناوری نسل ششم (6G) با آن روبه‌رو هستند و دوم، «مشکل صدساله‌ی» دقت پایین و کارایی محدود که همیشه مانعی برای عملی‌شدن محاسبات آنالوگ بود.

زمانی که محققان این تراشه را برای حل مسائل پیچیده‌ی ارتباطی مثل مسائل معکوس‌سازی ماتریس‌ها به کار گرفتند، که در سیستم‌های MIMO (چندورودی-چندخروجی گسترده) فناوری‌های ارتباطات بی‌سیم استفاده می‌شود؛ تراشه توانست به همان دقت پردازنده‌های دیجیتال استاندارد دست یابد، درحالی‌که مصرف انرژی‌اش هم صدبرابر کمتر بود.

پژوهشگران می‌گویند با انجام تنظیماتی در ساختار تراشه، عملکرد آن به‌قدری افزایش یافت که می‌تواند تراشه‌های گرافیکی پیشرفته‌ای مانند انویدیا H100 و ای‌ام‌دی Vega 20 را با فاصله‌ای زیاد در حدود هزار برابر پشت سر بگذارد.

تراشه‌ی جدید چینی، داده‌ها را از طریق تنظیم مقاومت الکتریکی سلول‌ها ذخیره و پردازش می‌کند

هر دوی این تراشه‌ها از اجزای اصلی در فرایند آموزش مدل‌های هوش مصنوعی به شمار می‌آیند؛ برای مثال تراشه‌ی H100 نسخه‌ی جدیدتر کارت‌های گرافیک A100 است که شرکت OpenAI برای آموزش ChatGPT از آن استفاده کرد.

تراشه‌ی جدید چینی از آرایه‌هایی از سلول‌های حافظه‌ی دسترسی تصادفی مقاومتی (RRAM) ساخته شده که داده‌ها را با تنظیم میزان سهولت جریان الکتریسیته از طریق هر سلول ذخیره و پردازش می‌کنند.

برخلاف پردازنده‌های دیجیتال که محاسبات را با صفر و یک‌های باینری انجام می‌دهند، طراحی آنالوگ این تراشه اطلاعات را به‌صورت جریان‌های پیوسته‌ی الکتریکی در سراسر شبکه سلول‌های RRAM خود پردازش می‌کند.

ازآنجاکه داده‌ها مستقیماً درون سخت‌افزار خود تراشه پردازش می‌شوند، دیگر نیازی نیست اطلاعات مدام بین تراشه و حافظه‌ی خارجی جابه‌جا شوند، فرایندی که در تراشه‌های دیجیتال انرژی بسیار زیادی مصرف می‌کند.

برای درک بهتر، اگر تراشه‌ی دیجیتال مانند دانشجویی باشد که برای حل مسئله باید هر بار کتاب را از کتابخانه به خانه بیاورد و برگرداند، تراشه‌ی آنالوگ مانند دانشجویی است که کتاب را در خود کتابخانه (درون تراشه) باز و مسئله‌اش را حل می‌کند. در حالت دوم، کار بسیار سریع‌تر و با انرژی کمتری انجام می‌شود.

در طراحی آنالوگ، محاسبات به‌جای صفر و یک‌های دیجیتال، با جریان‌های پیوسته‌ی برق در مدار فیزیکی تراشه انجام می‌شود

پژوهشگران در این مطالعه نوشتند: «با گسترش برنامه‌های کاربردی که به حجم عظیمی از داده نیاز دارند، پردازشگرهای دیجیتال با چالشی جدی روبه‌رو شده‌اند؛ مخصوصاً که مقیاس‌پذیری دستگاه‌های سنتی، کوچک‌سازی و ارتقای تراشه‌ها روزبه‌روز دشوارتر می‌شود.»

آن‌ها افزودند: «نتایج مقایسه‌ای ما نشان می‌دهد که رویکرد محاسبات آنالوگ می‌تواند در همان سطح دقت، هزار برابر توان پردازشی بالاتر و صد برابر بهره‌وری انرژی بهتری نسبت به پیشرفته‌ترین پردازنده‌های دیجیتال ارائه دهد.»

فناوری قدیمی، ترفندهای تازه

محاسبات آنالوگ پدیده‌ی جدیدی نیست و اتفاقا، پیشینه‌ای بسیار کهن دارد. تخمین زده می‌شود که مکانیزم آنتیکیترا (Antikythera) که سال ۱۹۰۱ در سواحل یونان کشف شد، بیش از ۲۰۰۰ سال پیش ساخته شده باشد. این دستگاه که یکی از قدیمی‌ترین کامپیوترهای تاریخ به‌شمار می‌رود، از چرخ‌دنده‌های درهم‌تنیده برای محاسبه‌ی حرکات ستاره‌ها و سیارات استفاده می‌کرد.

این تراشه با دو مدار طراحی شده: یکی برای محاسبه‌ی سریع و تقریبی و دیگری برای اصلاح تدریجی نتیجه تا رسیدن به دقت بالا

بااین‌حال، در بیشتر دوران تاریخ محاسبات مدرن، این فناوری بیشتر ایده‌ای غیراجرایی و گزینه‌ای ناکارآمد به‌نظر می‌رسید و در عمل جای خود را به پردازنده‌های دیجیتال داده بود.

عمدتاً به این دلیل که سیستم‌های آنالوگ برای پردازش اطلاعات به سیگنال‌های فیزیکی پیوسته مانند ولتاژ یا جریان الکتریکی متکی‌اند، سیگنال‌هایی که کنترل دقیق آن‌ها بسیار دشوارتر از دو حالت پایدار صفر و یک‌هایی است که کامپیوترهای دیجیتال بر پایه‌ی آن کار می‌کنند.

سیستم‌های آنالوگ زمانی قدرت خود را نشان می‌دهند که پای سرعت و بهره‌وری در میان باشد. ازآنجاکه این تراشه‌ها نیازی به تجزیه‌ی محاسبات به رشته‌های طولانی از کدهای دودویی ندارند و در عوض آن‌ها را به‌صورت عملیات فیزیکی در مدارهای خود نمایش می‌دهند، می‌توانند حجم عظیمی از داده‌ها را با استفاده از بسیار کمتری پردازش کنند.

این ویژگی در برنامه‌های کاربردی که هم از نظر داده و هم انرژی بسیار سنگین‌اند، اهمیتی ویژه پیدا می‌کند: مانند حوزه‌ی هوش مصنوعی، جایی که پردازنده‌های دیجیتال در پردازش ترتیبی و متوالی حجم بالای داده‌ها با محدودیت روبه‌رو هستند، یا در شبکه‌های آینده‌ی 6G که باید انبوهی از سیگنال‌های بی‌سیم هم‌پوشان را به‌صورت هم‌زمان و در لحظه پردازش کنند.

به‌گفته‌ی پژوهشگران، پیشرفت‌های اخیر در فناوری سخت‌افزار حافظه می‌تواند بار دیگر محاسبات آنالوگ را به گزینه‌ای عملی تبدیل کند. این تیم سلول‌های RRAM تراشه را در دو مدار پیکربندی کرد: یکی که محاسبه‌ای سریع اما تقریبی انجام می‌داد و دومی که نتیجه را در تکرارهای بعدی اصلاح و تنظیم می‌کرد تا به دقت بالاتری برسد.

این شیوه‌ی پیکربندی باعث شد پژوهشگران سرعت محاسبات آنالوگ را در کنار دقت پردازش دیجیتال به‌دست آورند. نکته‌ی مهم این است که این تراشه با استفاده از فرایند تولید تجاری ساخته شده، بنابراین امکان تولید انبوه آن در آینده وجود دارد.

البته باید در نظر گرفت که پژوهشگران این نتایج درخشان را با آرایه‌های RRAM کوچک‌تر به دست آوردند و ادعای افزایش ۱۰۰۰ برابری در سرعت پردازش مشروط‌بر اجرای تحقیق روی آرایه‌های بزرگ‌تر است. بااین‌حال، آن‌ها می‌گویند بهبودهای بیشتر در مدارهای تراشه می‌تواند عملکرد آن را باز هم ارتقا دهد. هدف بعدی این تیم، ساخت تراشه‌هایی بزرگ‌تر و کاملاً یکپارچه است که قادر به حل مسائل پیچیده‌تر با سرعت‌های بالاتر باشند.

نظرات