Liquid AI در حال طراحی مجدد شبکه‌های عصبی است

هوش مصنوعی اکنون ممکن است مسائل ریاضی پیچیده را حل کند، استدلال‌های پیچیده انجام دهد و حتی از کامپیوترهای شخصی استفاده کند، اما الگوریتم‌های امروزی هنوز می‌توانند چیزهایی از کرم‌های میکروسکوپی بیاموزند.

Liquid AI، یک استارتاپ منشعب از MIT، امروز چندین مدل جدید هوش مصنوعی مبتنی بر نوع جدیدی از شبکه عصبی “مایع” را معرفی خواهد کرد که می‌تواند کارآمدتر، کم‌مصرف‌تر و شفاف‌تر از مدل‌هایی باشد که در هر چیزی از چت‌بات‌ها و تولیدکنندگان تصویر گرفته تا سیستم‌های تشخیص چهره استفاده می‌شود.

مدل‌های جدید Liquid AI شامل مدلی برای شناسایی تقلب در تراکنش‌های مالی، مدلی دیگر برای کنترل خودروهای خودران، و مدلی برای تحلیل داده‌های ژنتیکی است. این شرکت مدل‌های جدید خود را که به شرکت‌های خارجی واگذار کرده، در رویدادی در MIT معرفی کرد. این استارتاپ از سرمایه‌گذاران از جمله سامسونگ و Shopify که در حال آزمایش این فناوری هستند، سرمایه جذب کرده است.

رامین حسنی، هم‌بنیان‌گذار و مدیرعامل Liquid AI، که شبکه‌های مایع را در دوران تحصیل در MIT ابداع کرده، می‌گوید: “ما در حال گسترش هستیم.” تحقیقات حسنی از کرم C. elegans الهام گرفته شده است، کرمی که فقط چند میلی‌متر طول دارد و معمولاً در خاک یا گیاهان در حال پوسیدن یافت می‌شود. این کرم یکی از معدود موجوداتی است که سیستم عصبی آن به‌طور کامل نقشه‌برداری شده و با وجود داشتن تنها چند صد نورون، رفتارهای بسیار پیچیده‌ای دارد. حسنی می‌گوید: “این در ابتدا فقط یک پروژه علمی بود، اما اکنون این فناوری به‌طور کامل تجاری‌سازی شده و آماده ارائه ارزش به شرکت‌ها است.”

در یک شبکه عصبی عادی، ویژگی‌های هر نورون شبیه‌سازی‌شده با یک مقدار ثابت یا “وزن” تعریف می‌شود که بر عملکرد آن تأثیر می‌گذارد. در شبکه عصبی مایع، رفتار هر نورون توسط معادله‌ای تعیین می‌شود که رفتار آن را در طول زمان پیش‌بینی می‌کند، و شبکه در حین کار کردن، یک سلسله از معادلات پیوسته را حل می‌کند. این طراحی، شبکه را کارآمدتر و انعطاف‌پذیرتر می‌کند و به آن اجازه می‌دهد حتی پس از آموزش نیز یاد بگیرد، برخلاف شبکه عصبی معمولی. شبکه‌های عصبی مایع همچنین قابل بازبینی هستند، چرا که رفتار آن‌ها را می‌توان به عقب برگرداند و نحوه تولید خروجی را مشاهده کرد.

در سال ۲۰۲۰، محققان نشان دادند که چنین شبکه‌ای با تنها ۱۹ نورون و ۲۵۳ سیناپس، که در مقایسه با استانداردهای امروزی بسیار کوچک است، می‌تواند یک خودروی خودران شبیه‌سازی شده را کنترل کند. در حالی که یک شبکه عصبی عادی تنها می‌تواند داده‌های بصری را در فواصل ثابت تحلیل کند، شبکه مایع تغییرات اطلاعات بصری را در طول زمان به‌طور بسیار کارآمد ثبت می‌کند. در سال ۲۰۲۲، بنیان‌گذاران Liquid AI موفق به یافتن میان‌بری شدند که کار ریاضیاتی مورد نیاز برای شبکه‌های عصبی مایع را برای استفاده عملی قابل انجام می‌کرد.

Liquid AI می‌گوید که بر اساس این تحقیقات کار کرده و مدل‌های جدیدی ساخته که هنوز به‌طور کامل فاش نشده است. در ماه سپتامبر، این شرکت برخی از مدل‌های زبان بزرگ خود را که بر اساس طراحی شبکه‌های مایع ساخته شده‌اند، معرفی کرد. یک نسخه از مدل زبان آن با ۴۰ میلیارد پارامتر، نسخه ۷۰ میلیارد پارامتری مدل Llama 3.1 از Meta را در مجموعه‌ای از مسائل معروف به MMLU-Pro شکست داده است.

سباستین بوبک، محقق OpenAI که به بررسی تاثیر معماری و آموزش مدل‌های هوش مصنوعی بر توانمندی‌های آن‌ها می‌پردازد، می‌گوید: “نتایج معیار برای SLM‌های آن‌ها بسیار امیدوارکننده است.”

تام پرستون-ورنر، یکی از بنیان‌گذاران GitHub و از سرمایه‌گذاران اولیه Liquid AI، می‌گوید: “یافتن یک نوع جدید از مدل‌های پایه‌ای هر روز رخ نمی‌دهد.” او اشاره می‌کند که مدل‌های ترانسفورمر که مدل‌های بزرگ زبان و دیگر سیستم‌های هوش مصنوعی بر آن‌ها متکی هستند، در حال نشان دادن محدودیت‌های خود هستند. پرستون-ورنر اضافه می‌کند که باید بهره‌وری هوش مصنوعی برای همه در اولویت باشد. “باید تمام تلاش خود را کنیم تا مطمئن شویم که نیروگاه‌های زغال‌سوز را برای مدت طولانی‌تر روشن نمی‌کنیم.”

یکی از نقاط ضعف رویکرد Liquid AI این است که شبکه‌های آن به‌ویژه برای برخی از وظایف مناسب هستند، به‌ویژه وظایفی که شامل داده‌های زمانی است. استفاده از این فناوری برای انواع دیگر داده‌ها نیاز به کدنویسی سفارشی دارد. و البته، چالش دیگری نیز متقاعد کردن شرکت‌های بزرگ برای پایه‌گذاری پروژه‌های مهم خود بر روی یک طراحی کاملاً جدید در هوش مصنوعی است.

حسنی می‌گوید که هدف کنونی این است که نشان دهد مزایا، از جمله کارایی، شفافیت و هزینه‌های انرژی، بر چالش‌ها می‌چربد. او می‌گوید: “ما به مرحله‌ای رسیده‌ایم که این مدل‌ها می‌توانند بسیاری از چالش‌های اجتماعی-فنی سیستم‌های هوش مصنوعی را کاهش دهند.”

→ خواندن مطلب قبلی

OpenAI برنامه دارد مدل بزرگ بعدی خود را تا دسامبر منتشر کند.

خواندن مطلب بعدی ←

گوگل قصد دارد به‌زودی مدل جدید جمینی خود را معرفی کند

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
0
افکار شما را دوست داریم، لطفا نظر دهید.x