
هوش مصنوعی اکنون ممکن است مسائل ریاضی پیچیده را حل کند، استدلالهای پیچیده انجام دهد و حتی از کامپیوترهای شخصی استفاده کند، اما الگوریتمهای امروزی هنوز میتوانند چیزهایی از کرمهای میکروسکوپی بیاموزند.
Liquid AI، یک استارتاپ منشعب از MIT، امروز چندین مدل جدید هوش مصنوعی مبتنی بر نوع جدیدی از شبکه عصبی “مایع” را معرفی خواهد کرد که میتواند کارآمدتر، کممصرفتر و شفافتر از مدلهایی باشد که در هر چیزی از چتباتها و تولیدکنندگان تصویر گرفته تا سیستمهای تشخیص چهره استفاده میشود.
مدلهای جدید Liquid AI شامل مدلی برای شناسایی تقلب در تراکنشهای مالی، مدلی دیگر برای کنترل خودروهای خودران، و مدلی برای تحلیل دادههای ژنتیکی است. این شرکت مدلهای جدید خود را که به شرکتهای خارجی واگذار کرده، در رویدادی در MIT معرفی کرد. این استارتاپ از سرمایهگذاران از جمله سامسونگ و Shopify که در حال آزمایش این فناوری هستند، سرمایه جذب کرده است.
رامین حسنی، همبنیانگذار و مدیرعامل Liquid AI، که شبکههای مایع را در دوران تحصیل در MIT ابداع کرده، میگوید: “ما در حال گسترش هستیم.” تحقیقات حسنی از کرم C. elegans الهام گرفته شده است، کرمی که فقط چند میلیمتر طول دارد و معمولاً در خاک یا گیاهان در حال پوسیدن یافت میشود. این کرم یکی از معدود موجوداتی است که سیستم عصبی آن بهطور کامل نقشهبرداری شده و با وجود داشتن تنها چند صد نورون، رفتارهای بسیار پیچیدهای دارد. حسنی میگوید: “این در ابتدا فقط یک پروژه علمی بود، اما اکنون این فناوری بهطور کامل تجاریسازی شده و آماده ارائه ارزش به شرکتها است.”
در یک شبکه عصبی عادی، ویژگیهای هر نورون شبیهسازیشده با یک مقدار ثابت یا “وزن” تعریف میشود که بر عملکرد آن تأثیر میگذارد. در شبکه عصبی مایع، رفتار هر نورون توسط معادلهای تعیین میشود که رفتار آن را در طول زمان پیشبینی میکند، و شبکه در حین کار کردن، یک سلسله از معادلات پیوسته را حل میکند. این طراحی، شبکه را کارآمدتر و انعطافپذیرتر میکند و به آن اجازه میدهد حتی پس از آموزش نیز یاد بگیرد، برخلاف شبکه عصبی معمولی. شبکههای عصبی مایع همچنین قابل بازبینی هستند، چرا که رفتار آنها را میتوان به عقب برگرداند و نحوه تولید خروجی را مشاهده کرد.
در سال ۲۰۲۰، محققان نشان دادند که چنین شبکهای با تنها ۱۹ نورون و ۲۵۳ سیناپس، که در مقایسه با استانداردهای امروزی بسیار کوچک است، میتواند یک خودروی خودران شبیهسازی شده را کنترل کند. در حالی که یک شبکه عصبی عادی تنها میتواند دادههای بصری را در فواصل ثابت تحلیل کند، شبکه مایع تغییرات اطلاعات بصری را در طول زمان بهطور بسیار کارآمد ثبت میکند. در سال ۲۰۲۲، بنیانگذاران Liquid AI موفق به یافتن میانبری شدند که کار ریاضیاتی مورد نیاز برای شبکههای عصبی مایع را برای استفاده عملی قابل انجام میکرد.
Liquid AI میگوید که بر اساس این تحقیقات کار کرده و مدلهای جدیدی ساخته که هنوز بهطور کامل فاش نشده است. در ماه سپتامبر، این شرکت برخی از مدلهای زبان بزرگ خود را که بر اساس طراحی شبکههای مایع ساخته شدهاند، معرفی کرد. یک نسخه از مدل زبان آن با ۴۰ میلیارد پارامتر، نسخه ۷۰ میلیارد پارامتری مدل Llama 3.1 از Meta را در مجموعهای از مسائل معروف به MMLU-Pro شکست داده است.
سباستین بوبک، محقق OpenAI که به بررسی تاثیر معماری و آموزش مدلهای هوش مصنوعی بر توانمندیهای آنها میپردازد، میگوید: “نتایج معیار برای SLMهای آنها بسیار امیدوارکننده است.”
تام پرستون-ورنر، یکی از بنیانگذاران GitHub و از سرمایهگذاران اولیه Liquid AI، میگوید: “یافتن یک نوع جدید از مدلهای پایهای هر روز رخ نمیدهد.” او اشاره میکند که مدلهای ترانسفورمر که مدلهای بزرگ زبان و دیگر سیستمهای هوش مصنوعی بر آنها متکی هستند، در حال نشان دادن محدودیتهای خود هستند. پرستون-ورنر اضافه میکند که باید بهرهوری هوش مصنوعی برای همه در اولویت باشد. “باید تمام تلاش خود را کنیم تا مطمئن شویم که نیروگاههای زغالسوز را برای مدت طولانیتر روشن نمیکنیم.”
یکی از نقاط ضعف رویکرد Liquid AI این است که شبکههای آن بهویژه برای برخی از وظایف مناسب هستند، بهویژه وظایفی که شامل دادههای زمانی است. استفاده از این فناوری برای انواع دیگر دادهها نیاز به کدنویسی سفارشی دارد. و البته، چالش دیگری نیز متقاعد کردن شرکتهای بزرگ برای پایهگذاری پروژههای مهم خود بر روی یک طراحی کاملاً جدید در هوش مصنوعی است.
حسنی میگوید که هدف کنونی این است که نشان دهد مزایا، از جمله کارایی، شفافیت و هزینههای انرژی، بر چالشها میچربد. او میگوید: “ما به مرحلهای رسیدهایم که این مدلها میتوانند بسیاری از چالشهای اجتماعی-فنی سیستمهای هوش مصنوعی را کاهش دهند.”











