میلیاردر مورد حمایت سافت‌بانک، ۲۳۰ میلیون دلار در استارتاپ هندی هوش مصنوعی Krutrim سرمایه‌گذاری می‌کند

تحریریه 16 بهمن 1403 ‌‌ ‌‌ 14:42

بهاویش آگاروال، بنیان‌گذار شرکت اولا (Ola)، در حالی ۲۳۰ میلیون دلار در یک استارتاپ هوش مصنوعی که خودش بنیان گذاشته سرمایه‌گذاری می‌کند که هند تلاش دارد در حوزه‌ای که عمدتاً تحت سلطه شرکت‌های آمریکایی و چینی است، جایگاه خود را تثبیت کند.

یک منبع آگاه به تک‌کرانچ گفته است که آگاروال عمدتاً از طریق دفتر خانوادگی‌اش این سرمایه را وارد Krutrim می‌کند. آگاروال در پستی در شبکه اجتماعی ایکس در روز سه‌شنبه نوشت که Krutrim قصد دارد تا سال آینده ۱.۱۵ میلیارد دلار جذب سرمایه کند. به گفته این منبع، او به دنبال آن است که مابقی این سرمایه را از سرمایه‌گذاران خارجی تأمین کند.

همزمان با اعلام این سرمایه‌گذاری، استارتاپ یونیکورن Krutrim مدل‌های هوش مصنوعی خود را متن‌باز (Open Source) کرد و همچنین از برنامه‌اش برای ساخت آنچه «بزرگ‌ترین ابررایانه هند» می‌نامد، در همکاری با شرکت انویدیا (Nvidia) پرده برداشت.

این آزمایشگاه (Krutrim) مدل زبانی جدیدی به نام Krutrim-2 را معرفی کرده است که از ۱۲ میلیارد پارامتر تشکیل شده و عملکرد قدرتمندی در پردازش زبان‌های هندی نشان می‌دهد. در تست‌های تحلیل احساساتی که روز سه‌شنبه توسط Krutrim منتشر شد، این مدل امتیاز ۰.۹۵ را در مقایسه با امتیاز ۰.۷۰ مدل‌های رقیب کسب کرده است و در وظایف تولید کد نیز به نرخ موفقیت ۸۰ درصد دست یافته است.

این آزمایشگاه همچنین چندین مدل تخصصی متن‌باز را معرفی کرده است، از جمله سیستم‌هایی برای پردازش تصاویر، ترجمه گفتار و جست‌وجوی متنی که همگی برای زبان‌های هندی بهینه‌سازی شده‌اند.

آگاروال (که دیگر کسب‌وکارهای او نیز از حمایت سافت‌بانک برخوردار بوده‌اند) در ایکس نوشت: «هنوز با شاخص‌های جهانی فاصله زیادی داریم، اما در یک سال گذشته پیشرفت خوبی داشته‌ایم. با متن‌باز کردن مدل‌هایمان امیدواریم جامعه هوش مصنوعی هند به‌طور جمعی همکاری کند تا اکوسیستم هوش مصنوعی در کلاس جهانی بسازیم.»

این اقدام در حالی صورت می‌گیرد که هند سعی دارد در فضایی که شرکت‌های آمریکایی و چینی در حوزه هوش مصنوعی بر آن مسلط هستند، جایگاه خود را تثبیت کند. انتشار اخیر مدل «استدلالی» R1 از سوی دیپ‌سیک (DeepSeek)، که گفته می‌شود با بودجه‌ای نسبتاً کم توسعه یافته است، شوک‌هایی را در صنعت فناوری ایجاد کرد.

هند هفته گذشته پیشرفت دیپ‌سیک را تحسین کرد و اعلام کرد که این کشور میزبان مدل‌های زبانی بزرگ این آزمایشگاه چینی در سرورهای داخلی خود خواهد بود. بخش خدمات ابری Krutrim نیز از هفته گذشته امکان استفاده از دیپ‌سیک در سرورهای هندی را فراهم کرده است.

Krutrim همچنین چارچوب ارزیابی خود را با نام BharatBench توسعه داده است تا مهارت مدل‌های هوش مصنوعی در زبان‌های هندی را بسنجد و به این ترتیب خلأ موجود در معیارهایی را پر کند که عمدتاً بر زبان‌های انگلیسی و چینی متمرکز هستند.

رویکرد فنی این آزمایشگاه شامل استفاده از پنجره متنی با ظرفیت ۱۲۸ هزار توکن است که امکان پردازش متون طولانی‌تر و مکالمات پیچیده‌تر را برای سیستم‌هایش فراهم می‌کند. معیارهای عملکردی منتشرشده توسط این استارتاپ نشان می‌دهد که Krutrim-2 در تصحیح دستور زبان (با امتیاز ۰.۹۸) و مکالمات چند مرحله‌ای (با امتیاز ۰.۹۱) نتایج بالایی به دست آورده است.

این سرمایه‌گذاری جدید پس از راه‌اندازی مدل Krutrim-1 در ماه ژانویه صورت گرفته است. Krutrim-1 یک سیستم ۷ میلیارد پارامتری بود که به عنوان اولین مدل زبانی بزرگ هند شناخته می‌شود. قرار است ابررایانه این شرکت با مشارکت انویدیا از ماه مارس راه‌اندازی شود و در طول سال نیز گسترش یابد.