بهاویش آگاروال، بنیانگذار شرکت اولا (Ola)، در حالی ۲۳۰ میلیون دلار در یک استارتاپ هوش مصنوعی که خودش بنیان گذاشته سرمایهگذاری میکند که هند تلاش دارد در حوزهای که عمدتاً تحت سلطه شرکتهای آمریکایی و چینی است، جایگاه خود را تثبیت کند.
میلیاردر مورد حمایت سافتبانک، ۲۳۰ میلیون دلار در استارتاپ هندی هوش مصنوعی Krutrim سرمایهگذاری میکند
یک منبع آگاه به تککرانچ گفته است که آگاروال عمدتاً از طریق دفتر خانوادگیاش این سرمایه را وارد Krutrim میکند. آگاروال در پستی در شبکه اجتماعی ایکس در روز سهشنبه نوشت که Krutrim قصد دارد تا سال آینده ۱.۱۵ میلیارد دلار جذب سرمایه کند. به گفته این منبع، او به دنبال آن است که مابقی این سرمایه را از سرمایهگذاران خارجی تأمین کند.
همزمان با اعلام این سرمایهگذاری، استارتاپ یونیکورن Krutrim مدلهای هوش مصنوعی خود را متنباز (Open Source) کرد و همچنین از برنامهاش برای ساخت آنچه «بزرگترین ابررایانه هند» مینامد، در همکاری با شرکت انویدیا (Nvidia) پرده برداشت.
این آزمایشگاه (Krutrim) مدل زبانی جدیدی به نام Krutrim-2 را معرفی کرده است که از ۱۲ میلیارد پارامتر تشکیل شده و عملکرد قدرتمندی در پردازش زبانهای هندی نشان میدهد. در تستهای تحلیل احساساتی که روز سهشنبه توسط Krutrim منتشر شد، این مدل امتیاز ۰.۹۵ را در مقایسه با امتیاز ۰.۷۰ مدلهای رقیب کسب کرده است و در وظایف تولید کد نیز به نرخ موفقیت ۸۰ درصد دست یافته است.
این آزمایشگاه همچنین چندین مدل تخصصی متنباز را معرفی کرده است، از جمله سیستمهایی برای پردازش تصاویر، ترجمه گفتار و جستوجوی متنی که همگی برای زبانهای هندی بهینهسازی شدهاند.
آگاروال (که دیگر کسبوکارهای او نیز از حمایت سافتبانک برخوردار بودهاند) در ایکس نوشت: «هنوز با شاخصهای جهانی فاصله زیادی داریم، اما در یک سال گذشته پیشرفت خوبی داشتهایم. با متنباز کردن مدلهایمان امیدواریم جامعه هوش مصنوعی هند بهطور جمعی همکاری کند تا اکوسیستم هوش مصنوعی در کلاس جهانی بسازیم.»
این اقدام در حالی صورت میگیرد که هند سعی دارد در فضایی که شرکتهای آمریکایی و چینی در حوزه هوش مصنوعی بر آن مسلط هستند، جایگاه خود را تثبیت کند. انتشار اخیر مدل «استدلالی» R1 از سوی دیپسیک (DeepSeek)، که گفته میشود با بودجهای نسبتاً کم توسعه یافته است، شوکهایی را در صنعت فناوری ایجاد کرد.
هند هفته گذشته پیشرفت دیپسیک را تحسین کرد و اعلام کرد که این کشور میزبان مدلهای زبانی بزرگ این آزمایشگاه چینی در سرورهای داخلی خود خواهد بود. بخش خدمات ابری Krutrim نیز از هفته گذشته امکان استفاده از دیپسیک در سرورهای هندی را فراهم کرده است.
Krutrim همچنین چارچوب ارزیابی خود را با نام BharatBench توسعه داده است تا مهارت مدلهای هوش مصنوعی در زبانهای هندی را بسنجد و به این ترتیب خلأ موجود در معیارهایی را پر کند که عمدتاً بر زبانهای انگلیسی و چینی متمرکز هستند.
رویکرد فنی این آزمایشگاه شامل استفاده از پنجره متنی با ظرفیت ۱۲۸ هزار توکن است که امکان پردازش متون طولانیتر و مکالمات پیچیدهتر را برای سیستمهایش فراهم میکند. معیارهای عملکردی منتشرشده توسط این استارتاپ نشان میدهد که Krutrim-2 در تصحیح دستور زبان (با امتیاز ۰.۹۸) و مکالمات چند مرحلهای (با امتیاز ۰.۹۱) نتایج بالایی به دست آورده است.
این سرمایهگذاری جدید پس از راهاندازی مدل Krutrim-1 در ماه ژانویه صورت گرفته است. Krutrim-1 یک سیستم ۷ میلیارد پارامتری بود که به عنوان اولین مدل زبانی بزرگ هند شناخته میشود. قرار است ابررایانه این شرکت با مشارکت انویدیا از ماه مارس راهاندازی شود و در طول سال نیز گسترش یابد.
مطالب مرتبط
نزدیک به نیمی از کارکنان Cruise اخراج میشوند
واکنش اسنپ به ادعای ثبتنام اتباع خارجی غیرمجاز
پلتفرم ویاودی «شیدا» آغاز به کار کرد
پربازدیدهای هفته
سرویس جدید «فودرو» اسنپفود چگونه کار میکند؟
از پرآگهیترین تا پربازدیدترین ماشینها در دیوار
نسخه جدید اپلیکیشن دیجیکالا منتشر شد
پادکست زوم