رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

مدل‌های زبانی فارسی توسعه یافته توسط همراه اول که با هوش مصنوعی قادر به تحلیل و یادگیری حجم زیادی از داده‌های متنی هستند، با حضور وزیر ارتباطات در الکامپ ۱۴۰۳، رونمایی شدند.

به گزارش اداره کل ارتباطات شرکت ارتباطات سیار ایران، گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، تعدادی از مدل های زبانی توسعه یافته خود شامل سیلک (با ۱.۳میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور عیسی زارع پور وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی همراه اول (سالن ۳۵)، رونمایی کرد.

مدل های زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

مدل آهوران بر پایه مدل چند زبانه Llama3 شرکت Meta و به صورت آموزش ادامه دار (continual pretraining)  بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت های دیگر مدل تا حد زیادی حفظ شده است.

کاربردهای تجاری این مدل ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدل ها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere  توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارایه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند؛ استفاده اصلی این مدل در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

گروه MCINext همراه اول تلاش دارد تا در آینده نزدیک امکان استفاده عمومی از این مدل ها را نیز فراهم کند.

link

مطالب مرتبط

همراه اول

چگونه با مصرف بهینه برق اینترنت رایگان بگیریم؟

استفاده بالا از سیستم‌های سرمایشی در فصل تابستان باعث نجومی شدن قبض برق مشترکان و فشار به شبکه توزیع برق می‌شود. شرکت توانیر برای رفع این مشکل پویشی را موسوم به
استفاده بالا از سیستم‌های سرمایشی در فصل تابستان باعث نجومی شدن قبض برق مشترکان و فشار…
همراه اول

معرفی و ارائه سرویس‌های VoLTE و ViLTE در الکامپ ۱۴۰۳

همراه اول با حضور در الکامپ ۱۴۰۳، اقدام به معرفی و ارائه سرویس‌های تماس صوتی و تصویری مبتنی بر نسل‌های نوین ارتباطی کرد. به گزارش اداره کل ارتباطات شرکت ارتباطات
همراه اول با حضور در الکامپ ۱۴۰۳، اقدام به معرفی و ارائه سرویس‌های تماس صوتی و…
همراه اول

نشست تخصصی معرفی مدل‌های زبانی همراه اول برگزار شد

نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های مرتبط هوش مصنوعی، در نمایشگاه الکامپ ۱۴۰۳ برگزار شد. به گزارش اداره کل
نشست تخصصی معرفی و ارائه تعدادی از مدل‌های زبانی توسعه یافته توسط گروه MCINext که سیستم‌های…
همراه اول

حضور مجموعه کری گیمز به عنوان ناشر بازی‌های موبایلی در الکامپ ۱۴۰۳

مجموعه کری‌گیمز همراه اول به عنوان ناشر بازی‌های موبایلی داخلی و بین‌المللی در رویداد بین‌المللی الکامپ ۱۴۰۳ حضور دارد. به گزارش اداره کل ارتباطات شرکت ارتباطات
مجموعه کری‌گیمز همراه اول به عنوان ناشر بازی‌های موبایلی داخلی و بین‌المللی در رویداد بین‌المللی الکامپ…

دیدگاه‌تان را بنویسید

بخش‌های مورد نیاز علامت‌گذاری شده‌اند *

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Fill out this field
Fill out this field
لطفاً یک نشانی ایمیل معتبر بنویسید.
You need to agree with the terms to proceed

پربازدیدهای هفته

پادکست زوم