با استفاده از مجموعه بهبود یافته، تیم ترجمه ماشینی SRPOL یک طبقهبندی کننده با استفاده از یک چارچوب یادگیری ماشینی به نام BERT (نمایش رمزگذار دوطرفه از ترانسفورماتور) ساخت. این طبقهبندیکننده میلیونها جمله را با موفقیت در حوزههای مختلف دستهبندی کرد. در نتیجه، SRPOL قادر به ایجاد مدلهایی برای ترجمههای عمومی نه تنها برای پزشکی و حقوقی بود.
در مورد ترجمه اختصاصی دامنه، یکی از عوامل مهمی که کیفیت ترجمه را تعیین می کند، ترجمه اصطلاحات است. حتی با یک کلمه، کلمه ترجمه شده ممکن است بسته به دامنه متفاوت باشد، و در مقایسه با اصطلاحات عمومی، اصطلاحات فنی کمتر استفاده می شود و یادگیری آن را دشوار می کند. با در نظر گرفتن این محدودیتها، آزمایشگاه زبان مرکز تحقیقات جهانی هوش مصنوعی سامسونگ، عملکرد ترجمه دامنه خاص را با ترکیب ترجمه اصطلاحات با محدودیت نرم، که محدودیتهای اصطلاحی زبان مقصد را به عنوان ورودی با جملات منبع مانند یک اشاره ارائه میکند، بهبود بخشید و اصطلاحات دامنه را بهبود بخشید. تا حد امکان در نتایج ترجمه منعکس شود. در حال حاضر، تحقیقات سامسونگ در حال انجام تحقیقاتی بر روی ترجمه دامنه خاص، از جمله ارائه خدمات ترجمه پتنت (کره ای–انگلیسی) در سرویس ترجمه Samsung Research “SR Translate” (https://translate.samsung.com).
SRPOL همچنین در دو وظیفه عمومی ترجمه ماشینی شرکت کرد و با قرار گرفتن در رتبه دوم برای انگلیسی → روسی و انگلیسی → کرواتی به رتبه های بالایی دست یافت.
در کارگاه ترجمه ماشینی (WMT)، یکی از بزرگترین رویدادها برای تحقیقات ترجمه ماشینی، Samsung Electronics به جمع محققان از سراسر جهان پیوست تا راههای جدید و مبتکرانه برای درک زبان انسان با استفاده از ماشینها و برنامههای کامپیوتری را مورد بحث و بررسی قرار دهند.
تحقیقات سامسونگ و موسسه تحقیق و توسعه سامسونگ لهستان (SRPOL) در رقابتی بین گروه های علمی و آزمایشگاه ها برای مقایسه کیفیت ابزار ترجمه خود شرکت کردند. تیمهایی از سرتاسر جهان در هشت مسابقه کار ترجمه ماشینی شرکت کردند، از آنهایی که نماینده شرکتهای معروف گرفته تا گروههای تحقیقاتی از دانشگاههای مختلف بودند.