[ad_1]
تحقیقات سامسونگ در ژاپن بخشی از مجموعهای درباره افراد و نوآوریهای پشت سر دموکراتیزهسازی هوش مصنوعی موبایل است
از آنجایی که سامسونگ به پیشگام بودن در تجارب هوش مصنوعی موبایلی ممتاز ادامه میدهد، ما از مراکز تحقیقاتی سامسونگ در سراسر جهان بازدید میکنیم تا بیاموزیم که چگونه هوش مصنوعی Galaxy به کاربران بیشتری امکان میدهد تا پتانسیل خود را به حداکثر برسانند. Galaxy AI اکنون از 16 زبان پشتیبانی می کند، بنابراین افراد بیشتری می توانند قابلیت های زبان خود را حتی در حالت آفلاین به لطف ترجمه روی دستگاه در ویژگی هایی مانند Live Translate، Interpreter، Note Assist و Browsing Assist گسترش دهند. اما توسعه زبان هوش مصنوعی شامل چه چیزی است؟ آخرین بار، بازدید کردیم لهستان کشف چگونگی همکاری کشورهای اروپایی برای رسیدن به هدفشان. این بار، ما در ژاپن هستیم تا ببینیم توسعه دهندگان چگونه دائماً با سناریوهای جدید و موارد استفاده سازگار می شوند.
موسسه تحقیق و توسعه سامسونگ ژاپن (SRJ) به عنوان یک مرکز تحقیق و توسعه با تمرکز بر سخت افزارهایی مانند لوازم خانگی و نمایشگر تاسیس شد. با افزایش تقاضا برای نوآوری هوش مصنوعی در سطح جهانی، SRJ در یوکوهاما همچنین از پایان سال گذشته یک آزمایشگاه توسعه نرمافزار را برای ایجاد Live Translate Galaxy AI راهاندازی کرده است که تماسهای صوتی را بهطور خودکار در زمان واقعی ترجمه میکند.
“ترجمه زنده تاکایوکی آکاساکو، رئیس هوش مصنوعی در SRJ میگوید، به ویژه برای سناریوهای سفر مانند بازدیدکنندگان از بازیهای المپیک امسال در پاریس کارآمد است. ما در حال حاضر در حال توسعه یک برنامه تشخیص گفتار برای افرادی هستیم که هم در حال گشت و گذار و هم در حال تماشای بازی های المپیک پاریس هستند. با آموزش برنامه تشخیص گفتار برای آشنایی با بازی ها و مکان های استادیوم ها برای پاریس 2024.
درک زمینه در تشخیص صدا
برای کسانی که در حال حاضر از ویژگی های ترجمه Galaxy AI استفاده می کنند، چنین قابلیت هایی ممکن است بسیار مفید به نظر برسد. اما برای توسعهدهندگانی که این ویژگیها را زنده کردهاند، میدانند که توانایی برقراری ارتباط در حین سفر به خارج از کشور چیزی نیست که بتوان آن را بدیهی انگاشت.
یکی از مواردی که این تیم به آن اشاره کرد این بود که در زبان ژاپنی بیش از برخی از زبانهای دیگر همنام وجود دارد. به عنوان مثال، «چاپستیک» (Hashi,箸) و «پل» (Hashi,橋) به دلیل تفاوت در لحن نسبتاً آسان قابل تشخیص هستند، اما کلماتی مانند «گشت دیدنی» (Kankō,観光)، «رسم» (Kankō,慣行)، «عمومی» (Kōkyō، 公共) و «شکوفایی» (Kōkyō,好況) باید بر اساس زمینه قضاوت شوند.
آکاساکو می گوید: «وقتی زمینه مبهم باشد، مانند نام مکان ها و افراد، اسم های خاص، گویش ها و اعداد، قضاوت دشوارتر می شود. بنابراین برای بهبود دقت تشخیص گفتار، داده های زیادی مورد نیاز است.
آکاساکو ادامه می دهد: “ما همیشه به دنبال راه هایی برای تنظیم دقیق مدل هوش مصنوعی برای رویدادها و لحظات کلیدی به موقع هستیم.” با تعداد زیادی ترکیب جدید از نام مکانها و فعالیتها، مهم است که وقتی مردم از Galaxy AI استفاده میکنند، زمینه هنوز روشن باشد.
چالش ها در جمع آوری داده های کارآمد
در حالی که شناخت انواع داده های مورد نیاز نیز مهم است، جمع آوری داده ها به خودی خود یک چالش است.
پیش از این، تیم SRJ از دادههای ثبت شده توسط انسان برای آموزش موتور تشخیص گفتار برای ترجمه زنده استفاده میکرد که منجر به جمعآوری دادههای کافی نشد.
Samsung Gauss، مدل زبان بزرگ (LLM) این شرکت، از اسکریپتها برای ساختار جملات با کلمات یا عباراتی استفاده میکند که با هر سناریو مرتبط هستند. دادههای جمعآوریشده با Samsung Gauss نه تنها توسط انسانها ثبت میشوند، بلکه توسط دادههای متن به گفتار (TTS) سنتز گفتار نیز تولید میشوند که از طریق آن منابع انسانی آخرین بررسی کیفیت را انجام میدهند. با استفاده از این روش، تیم شاهد بهبود چشمگیری در کارایی جمع آوری داده ها بوده است.
آکاساکو می گوید: “هر بار که مشکلی شناسایی و حل می شود، دقت تشخیص گفتار به طور قابل توجهی بهبود می یابد.” صرف نظر از اینکه مردم کجا هستند، هدف ما ارتباط افراد با یکدیگر است و ابزارهای مجهز به Galaxy AI ارتباطات سرگرم کننده و کارآمدتری را تضمین می کند.
[ad_2]
منبع