فناوری جدید در تشخیص متن های تولیدی چت بات ها
واترمارک دیجیتال گامی به سمت تشخیص متون هوش مصنوعی
به گزارش نیو وبلاگ، با عنایت به گسترش روز افزون استفاده از هوش مصنوعی در تولید محتوا، نگرانی هایی در رابطه با تشخیص متون واقعی از متون تولیدشده توسط ماشین ایجاد شده است. یکی از روش های پیشنهادی برای حل این مشکل، استفاده از واترمارک های دیجیتال است که می تواند به تشخیص و شناسایی محتوای مصنوعی کمک نماید.
به گزارش نیو وبلاگ به نقل از ایسنا، هوش مصنوعی با مدلهای زبانی پیشرفته ای که به کار می گیرد، می تواند متونی شبیه به نوشته های انسان تولید نماید. این مدلهای زبانی که به «مدل های زبانی بزرگ» یا LLM ها معروف هستند، در برنامه های مختلفی همچون چت بات ها، نوشتن خودکار و تولید محتوا به کار می روند.
با وجود مزایای این فناوری ها، شناسایی متون تولیدشده توسط ماشین و نسبت دادن آنها به منابع معتبر همواره یک چالش بوده است. این امر سبب شده تا نگرانی هایی در رابطه با دقت و اعتبار این متون در بین کارشناسان و کاربران مطرح شود.
از آنجایی که تفاوت ظاهری میان متون انسانی و مصنوعی کمتر شده است، احتیاج به روش هایی برای تشخیص این دو بیشتر از قبل احساس می شود. روش های مختلفی برای حل این مشکل پیشنهاد شده است، اما اغلب این شیوه ها به علت تاثیر منفی بر کیفیت متن یا احتیاج به توان محاسباتی بالا، در مقیاس های بزرگ کاربردی نیستند. به همین دلیل، محققان به دنبال چاره هایی هستند که هم کیفیت متن را حفظ کند و هم در تشخیص متون مصنوعی مؤثر باشد.
در این زمینه، گروهی از محققان به سرپرستی «سومانث داتاتری» و «پوشمیت کهولی» از Google DeepMind سیستمی به نام SynthID-Text را توسعه داده اند. این سیستم با استفاده از یک الگوریتم نمونه گیری پیشرفته، واترمارک هایی را به صورت نامحسوس به متون تولیدشده توسط هوش مصنوعی اضافه می کند.
این واترمارک ها در واقع امضاهای دیجیتالی هستند که می توانند با کمک نرم افزارهای خاص شناسایی شوند. این ابزار بگونه ای طراحی شده که دو مسیر متفاوت برای واترمارک گذاری عرضه می دهد: مسیری که کمی کیفیت متن را تغییر می دهد و مسیری که بدون تاثیر بر کیفیت، امضا را اضافه می کند.
در روش کار این پژوهش، الگوریتم نمونه گیری بگونه ای عمل می کند که انتخاب کلمات توسط هوش مصنوعی بشکلی تنظیم می شود که یک علامت خاص و قابل شناسایی در متن باقی بگذارد. این علامت با چشم انسان قابل مشاهده نیست، اما توسط نرم افزارهای تشخیص واترمارک به سادگی قابل ردیابی است. از این شیوه میتوان برای شناسایی هرگونه متنی که توسط مدلهای هوش مصنوعی ساخته شده بهره برد.
نتایج این پژوهش که در نشریه معتبر Nature انتشار یافته اند، نشان می دهند که سیستم SynthID-Text در مقایسه با روش های موجود، عملکرد بهتری در تشخیص متون تولیدشده توسط هوش مصنوعی دارد.
همچنین، بررسی کیفیت متون واترمارک گذاری شده نشان داده است که در حالت غیرتغییری (non-distortionary)، کیفیت متن حفظ می شود و تغییری در آن احساس نمی گردد. از دیگر نتایج این پژوهش میتوان به این نکته اشاره نمود که این واترمارک ها تاثیر چندانی بر میزان توان محاسباتی مورد نیاز برای اجرای مدلها ندارند.
علاوه بر این، محققان تاکید دارند که باآنکه این واترمارک ها امکان دارد با تغییرات جزئی در متن از بین بروند، اما این ابزار می تواند بعنوان گامی مهم در جهت افزایش شفافیت و مسئولیت پذیری در استفاده از مدلهای زبانی هوش مصنوعی مورد استفاده قرار گیرد. این امر بخصوص در مواردی که متن های تولیدشده باید از اعتبار بالایی برخوردار باشند، اهمیت دارد.
در آخر بایستی اشاره نمود که این پژوهش، قدمی مهم در جهت افزایش امنیت و شفافیت استفاده از هوش مصنوعی در فرایندهای تولید محتوا به حساب می آید.
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب