چت جی پی تی (Chat GPT) چیست؟
چت جی پی تی (Chat GPT) جدیدترین و جالبترین ابزار هوش مصنوعی از OpenAI است که بر روی GPT3 ساخته شده است. از نظر فنی یک نسخه تنظیم شده از GPT3 است، بنابراین GPT3.5 نیز نامیده می شود. چیزی که آن را به بهترین چیز در هوش مصنوعی تبدیل کرده است، تطبیق پذیری این ربات چت است. که می تواند به هر سوالی پاسخ دهد و توضیحات متنی ارائه دهد، و بیش از بازگرداندن آنچه در اینترنت موجود است.
پدرانه ها به نقل از فناوری برتر دیجیتال؛ می تواند متن جدیدی تولید کند. تقریباً مقاله های جدید می نویسد. بسیاری از برنامههای کاربردی جالب با استفاده از ChatGPT در چند هفته اخیر ساخته شدهاند که نشان میدهد چگونه میتوان از آن برای حل سؤالات کدنویسی استفاده کرد، نتایج جستجوی بهتری نسبت به Google ارائه کرد و مقالات دبیرستانی را در مورد موضوعات بدون شناسایی توسط ابزار سرقت ادبی نوشت.
ChatGPT چت جی پی تی یک ربات چت است که توسط شرکت OpenAI در نوامبر 2022 راه اندازی شد. این ربات بر روی مدل های زبان GPT-3 OpenAI ساخته شده است و به خوبی تنظیم شده است با رویکردی برای انتقال یادگیری که با هر دو روش یادگیری تحت نظارت و تقویتی هماهنگ است.
ChatGPT چت جی پی تی به عنوان یک نمونه اولیه در 30 نوامبر 2022 راه اندازی شد و به سرعت به دلیل پاسخ های دقیق و پاسخ های واضح خود در بسیاری از حوزه های دانش توجه را به خود جلب کرد. دقت واقعی نابرابر آن به عنوان یک اشکال مهم شناخته شد.پس از انتشار ChatGPT چت جی پی تی ارزش شرکت OpenAI به شدت رشد کرد.
به گفته شرکت OpenAI، ChatGPT چت جی پی تی به روش مکالمهای تعامل دارد. قالب گفتگو این امکان را برای ChatGPT فراهم می کند تا به سؤالات بعدی پاسخ دهد، اشتباهات خود را بپذیرد، مقدمات نادرست را به چالش بکشد و درخواست های نامناسب را رد کند.
متد و روش کار
فهرست مطالب
این مدل را با استفاده از یادگیری تقویتی از بازخورد انسانی (RLHF)، با استفاده از روشهای مشابه InstructGPT، اما با تفاوتهای جزئی در تنظیم مجموعه داده، آموزش داده اند. در ابتدا یک مدل اولیه را با استفاده از تنظیم دقیق نظارت شده آموزش دادند: مربیان هوش مصنوعی مکالماتی را ارائه کردند که در آن هر دو طرف بازی می کردند – کاربر و دستیار هوش مصنوعی. به مربیان اجازه داده شد به سورس کد مدل نوشته شده دسترسی داشته باشند تا به آنها کمک شود تا پاسخ های خود را بنویسند. در نهایت این مجموعه دیالوگ جدید را با مجموعه داده InstructGPT ترکیب گردید، که آن را به یک قالب گفتگو تبدیل کرد.
برای ایجاد یک مدل پاداش برای یادگیری تقویتی، نیاز به جمع آوری داده های مقایسه ای بود که شامل دو یا چند پاسخ مدل بود که بر اساس کیفیت رتبه بندی شده بودند. برای جمعآوری این دادهها، مکالماتی را که مربیان هوش مصنوعی با ربات چت داشتند، استفاده شدند و به طور تصادفی یک پیام مدل نوشته شده را انتخاب گردید، چندین تکمیل جایگزین را نمونه برداری کردند و از مربیان هوش مصنوعی خواسته شد آنها را رتبه بندی کنند. با استفاده از این مدلهای پاداش، توانستند مدل را با استفاده از Proximal Policy Optimization تنظیم کنند.
محدودیت ها
ChatGPT چت جی پی تی گاهی اوقات پاسخ هایی با صدای معقول اما نادرست یا بی معنی می نویسد. رفع این مشکل چالش برانگیز است، زیرا:
- (1) در طول آموزش RL، در حال حاضر هیچ منبع حقیقت وجود ندارد.
- (2) آموزش محتاط تر بودن مدل باعث می شود تا سوالاتی را که می تواند به درستی پاسخ دهد رد کند.
- (3) آموزش تحت نظارت مدل را گمراه می کند زیرا پاسخ ایده آل به آنچه که مدل می داند بستگی دارد تا آنچه نشان دهنده انسانی می داند.
ChatGPT چت جی پی تی به تغییراتی در عبارت ورودی یا تلاش چندین باره برای استفاده از همان دستور حساس است. به عنوان مثال، با در نظر گرفتن یک عبارت از یک سوال، مدل می تواند ادعا کند که پاسخ را نمی داند، اما با یک بیان مجدد جزئی، می تواند به درستی پاسخ دهد.
این مدل اغلب بیش از حد پرمخاطب است و از عبارات خاصی بیش از حد استفاده میکند، مانند تکرار اینکه مدل زبانی است که توسط OpenAI آموزش دیده است.
در حالت ایدهآل، زمانی که کاربر یک پرسش مبهم ارائه می کند مدل سؤالات روشنکنندهای میپرسد. در عوض، مدلهای فعلی معمولاً حدس میزنند که کاربر چه چیزی را در نظر داشته است.
در حالی که تلاش شده است این مدل درخواست های نامناسب را رد کند، گاهی اوقات به دستورالعمل های مضر پاسخ می دهد یا رفتار مغرضانه ای از خود نشان می دهد. شرکت OpenAI می گوید از Moderation API برای هشدار یا مسدود کردن انواع خاصی از محتوای ناامن استفاده کرده است، اما انتظار می رود نکات منفی و مثبت کاذب همچنان وجود داشته باشند.
پیامدهای امنیت سایبری
Check Point Research و دیگران اشاره کردند که ChatGPT قادر به نوشتن ایمیلهای فیشینگ و بدافزار است، بهویژه زمانی که با OpenAI Codex ترکیب شود.
به نظر مدیر عامل شرکت OpenAI خالق ChatGPT چت جی پی تی، هر نرم افزار پیشرفته می تواند یک خطر بزرگ امنیت سایبری باشد و ما می توانیم با پذیرش ریسک های آنها در دهه آینده به دانش AGI واقعی (هوش عمومی مصنوعی) دست پیدا کنیم.
مفاهیم برای آموزش
در مجله Nature، کریس استوکل-واکر خاطرنشان کرده که معلمان باید نگران استفاده دانش آموزان از ChatGPT برای برون سپاری نوشته های خود باشند، اما ارائه دهندگان آموزش برای تقویت تفکر انتقادی یا استدلال سازگار خواهند بود.
جوآنا استرن در وال استریت ژورنال تقلب در زبان انگلیسی دبیرستانی آمریکایی با این ابزار را اینگونه توصیف کرده است:
پروفسور دارن هیک از دانشگاه فورمن در مقاله ای که توسط یک دانشجو ارسال شده بود، متوجه “سبک” ChatGPT چت جی پی تی شده است. یک آشکارساز GPT آنلاین فاش کرده که مقاله به احتمال 99.9 درصد توسط رایانه تولید شده است، اما پروفسور هیک هیچ مدرک محکمی نداشت. با این حال، دانشجوی مورد نظر در هنگام مواجهه با سوال استفاده از ChatGPT چت جی پی تی آنرا تایید کرده است.
در همین راستا ادوارد تیان، یک دانشجوی ارشد در دانشگاه پرینستون، برنامهای به نام «GPTZero» ایجاد کرده که مشخص میکند چه مقدار از یک متن توسط هوش مصنوعی تولید شده است و به کمک آن میتوان تشخیص داد که آیا یک مقاله تولید انسان هست یا خیر.
از 4 ژانویه 2023، اداره آموزش شهر نیویورک دسترسی به ChatGPT چت جی پی تیرا از طریق اینترنت مدارس دولتی و دستگاههای خود محدود کرده است.
بهرحال درک اینکه چت جی پی تی (Chat GPT) خوب هست یا بد کار مشکلی به نظر می آید. ولی به طور کلی چت جی پی تی (Chat GPT) بزرگترین پیشرفت در هوش مصنوعی مکالمه از زمانی است که واتسون در چالش Jeopardy در سال 2012 برنده شد.