ChatGPT: टेक्नोलॉजी की दुनिया में क्रांति! OpenAI (OpenAI) ने अपने प्रसिद्ध AI मॉडल ChatGPT (ChatGPT) में एक बड़ा बदलाव पेश किया है। अब, ChatGPT केवल आपके सवालों के जवाब देने या आपकी मदद करने तक सीमित नहीं रहेगा, बल्कि यह अपने खुद के वर्चुअल कंप्यूटर (Own Virtual Computer) का उपयोग करके जटिल कार्यों (Complex Tasks) को शुरू से अंत तक स्वयं कर सकेगा। यह नई क्षमता, जिसे ‘एजेंट मोड’ (Agent Mode) कहा जा रहा है, आपके अनुसंधान (Research) और कार्य निष्पादन (Action) के बीच की खाई को पाट देगी।
ChatGPT Agent: यह कैसे काम करता है?
यह नया एजेंटिक सिस्टम (Agentic System) तीन शक्तिशाली क्षमताओं को जोड़ता है:
- ऑपरेटर की क्षमता (Operator’s Ability): वेबसाइटों के साथ इंटरैक्ट करना।
- डीप रिसर्च की विशेषज्ञता (Deep Research’s Skill): जानकारी को संश्लेषित (Synthesize) करना।
- ChatGPT की बुद्धिमत्ता और संवाद प्रवाह (Intelligence and Conversational Fluency): यह आपको अधिक सटीक और उपयोगी परिणाम प्रदान करता है।
ChatGPT Agent इन कार्यों को अपने स्वयं के वर्चुअल कंप्यूटर का उपयोग करके अंजाम देगा, तर्क (Reasoning) और क्रिया (Action) के बीच सहजता से परिवर्तित होकर। आप बस अपने निर्देशों (Instructions) का पालन करने के लिए इसे कहें, और यह जटिल वर्कफ़्लो (Complex Workflows) को पूरा करेगा।
उपयोगकर्ता का नियंत्रण सर्वोपरि:
सबसे महत्वपूर्ण बात यह है कि आप हमेशा नियंत्रण (User Control) में रहेंगे। ChatGPT कोई भी महत्वपूर्ण कदम उठाने से पहले आपकी अनुमति (Permission) मांगेगा। आप किसी भी बिंदु पर कार्य को बाधित (Interrupt Tasks) कर सकते हैं, ब्राउज़र (Browser) का नियंत्रण ले सकते हैं, या किसी भी समय कार्य को रोक (Stop Tasks) सकते हैं। यह सुनिश्चित करता है कि AI आपके लक्ष्यों के साथ संरेखित (Aligned) रहे।
प्रो, प्लस और टीम उपयोगकर्ताओं के लिए उपलब्ध:
आज से, प्रो (Pro), प्लस (Plus), और टीम (Team) उपयोगकर्ताओं के लिए ये नई एजेंटिक क्षमताएँ सक्षम हो जाएंगी। आप इसे किसी भी बातचीत के दौरान कंपोजर से टूल्स ड्रॉपडाउन (Tools Dropdown from the Composer) से ‘एजेंट मोड’ (Agent Mode) का चयन करके सक्रिय कर सकते हैं।
ऑपरेटर और डीप रिसर्च का एकीकृत विकास:
पहले, ऑपरेटर वेबसाइटों के साथ इंटरैक्ट कर सकता था (स्क्रॉल करना, क्लिक करना, टाइप करना), जबकि डीप रिसर्च जानकारी का विश्लेषण और सारांश बनाने में उत्कृष्ट था। लेकिन ये दोनों अलग-अलग स्थितियों में बेहतर काम करते थे। ऑपरेटर विश्लेषण या विस्तृत रिपोर्ट नहीं लिख सकता था, और डीप रिसर्च वेब से इंटरैक्ट करके परिणामों को बेहतर नहीं बना सकता था। इस समस्या को दूर करते हुए, ChatGPT Agent ने दोनों की शक्तियों को मिलाकर नए और अप्रत्याशित (Entirely New Capabilities) क्षमताएं अनलॉक की हैं। अब यह सक्रिय रूप से वेबसाइटों से इंटरैक्ट कर सकता है – क्लिक करना, फ़िल्टर करना, और अधिक सटीक, कुशल परिणाम एकत्र करना। आप एक साधारण बातचीत से सीधे कार्रवाई (Actions) का अनुरोध कर सकते हैं, जो इसे अविश्वसनीय रूप से बहुमुखी (Versatile) बनाता है।
एजेंट जो आपके साथ काम करता है:
ChatGPT Agent को टूल्स (Tools) के एक सुइट से सुसज्जित किया गया है:
- एक विज़ुअल ब्राउज़र (Visual Browser): जो एक ग्राफिकल-यूजर इंटरफेस के माध्यम से वेब के साथ इंटरैक्ट करता है।
- एक टेक्स्ट-आधारित ब्राउज़र (Text-based Browser): सरल तर्क-आधारित वेब प्रश्नों के लिए।
- एक टर्मिनल (Terminal): कोड निष्पादित करने के लिए।
- सीधा API एक्सेस (Direct API Access): विशिष्ट सेवाओं से जुड़ने के लिए।
इसके अतिरिक्त, ChatGPT Agent कनेक्टर्स (Connectors) का भी उपयोग कर सकता है, जो इसे Gmail और GitHub जैसे ऐप्स से जोड़ता है। यह आपके प्रॉम्प्ट्स (Prompts) के लिए प्रासंगिक जानकारी ढूंढ सकता है और उसका उपयोग अपने उत्तरों में कर सकता है। आप किसी भी वेबसाइट पर ब्राउज़र को टेकओवर (Take Over the Browser) करके लॉगिन भी कर सकते हैं, जिससे यह अपने शोध और कार्य निष्पादन दोनों में गहराई और व्यापकता हासिल कर सके। यह सबसे कुशल मार्ग (Optimal Path) चुनने की क्षमता रखता है।
एजेंट के कार्यप्रवाह (Workflows) और अनुकूलन क्षमता:
यह सब ChatGPT Agent के स्वयं के वर्चुअल कंप्यूटर का उपयोग करके किया जाता है, जो कार्य के लिए आवश्यक संदर्भ को बनाए रखता है, भले ही कई उपकरणों का उपयोग किया जाए। यह मॉडल टेक्स्ट-आधारित ब्राउज़र का उपयोग करके पृष्ठ खोलने, वेब से फ़ाइल डाउनलोड करने, टर्मिनल में कमांड चलाकर उसे हेरफेर करने और आउटपुट को विज़ुअल ब्राउज़र में देखने का चयन कर सकता है। मॉडल गति, सटीकता और दक्षता (Speed, Accuracy, and Efficiency) के साथ कार्यों को पूरा करने के लिए अपने दृष्टिकोण को अनुकूलित (Adapts its Approach) करता है।
इंटरैक्टिव और सहयोगी (Iterative, Collaborative Workflows):
ChatGPT Agent को पुनरावृत्तीय (Iterative) और सहयोगी (Collaborative) वर्कफ़्लो के लिए डिज़ाइन किया गया है, जो पिछले मॉडलों की तुलना में अधिक इंटरैक्टिव और लचीला (Interactive and Flexible) है। जैसे ही ChatGPT काम करता है, आप अपने निर्देशों को स्पष्ट करने (Clarify Your Instructions), इसे वांछित परिणामों की ओर निर्देशित करने, या कार्य को पूरी तरह से बदलने के लिए किसी भी समय बाधित (Interrupt at any Point) कर सकते हैं। यह वहीं से उठाएगा जहाँ उसने छोड़ा था, नई जानकारी के साथ, लेकिन पिछली प्रगति को खोए बिना। इसी तरह, ChatGPT स्वयं कार्य को आपके लक्ष्यों के साथ संरेखित करने के लिए प्रोएक्टिवली (Proactively) आपसे अतिरिक्त विवरण मांग सकता है। यदि कोई कार्य उम्मीद से अधिक समय लेता है या फंसा हुआ लगता है, तो आप उसे रोक (Pause) सकते हैं, प्रगति सारांश (Progress Summary) के लिए पूछ सकते हैं, या उसे पूरी तरह से रोक (Stop) सकते हैं और आंशिक परिणाम (Partial Results) प्राप्त कर सकते हैं। यदि आपके पास अपने फोन पर ChatGPT ऐप है, तो यह कार्य पूरा होने पर आपको एक सूचना (Notification) भेजेगा।
वास्तविक दुनिया में उपयोगिता का विस्तार:
ये एकीकृत एजेंटिक क्षमताएं रोजमर्रा और पेशेवर दोनों संदर्भों में ChatGPT की उपयोगिता को काफी बढ़ाती हैं। काम पर, आप दोहराए जाने वाले कार्यों को स्वचालित (Automate Repetitive Tasks) कर सकते हैं, जैसे स्क्रीनशॉट या डैशबोर्ड को संपादन योग्य वेक्टर तत्वों (Editable Vector Elements) में परिवर्तित करना, मीटिंग को पुनर्व्यवस्थित करना, ऑफसाइट्स की योजना बनाना और बुक करना, और वित्तीय डेटा के साथ स्प्रेडशीट अपडेट करना। व्यक्तिगत जीवन में, आप इसका उपयोग यात्रा यात्रा कार्यक्रमों (Travel Itineraries) की योजना बनाने और बुक करने, संपूर्ण रात्रिभोज पार्टियों को डिजाइन और बुक करने, या विशेषज्ञों को ढूंढने और अपॉइंटमेंट शेड्यूल करने के लिए कर सकते हैं।
बेहतर प्रदर्शन और दक्षता:
मॉडल की उन्नत क्षमताएं (Elevated Capabilities) वेब ब्राउज़िंग और वास्तविक दुनिया के कार्यों को पूरा करने की क्षमताओं को मापने वाले अत्याधुनिक (State-of-the-art – SOTA) मूल्यांकनों में परिलक्षित होती हैं।
‘ह्यूमनिटीज लास्ट एग्जाम’ (Humanity’s Last Exam) जैसे मूल्यांकन पर, जो विशेषज्ञ-स्तर के प्रश्नों पर AI के प्रदर्शन को मापता है, ChatGPT Agent 41.6 का नया पास@1 SOTA स्कोर करता है। चूंकि एजेंट गतिशील रूप से योजना बनाता है और अपने स्वयं के उपकरणों का चयन करता है, इसलिए वह विभिन्न रन में एक ही कार्य को अलग-अलग तरीकों से कर सकता है। जब हमने इसे सरल पैरलल रोलआउट रणनीति के साथ स्केल किया – एक बार में आठ प्रयास चलाकर और उच्चतम आत्म-रिपोर्टेड आत्मविश्वास वाले को चुनकर – तो एजेंट का HLE स्कोर 44.4 तक बढ़ जाता है।
फ्रंटियरमैथ (FrontierMath) सबसे कठिन ज्ञात गणित बेंचमार्क है, जिसमें उपन्यास, अप्रकाशित समस्याएं शामिल हैं जिन्हें हल करने में विशेषज्ञों को अक्सर घंटों या दिन लगते हैं। टर्मिनल (Terminal) के माध्यम से कोड निष्पादन (Code Execution) जैसे उपकरणों के उपयोग के साथ, ChatGPT Agent 27.4% सटीकता तक पहुंचता है, जो पिछले मॉडलों से काफी बेहतर प्रदर्शन करता है।
हमने जटिल वास्तविक दुनिया के कार्यों से प्रेरित बेंचमार्क का उपयोग करके मॉडल का मूल्यांकन भी किया। जटिल, आर्थिक रूप से मूल्यवान ज्ञान-कार्य कार्यों पर मॉडल प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किए गए एक आंतरिक बेंचमार्क पर, ChatGPT Agent का आउटपुट लगभग आधे मामलों में मनुष्यों की तुलना में तुलनीय या बेहतर है, जबकि o3 और o4-mini से काफी बेहतर प्रदर्शन करता है। मॉडल आउटपुट को विशेषज्ञों द्वारा प्रत्येक क्षेत्र में शीर्ष प्रदर्शनकर्ताओं द्वारा बनाए गए उच्च-गुणवत्ता वाले मानव आधार रेखाओं के विरुद्ध आंका जाता है।
DSBench पर प्रदर्शन:
DSBench पर, जो यथार्थवादी डेटा विज्ञान कार्यों पर एजेंटों के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है, जिसमें डेटा विश्लेषण और मॉडलिंग (Data Analysis and Modeling) शामिल है, ChatGPT Agent मानव प्रदर्शन को महत्वपूर्ण मार्जिन से पार करता है।
स्प्रेडशीट बेंच (SpreadsheetBench) पर प्रभुत्व:
SpreadsheetBench पर, जो वास्तविक दुनिया के परिदृश्यों से प्राप्त स्प्रेडशीट को संपादित करने की मॉडल की क्षमता का मूल्यांकन करता है, ChatGPT Agent मौजूदा मॉडलों से महत्वपूर्ण मार्जिन से बेहतर प्रदर्शन करता है। स्प्रेडशीट को सीधे संपादित करने की क्षमता दिए जाने पर, ChatGPT Agent Copilot in Excel के 20.0% की तुलना में 45.5% का स्कोर करता है।
सुरक्षा और जोखिम प्रबंधन:
यह रिलीज़ AI को वेब पर कार्रवाई करने के लिए कहने की पहली बार है। यह नए जोखिम पेश करता है, विशेष रूप से क्योंकि ChatGPT Agent आपके डेटा के साथ सीधे काम कर सकता है, चाहे वह कनेक्टर्स (Connectors) के माध्यम से एक्सेस की गई जानकारी हो या उन वेबसाइटों पर जहाँ आपने इसे टेकओवर मोड (Takeover Mode) के माध्यम से लॉग इन किया हो। हमने ऑपरेटर के शोध पूर्वावलोकन (Operator’s Research Preview) से मजबूत नियंत्रणों को मजबूत किया है और संवेदनशील जानकारी को लाइव वेब पर संभालना, व्यापक उपयोगकर्ता पहुंच, और (सीमित) टर्मिनल नेटवर्क एक्सेस जैसी चुनौतियों के लिए सुरक्षा उपाय (Safeguards) जोड़े हैं। यद्यपि ये शमन उपाय (Mitigations) जोखिम को काफी कम करते हैं, ChatGPT Agent के विस्तारित उपकरण और व्यापक उपयोगकर्ता पहुंच का मतलब है कि इसका समग्र जोखिम प्रोफाइल अधिक है।
प्रॉम्प्ट इंजेक्शन के विरुद्ध सुरक्षा:
हमने प्रॉम्प्ट इंजेक्शन (Prompt Injection) के खिलाफ एजेंट को प्रशिक्षित और परीक्षण किया है, जो आम तौर पर एजेंटिक सिस्टम के लिए एक जोखिम है, और तदनुसार अधिक व्यापक शमन तैयार किए हैं। प्रॉम्प्ट इंजेक्शन दुर्भावनापूर्ण निर्देशों के माध्यम से इसके व्यवहार को हेरफेर करने के प्रयास हैं जो ChatGPT Agent कार्य पूरा करते समय वेब पर सामना कर सकता है। उदाहरण के लिए, वेबपेज में छिपी एक दुर्भावनापूर्ण प्रॉम्प्ट, जैसे कि अदृश्य तत्व या मेटाडेटा में, एजेंट को अनपेक्षित कार्यों को करने के लिए बरगला सकती है, जैसे कि कनेक्टर से निजी डेटा को हमलावर के साथ साझा करना, या उपयोगकर्ता द्वारा लॉग इन की गई साइट पर हानिकारक कार्रवाई करना। चूँकि ChatGPT Agent प्रत्यक्ष कार्रवाई कर सकता है, सफल हमलों का अधिक प्रभाव हो सकता है और उच्च जोखिम हो सकता है।
हमने प्रॉम्प्ट इंजेक्शन की पहचान करने और उसका विरोध करने के लिए एजेंट को प्रशिक्षित और परीक्षण किया है, साथ ही प्रॉम्प्ट इंजेक्शन हमलों का तेजी से पता लगाने और प्रतिक्रिया देने के लिए निगरानी (Monitoring) का भी उपयोग किया है। महत्वपूर्ण कार्रवाइयों से पहले स्पष्ट उपयोगकर्ता पुष्टि (Explicit User Confirmation) की आवश्यकता इन हमलों से होने वाले नुकसान के जोखिम को और कम करती है, और उपयोगकर्ता अपनी सुविधानुसार टेकओवर या पॉज़ (Take Over or Pause) करके कार्यों में हस्तक्षेप कर सकते हैं। उपयोगकर्ताओं को यह तय करते समय इन ट्रेड-ऑफ (Tradeoffs) का मूल्यांकन करना चाहिए कि एजेंट को कौन सी जानकारी प्रदान की जाए, साथ ही कनेक्टर्स को अक्षम (Disable Connectors) करके जोखिमों के जोखिम को कम करने के लिए कदम उठाना चाहिए जब वे किसी कार्य के लिए आवश्यक न हों।
मॉडल की गलतियों को कम करने के उपाय:
हमने मॉडल की गलतियों (Model Mistakes) को कम करने के लिए भी अतिरिक्त नियंत्रण (Additional Controls) लागू किए हैं, विशेष रूप से जब मॉडल वास्तविक दुनिया को प्रभावित करने वाले कार्य कर सकता है:
- स्पष्ट उपयोगकर्ता पुष्टि: ChatGPT को वास्तविक दुनिया के परिणामों वाली कार्रवाई करने से पहले आपकी अनुमति मांगने के लिए प्रशिक्षित किया गया है, जैसे कि खरीदारी करना।
- सक्रिय पर्यवेक्षण (“वॉच मोड”): ईमेल भेजने जैसे कुछ महत्वपूर्ण कार्यों के लिए आपके सक्रिय पर्यवेक्षण (Active Oversight) की आवश्यकता होती है।
- प्रोएक्टिव जोखिम शमन: ChatGPT को उच्च-जोखिम वाले कार्यों जैसे बैंक हस्तांतरण (Bank Transfers) से इनकार करने के लिए प्रशिक्षित किया गया है।
डेटा एक्सेस पर नियंत्रण:
अंत में, हमने मॉडल द्वारा एक्सेस किए जाने वाले डेटा को सीमित करने के लिए अतिरिक्त नियंत्रण लागू किए हैं:
- गोपनीयता नियंत्रण (Privacy Controls): ChatGPT की सेटिंग्स में एक क्लिक से, आप सभी ब्राउज़िंग डेटा (All Browsing Data) को हटा सकते हैं और सभी सक्रिय वेबसाइट सत्रों से तुरंत लॉग आउट (Log Out) कर सकते हैं। अन्यथा, कुकीज़ प्रत्येक देखी गई वेबसाइट की कुकी नीतियों (Cookie Policies) के आधार पर बनी रहती हैं, जो साइटों पर बार-बार जाने को अधिक कुशल बना सकती हैं।
- सुरक्षित ब्राउज़र टेकओवर मोड (Secure Browser Takeover Mode): जब आप ChatGPT के ब्राउज़र (“टेकओवर मोड”) का उपयोग करके वेब के साथ इंटरैक्ट करते हैं, तो आपके इनपुट निजी (Private) रहते हैं। ChatGPT इन सत्रों के दौरान आपके द्वारा दर्ज किए गए किसी भी डेटा, जैसे पासवर्ड, को एकत्र या संग्रहीत नहीं करता है क्योंकि मॉडल को इसकी आवश्यकता नहीं है, और यह सुरक्षित है यदि यह कभी इसे न देखे।
जैविक जोखिमों के लिए हमारा सबसे मजबूत सुरक्षा ढाँचा:
मॉडल की बढ़ी हुई क्षमताओं के साथ, हमने ChatGPT Agent को ‘हाई बायोलॉजिकल और केमिकल कैपेबिलिटीज’ (High Biological and Chemical Capabilities) के रूप में मानने का फैसला किया है, जो हमारे ‘तैयारी फ्रेमवर्क’ (Preparedness Framework) के तहत सक्रिय हो रहा है। यद्यपि हमारे पास यह निर्विवाद प्रमाण नहीं है कि मॉडल एक नौसिखिए को गंभीर जैविक नुकसान (Severe Biological Harm) बनाने में सार्थक रूप से मदद कर सकता है – हमारी हाई कैपेबिलिटी की दहलीज (Threshold for High Capability) – हम सावधानी बरत रहे हैं और आवश्यक सुरक्षा उपाय अभी लागू कर रहे हैं। इसके परिणामस्वरूप, इस मॉडल में **जीव विज्ञान के लिए बढ़ी हुई सुरक्षा उपायों के साथ हमारा सबसे व्यापक सुरक्षा स्टैक (Most Comprehensive Safety Stack) है: व्यापक थ्रेट मॉडलिंग (Comprehensive Threat Modeling), डुअल-यूज रिफ्यूजल ट्रेनिंग (Dual-use Refusal Training), ऑल-वेज-ऑन क्लासिफायर्स और रीजनिंग मॉनिटर (Always-on Classifiers and Reasoning Monitors), और स्पष्ट प्रवर्तन पाइपलाइन (Clear Enforcement Pipelines)।
पारिस्थितिकी तंत्र के साथ सहयोग:
ChatGPT Agent को सुरक्षित करने के हमारे काम के अलावा, हम जानते हैं कि स्तरित बायोसेफ्टी (Layered Biosafety) तब सबसे अच्छा काम करती है जब सुरक्षा उपाय किसी एक प्रयोगशाला से परे होते हैं, इसलिए हम पारिस्थितिकी तंत्र में सहयोग (Collaborate Across the Ecosystem) करके रक्षा को मजबूत करते हैं। पहले दिन से, हमने बाहरी बायोसिक्योरिटी विशेषज्ञों (Outside Biosecurity Experts), सुरक्षा संस्थानों (Safety Institutes), और अकादमिक शोधकर्ताओं (Academic Researchers) के साथ मिलकर अपने थ्रेट मॉडल, आकलन और नीतियों को आकार दिया है। जीव विज्ञान-प्रशिक्षित समीक्षकों ने हमारे मूल्यांकन डेटा (Evaluation Data) को मान्य किया है, और डोमेन-विशेषज्ञ रेड टीमर्स (Domain-expert Red Teamers) ने यथार्थवादी परिदृश्यों में सुरक्षा उपायों का स्ट्रेस-टेस्ट किया है। इस महीने की शुरुआत में हमने सरकार, शिक्षा जगत, राष्ट्रीय प्रयोगशालाओं और गैर-सरकारी संगठनों के विशेषज्ञों के साथ एक बायो-डिफेंस वर्कशॉप (Biodefense Workshop) का आयोजन किया ताकि सहयोग में तेजी लाई जा सके और AI द्वारा संचालित बायो-डिफेंस अनुसंधान को आगे बढ़ाया जा सके। हम उभरते जोखिमों से आगे रहने के लिए वैश्विक स्तर पर साझेदारी करते रहेंगे।
हमारे एकीकृत एजेंटिक मॉडल के लिए मजबूत सुरक्षा दृष्टिकोण के बारे में अधिक जानने के लिए, सिस्टम कार्ड (System Card) देखें। हम एक बग बाउंटी प्रोग्राम (Bug Bounty Program) भी लॉन्च कर रहे हैं ताकि हम वास्तविक दुनिया के जोखिमों को ढूंढ सकें और उन्हें ठीक कर सकें।
उपलब्धता (Availability):
ChatGPT Agent आज से प्रो, प्लस और टीम उपयोगकर्ताओं के लिए रोल आउट होना शुरू हो गया है; प्रो उपयोगकर्ताओं को दिन के अंत तक एक्सेस मिलेगा, जबकि प्लस और टीम उपयोगकर्ताओं को आने वाले कुछ दिनों में एक्सेस मिलेगा। एंटरप्राइज़ और शिक्षा उपयोगकर्ता आने वाले हफ्तों में एक्सेस प्राप्त करेंगे। प्रो उपयोगकर्ताओं के पास प्रति माह 400 संदेशों का कोटा है, जबकि अन्य भुगतान उपयोगकर्ताओं को मासिक 40 संदेश मिलते हैं, साथ ही लचीले क्रेडिट-आधारित विकल्पों (Flexible Credit-based Options) के माध्यम से अतिरिक्त उपयोग उपलब्ध है।
हम अभी भी यूरोपीय आर्थिक क्षेत्र (European Economic Area) और स्विट्जरलैंड (Switzerland) के लिए पहुंच सक्षम करने पर काम कर रहे हैं।
Operator रिसर्च प्रीव्यू:
ऑपरेटर रिसर्च प्रीव्यू साइट अगले कुछ हफ्तों तक कार्यशील रहेगी, जिसके बाद उसे बंद कर दिया जाएगा। डीप रिसर्च ChatGPT Agent की क्षमताओं का हिस्सा है। यदि आप मूल डीप रिसर्च सुविधा को पसंद करते हैं – जिसमें अधिक विस्तृत, गहन प्रतिक्रियाएँ प्रदान करने में अधिक समय लग सकता है – तो आप इसे संदेश कंपोजर में ड्रॉपडाउन से “डीप रिसर्च” का चयन करके एक्सेस कर सकते हैं।
सीमाएँ और आगे की राह:
ChatGPT Agent अभी भी अपने शुरुआती चरणों (Early Stages) में है। यह जटिल कार्यों की एक श्रृंखला को संभालने में सक्षम है, लेकिन यह अभी भी गलतियां कर सकता है।
जबकि हम स्लाइड शो बनाने की इसकी क्षमता में महत्वपूर्ण क्षमता देखते हैं, यह कार्यक्षमता वर्तमान में बीटा (Beta) में है। इस समय, आउटपुट कभी-कभी अतिसहज (Rudimentary) लगते हैं, खासकर जब बिना मौजूदा दस्तावेज़ के शुरू करते हैं। हमने मॉडल की शुरुआती क्षमताओं को ऐसे आर्टिफैक्ट्स (Artifacts) उत्पन्न करने पर केंद्रित किया है जो प्रस्तुतियों के लिए उपयुक्त प्रारूप और प्रवाह में जानकारी व्यवस्थित करते हैं, जिसमें टेक्स्ट, चार्ट, चित्र और आकार जैसे तत्व शामिल हैं जो निर्यात के बाद आसानी से संपादन योग्य (Easily Editable) होते हैं, संरचना और लचीलेपन का अनुकूलन करते हुए। वर्तमान में, व्यूअर में स्लाइड्स और निर्यातित पावरपॉइंट के बीच कभी-कभी विसंगतियां भी होती हैं जिन्हें हम कम करने के लिए काम कर रहे हैं। इसके अतिरिक्त, हालांकि आप अब ChatGPT को संपादित करने या टेम्पलेट के रूप में उपयोग करने के लिए एक मौजूदा स्प्रेडशीट अपलोड (Upload an Existing Spreadsheet) कर सकते हैं, यह कार्यक्षमता अभी स्लाइड शो के लिए उपलब्ध नहीं है। हम ChatGPT की स्लाइड शो निर्माण क्षमताओं को और अधिक परिष्कृत, परिष्कृत आउटपुट, व्यापक क्षमताओं और बेहतर स्वरूपण के साथ उत्पादन करने के लिए अगली पुनरावृत्ति को प्रशिक्षित कर रहे हैं।
कुल मिलाकर, हम ChatGPT Agent की दक्षता, गहराई और बहुमुखी प्रतिभा (Efficiency, Depth, and Versatility) में निरंतर सुधार की उम्मीद करते हैं, जिसमें अधिक निर्बाध इंटरैक्शन (Seamless Interactions) शामिल हैं, क्योंकि हम उपयोगकर्ता से आवश्यक पर्यवेक्षण की मात्रा (Amount of Oversight) को समायोजित करना जारी रखेंगे ताकि इसे अधिक उपयोगी बनाया जा सके जबकि यह सुनिश्चित हो सके कि इसका उपयोग सुरक्षित हो।