GPT 4o Launched: OpenAI ने अपना सबसे एडवांस AI टूल लॉन्च कर दिया है। ChatGPT बनाने वाली कंपनी का यह एडवांस एआई टूल इंसानों और मशीनों के बीच इंटरेक्शन के लिए लाया गया है। यह नया लैंग्वेज मॉडल रियल टाइम टेक्स्ट, ऑडियो और वीडियो पर बेस्ड है। चैटजीपीटी बनाने वाली कंपनी ने इस नए एडवांस AI टूल के जरिए Google जैसी दिग्गज टेक कंपनी की टेंशन बढ़ा दी है। आइए, जानते हैं इस नए AI टूल के बारे में...
क्या है GPT-4o?
OpenAI CTO मीरा मुराती ने इस नए AI टूल की घोषणा की है। यह टूल टेक्स्ट के अलावा ऑडियो, इमेज और विजुअल्स को आसानी से समझ सकता है और रियल टाइम रिप्लाई भी कर सकता है। GPT-4 के बाद कंपनी ने GPT-4o यूजर्स के लिए उतारा है, जिसमें o का मतलब Omni है। आसान भाषा में समझा जाए तो Omni का मतलब है सबकुछ यानी यह हर तरह के इंटरेक्शन को समझने की क्षमता रखता है।
मीरा मुराती ने इस एडवांस टूल को लॉन्च करते हुए कहा कि यह GPT यूजर्स के लिए फ्री है और पेड यूजर्स को इस टूल में कुछ ज्यादा मिलेगा। कंपनी के CEO Sam Altman ने कहा कि यह एक मल्टीमॉडल है, जो वॉइस, टेक्स्ट और इमेज के जरिए भी कमांड ले सकता है। तीनों तरह के कमांड लेने की वजह से GPT-4o खुद से भी कॉन्टेंट जेनरेट की क्षमता रखता है। इसका मतलब है कि इस टूल में सिर्फ टेक्स्ट ही नहीं, इमेज और ऑडियो के माध्यम से इंटरेक्ट किया जा सकता है।
कैसे करता है काम?
OpenAI ने इस टूल की लॉन्चिंग के दौरान एक डेमो दिखाया, जिसमें अगर यूजर्स GPT-4o में कैमरा को एक्सेस दिया तो यह आपके आस पास हो रही चीजों को देखकर बता देगा कि क्या हो रहा है? यह टूल आपके आस पास हो रही घटनाओं के आधार पर उससे जुड़े सवालों के आसानी से जबाब दे सकता है। डेमो के दौरान यह दिखाया गया कि GPT-4o को कैमरा एक्सेस देने के बाद आस पास मौजूद चीजों को देखकर गाना तुरंत कंपोज कर देता है।
इंसानों की तरह करता है बातचीत
GPT-4o की एक खास बात यह है कि यह इंसानों की तरह बातचीत कर सकता है। डेमो के दौरान यह दिखाया गया कि यह इंसानों और मशीन के बीच किस तरह इंटरेक्शन करने में सक्षम है। यही नहीं, यह इंसानों द्वारा किए गए मजाक को भी आसानी से समझ सकता है। कंपनी का दावा है कि यह टूल इंसानों से भी तेजी से रिस्पॉन्स कर सकता है।