OpenAI का आर्टिफिशियल इंटेलिजेंस टूल ChatGPT पूरी दुनिया में धूम मचा रहा है। इस चैटबॉट के लॉन्च होते ही दिग्गज टेक कंपनियों ने भी ऐसे ही जेनरेटिव एआई मॉडल पर काम करना शुरू कर दिया। ChatGPT के अगले वर्जन GPT-4 को ट्रेन करने के लिए OpenAI ने YouTube की मदद ली है। ChatGPT को किसी भी सवाल के जबाब देने के लिए सक्षम बनाया गया है। इसे बेहतर बनाने के लिए OpenAI ने लाखों यूट्यूब वीडियो की मदद ली है।
वीडियो का इस्तेमाल गैरकानूनी
सामने आ रही रिपोर्ट के मुताबिक, OpenAI ने ChatGPT-4 AI मॉडल को ट्रेन करने के लिए 10 लाख घंटे से भी ज्यादा का यूट्यूब वीडियो ट्रांसक्रिप्ट किया है। अमेरिकी लीडिंग मीडिया ऑर्गेनाइजेशन न्यूयॉर्क टाइम्स के मुताबिक, OpenAI को यह पता था कि इस तरह से वीडियो को ट्रांसक्राइब करना गैरकानूनी है, लेकिन वह इसे सही उपयोग मानता था। रिपोर्ट के मुताबिक, OpenAI के अध्यक्ष ग्रेग ब्रॉकमैन ने व्यक्तिगत रूप से यूट्यूब वीडियो को एकत्रित करने में शामिल रहे हैं।
हालांकि, OpenAI का कहना है कि उसे अपने जेनरेटिव AI टूल को ट्रेनिंग देने के लिए पब्लिकली उपलब्ध डेटा और नॉन-पब्लिक डेटा का इस्तेमाल किया है। किसी भी लार्ज लैंग्वेज मॉडल को हर पहलू की ट्रेनिंग दी जाती है, जिसके लिए किसी भी पब्लिकली उपलब्ध डेटा का इस्तेमाल किया जा सकता है। हालांकि, गूगल ने OpenAI के इस गतिविधि पर अपनी प्रतिक्रिया दी है।
गुप्त तरीके से डेटा का इस्तेमाल
Google ने कहा कि उसने OpenAI की गतिविधि में कई तरह की खामियां पाई हैं। टेक कंपनी ने बताया कि हमारी दोनों robots.txt फाइलें और सर्विस पॉलिसी YouTube कॉन्टेंट को अनधिकृत स्क्रैपिंग या डाउनलोड करने की अनुमति नहीं देती हैं। रिपोर्ट के मुताबिक, OpenAI ने अपने डेटा को स्क्रैप करके Google के वीडियो स्ट्रीमिंग प्लेटफॉर्म YouTube पर अपने AI मॉडल को प्रशिक्षित किया है। इसके लिए उसने यूट्यूब से गुप्त तरीके से डेटा का उपयोग किया है।