Connect with us

AI & Automation

Tencent ने Hunyuanportrait, एक ओपन-सोर्स AI मॉडल को एनिमेटिंग पोर्ट्रेट के लिए लॉन्च किया

Published

on

Tencent ने मंगलवार को एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किया जो अभी भी चित्र छवियों को चेतन कर सकता है। डब्ड हन्युआनपोर्ट्रेट, लार्ज लैंग्वेज मॉडल (एलएलएम) प्रसार आर्किटेक्चर पर आधारित है, और एक संदर्भ छवि और एक मार्गदर्शक वीडियो के आधार पर यथार्थवादी एनीमेशन के साथ वीडियो उत्पन्न कर सकता है। परियोजना के पीछे के शोधकर्ताओं ने इस बात पर प्रकाश डाला कि मॉडल चेहरे के डेटा और स्थानिक आंदोलनों दोनों को सटीक रूप से संदर्भ छवि में सिंक करने के लिए कैप्चर कर सकता है। Tencent ने अब Hunyuanportrait AI मॉडल को खोल दिया है, और इसे लोकप्रिय रिपॉजिटरी से स्थानीय रूप से डाउनलोड और चलाया जा सकता है।

Tencent का Hunyuanportratit अभी भी जीवन के लिए चित्र ला सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), टेन्सेंट हुनयुआन के आधिकारिक हैंडल ने घोषणा की कि हुनुअनपोर्ट्रेट मॉडल अब खुले समुदाय के लिए उपलब्ध है। AI मॉडल को Tencent से डाउनलोड किया जा सकता है GitHub और गले का चेहरा लिस्टिंग। इसके अतिरिक्त, एक प्री-प्रिंट कागज़ मॉडल का विस्तार करना भी Arxiv पर होस्ट किया जा रहा है। विशेष रूप से, AI मॉडल अकादमिक और अनुसंधान-आधारित उपयोग के मामलों के लिए उपलब्ध है, लेकिन व्यावसायिक उपयोग के लिए नहीं।

Hunyuanportrait एक संदर्भ छवि और ड्राइविंग वीडियो का उपयोग करके लाइफलाइक एनिमेटेड वीडियो उत्पन्न कर सकता है। यह चेहरे के डेटा को कैप्चर करता है और वीडियो से सिर पोज देता है और उन्हें स्टिल पोर्ट्रेट इमेज पर प्रक्षेपित करता है। कंपनी का दावा है कि आंदोलन का सिंक सटीक है, और यहां तक ​​कि सूक्ष्म चेहरे की अभिव्यक्ति में परिवर्तन भी दोहराया जाता है।

हुनयुआनपोरिट्रैट आर्किटेक्चर हुनुअनपोरट्रेट

हुन्युआनपोरिट्रैट आर्किटेक्चर
फोटो क्रेडिट: tencent

अपने मॉडल पर पेजTencent शोधकर्ताओं ने Hunyuanportrait की वास्तुकला को विस्तृत किया। यह एक स्थिति नियंत्रण एनकोडर के साथ स्थिर प्रसार मॉडल की वास्तुकला पर बनाया गया है। ये पूर्व-प्रशिक्षित एनकोडर वीडियो में गति की जानकारी और पहचान को कम करते हैं। डेटा को नियंत्रण संकेतों के रूप में कैप्चर किया जाता है, जो तब एक डेनोइजिंग UNET के माध्यम से स्टिल पोर्ट्रेट में इंजेक्ट किया जाता है। कंपनी का दावा है कि यह दोनों स्थानिक सटीकता के साथ -साथ आउटपुट में अस्थायी स्थिरता दोनों लाता है।

Tencent का दावा है कि AI मॉडल लौकिक स्थिरता और नियंत्रणीयता के मापदंडों पर मौजूदा ओपन-सोर्स विकल्पों को बेहतर बनाता है, लेकिन इन मैट्रिक्स को स्वतंत्र रूप से सत्यापित नहीं किया गया है।

इस तरह के मॉडल फिल्म निर्माण और एनीमेशन उद्योगों में उपयोगी हो सकते हैं। परंपरागत रूप से, एनिमेटर मैन्युअल रूप से कीफ्रेम फेशियल एक्सप्रेशन या एरेस्टिकली मोशन कैप्चर सिस्टम का उपयोग करता है ताकि वर्णों को वास्तविक रूप से चेतन किया जा सके। Hunyuanportrait जैसे मॉडल उन्हें केवल चरित्र डिजाइन और लक्ष्य आंदोलनों और चेहरे के भावों को खिलाने की अनुमति देंगे, और यह आउटपुट उत्पन्न करने में सक्षम होगा। इस तरह के एलएलएम में उच्च गुणवत्ता वाले एनीमेशन को छोटे स्टूडियो और स्वतंत्र रचनाकारों के लिए सुलभ बनाने की क्षमता है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


Realme Neo 7 टर्बो के साथ Mediatek Dimentess


Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

स्प्रेडशीट उत्पन्न करने, रिपोर्ट बनाने और वेब ऐप बनाने की क्षमता के साथ लॉन्च किए गए पेरप्लेक्सिटी लैब्स

Published

on

By

Perplexity Labs, एक नई कृत्रिम बुद्धिमत्ता (AI) फीचर पेरप्लेक्सिटी प्लेटफॉर्म के भीतर, गुरुवार को पेश किया गया था। कंपनी का कहना है कि नया मोड टेक्स्ट प्रॉम्प्ट को पूर्ण प्रोजेक्ट्स जैसे रिपोर्ट, स्प्रेडशीट और यहां तक ​​कि सरल वेब ऐप्स में बदल सकता है। Perplexity Labs उन जटिल कार्यों को करने के लिए गहरी वेब ब्राउज़िंग और कोड निष्पादन का उपयोग करता है जो प्लेटफ़ॉर्म के दायरे से परे थे। नई सुविधा सैन फ्रांसिस्को स्थित एआई फर्म द्वारा आईओएस के लिए पेरप्लेक्सिटी असिस्टेंट जारी होने के एक महीने बाद आई है।

किसी कार्य को पूरा करने में perplexity लैब्स को लगभग 10 मिनट लगते हैं

कंपनी का कहना है कि Perplexity Labs एक बढ़ाया संस्करण है गहरे अनुसंधान के लिए, और यह वर्तमान में सभी perplexity प्रो ग्राहकों के लिए उपलब्ध है। उत्तरार्द्ध जटिल प्रश्नों के व्यापक उत्तर उत्पन्न करता है जिन्हें आमतौर पर कई खोजों की आवश्यकता होती है। नई सुविधा, कई विशिष्ट उपकरणों के उपयोग के साथ और कार्य पर अधिक समय खर्च करके, कार्रवाई भी कर सकती है और दस्तावेज़ और वेब ऐप उत्पन्न करने के लिए कमांड निष्पादित कर सकती है।

Perplexity Labs कंपनी के अनुसार गहरी वेब ब्राउज़िंग, कोड निष्पादन, चार्ट निर्माण और छवि निर्माण कर सकते हैं। कंपनी ने यह निर्दिष्ट नहीं किया कि क्या ये एजेंट टूल हैं, और यदि नई सुविधा एक मल्टी-एजेंट वर्कफ़्लो का समर्थन करती है। यह भी पता नहीं था कि अलग -अलग बड़े भाषा मॉडल (एलएलएम) छवि निर्माण और कोड निष्पादन जैसी क्षमताओं को शक्ति प्रदान कर रहे थे।

कंपनी का कहना है कि पेरप्लेक्सिटी लैब्स डेटा को स्ट्रक्चरिंग डेटा, फॉर्मूले को लागू करने और चार्ट और डॉक्यूमेंट बनाने जैसे कार्यों को करने के लिए कोड लिख और निष्पादित कर सकते हैं। कार्य के दौरान बनाई गई किसी भी दस्तावेज, कोड फ़ाइलों, चार्ट और छवियों को एक अलग संपत्ति टैब में जोड़ा जाता है। उपयोगकर्ता इन फ़ाइलों को वहां से देख और डाउनलोड कर सकते हैं। एक ऐप टैब भी है जो बुनियादी डैशबोर्ड, स्लाइडशो और वेबसाइटों के निर्माण में सक्षम बनाता है।

सुविधा का विवरण यह एक एजेंट की क्षमता की तरह ध्वनि करता है। विकलता कहते हैं कि “स्व-पर्यवेक्षित” कार्यों को पूरा करने में 10 मिनट या उससे अधिक समय लग सकता है। जबकि उपयोगकर्ता चेन-ऑफ-थॉट (सीओटी) देख सकते हैं, यह स्पष्ट नहीं है कि वे प्रारंभिक संकेत को संपादित करने या परिणाम की दिशा को बदलने के लिए एआई को रोक या बाधित कर सकते हैं।

कंपनी ने उन कार्यों के उदाहरण भी साझा किए जो कि पेरप्लेक्सिटी लैब्स संभाल सकते हैं। इनमें एक विशिष्ट स्टॉक या इवेंट के आसपास एक ट्रेडिंग रणनीति बनाना, एक दृश्य स्टोरीबोर्ड और पटकथा के साथ एक शैली-मिश्रित फिल्म अवधारणा उत्पन्न करना, कंपनी प्रोफाइल बनाना, या तुलनात्मक डेटा विज़ुअलाइज़ेशन बनाना शामिल है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


ओप्पो ने एन 5 फ्लिप को विकास में कथित तौर पर पाते हैं, नए कैमरा लेआउट के साथ अद्यतन डिजाइन पर स्कीमैटिक्स संकेत


Continue Reading

AI & Automation

Gmail Google कार्यक्षेत्र के साथ मिथुन एआई-संचालित सारांश कार्ड का परिचय देता है

Published

on

By

Google कार्यक्षेत्र के हिस्से के रूप में Gmail को आर्टिफिशियल इंटेलिजेंस (AI) द्वारा संचालित एक नई फीचर के साथ अपडेट किया गया है, जिसमें ड्रॉप हो सकता है। माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की है कि यह ईमेल में सारांश कार्ड जोड़ रहा है जो या तो बहुत लंबे हैं, या एक लंबे ईमेल थ्रेड का हिस्सा हैं। ये सारांश कार्ड उपयोगकर्ताओं को संदेश के बारे में संदर्भ प्रदान करने के लिए ईमेल के शीर्ष पर स्वचालित रूप से दिखाई देंगे, और मिथुन एआई का उपयोग करके उत्पन्न होते हैं। नवीनतम अपडेट में Google चैट, Google डॉक्स और Google मीट में नई AI सुविधाएँ भी शामिल हैं।

Gmail अब AI सारांश स्वचालित रूप से दिखाता है

Google कार्यक्षेत्र उपयोगकर्ता जिनके पास सेवा के लिए एक सक्रिय सदस्यता है, अब देखेंगे gmail पर ईमेल सारांश एक अलग तरीके से, कंपनी के अनुसार। इससे पहले, उपयोगकर्ताओं को एक ईमेल खोलना था और विशेष ईमेल या थ्रेड का एआई-जनित सारांश देखने के लिए मिथुन आइकन पर टैप करना था।

जीमेल सारांश कार्ड जीमेल सारांश कार्ड

Gmail में सारांश कार्ड
फोटो क्रेडिट: Google

नवीनतम अपडेट के साथ, मिथुन बुद्धिमानी से उन ईमेलों की पहचान करेंगे जिनके लिए एक सारांश की आवश्यकता होती है, और स्वचालित रूप से इसे ईमेल के शीर्ष पर रखे एक सारांश कार्ड में दिखाते हैं। जब भी लोग धागे का जवाब देते हैं, तो सारांश भी स्वचालित रूप से ताज़ा हो जाएगा। सारांश कार्ड को भी ढह सकता है जब उपयोगकर्ताओं को लगता है कि यह उपयोगी नहीं है।

गूगल चैट कुछ नई सुविधाएँ भी मिल रही हैं। मिथुन अब चैट के घर के दृश्य में संदेशों को संक्षेप में प्रस्तुत करेगा, इसलिए उपयोगकर्ता यह समझ सकते हैं कि किन संदेशों को उनके तत्काल ध्यान देने की आवश्यकता है। यह सुविधा अंग्रेजी, स्पेनिश और छह अन्य भाषाओं में उपलब्ध है।

मिथुन एक साझा कार्यक्षेत्र फ़ाइल की सामग्री का विश्लेषण और सारांश भी दे सकता है। इसलिए, यदि कोई सहकर्मी एक डॉक्टर या स्लाइड साझा करता है, तो उपयोगकर्ता दस्तावेज़ खोलने से पहले साइड पैनल में एक सारांश देख पाएगा।

गूगल डॉक्स एक नया एआई सुविधा भी मिल रही है जिसे सारांश बिल्डिंग ब्लॉक कहा जाता है। जब मिथुन एक दस्तावेज़ का सारांश उत्पन्न करता है, तो उपयोगकर्ता इसे शीर्ष पर सम्मिलित कर सकते हैं, जिससे दर्शकों को गोता लगाने से पहले संदर्भ को समझना आसान हो जाता है। हर बार दस्तावेज़ को संपादित किया जाता है, नवीनतम संस्करण दिखाने के लिए सारांश को ताज़ा किया जा सकता है।

कंपनी ने नए डायनेमिक लेआउट को भी उजागर किया है गूगल मीट यह उपयोगकर्ताओं को “कमरे” और “व्यक्तिगत” टाइलों के बीच चयन करने की अनुमति देता है। कमरे की टाइल के लिए आदर्श है जब एक ही डिवाइस का उपयोग कई प्रतिभागियों को दिखाने के लिए किया जा रहा है, जबकि व्यक्तिगत टाइल एकल प्रतिभागी के चेहरे पर केंद्रित है।

Continue Reading

AI & Automation

Microsoft टाउन हॉल में AI बिक्री को टाल देता है, बार्कलेज अनुबंध का खुलासा करता है

Published

on

By

Microsoft ने गुरुवार को एक कंपनीव्यापी टाउन हॉल के दौरान कॉर्पोरेट ग्राहकों को आर्टिफिशियल इंटेलिजेंस (AI) टूल बेचने की प्रगति की, जिसमें बार्कलेज पीएलसी के साथ एक प्रमुख सौदा भी शामिल था।

मुख्य वाणिज्यिक अधिकारी जुडसन अल्थॉफ ने कर्मचारियों को बताया कि इवेंट से परिचित लोगों के अनुसार, बार्कलेज ने माइक्रोसॉफ्ट के कोपिलॉट एआई सहायकों के लिए 100,000 लाइसेंस खरीदने के लिए सहमति व्यक्त की। अल्थॉफ ने यह भी कहा कि कई दर्जन ग्राहकों – जिनमें एक्सेंचर, टोयोटा मोटर, वोक्सवैगन एजी और सीमेंस एजी शामिल हैं – में 100,000 से अधिक कोपिलॉट उपयोगकर्ता हैं, जो लोगों के अनुसार, जिन्होंने आंतरिक टिप्पणियों पर चर्चा करने के लिए गुमनामी का अनुरोध किया था।

माइक्रोसॉफ्ट कोपिलॉट को अपनाने पर ध्यान केंद्रित कर रहा है और बारीकी से ट्रैक कर रहा है कि ग्राहक कार्यबल का कौन सा हिस्सा टूल, मुख्य कार्यकारी अधिकारी का उपयोग कर रहा है सत्य नडेला घटना के दौरान कहा। प्रति माह $ 30 (लगभग 2,566 रुपये) की सूची की कीमतों पर, अल्थॉफ द्वारा उद्धृत सौदों में से प्रत्येक में प्रति वर्ष लाखों डॉलर के दसियों के लायक होंगे – हालांकि बड़े ग्राहकों को आमतौर पर थोक छूट मिलती है।

Microsoft ने टिप्पणी करने से इनकार कर दिया। बार्कलेज, एक्सेंचर, टोयोटा, वोक्सवैगन और सीमेंस के प्रतिनिधियों ने टिप्पणी नहीं की।

दुनिया के सबसे बड़े सॉफ्टवेयर निर्माता को एआई उत्पादों के व्यवसायीकरण में एक नेता माना जाता है, इसके साथ घनिष्ठ साझेदारी के लिए धन्यवाद चटपट निर्माता ओपनईऔर उत्पादकता अनुप्रयोगों के अपने सूट में कोपिलॉट एम्बेड कर रहा है।

फिर भी, वॉल स्ट्रीट इस बात के सबूतों को देखने के लिए उत्सुक है कि मल्टीबिलियन-डॉलर का दांव भुगतान कर रहा है। जनवरी में, Microsoft ने कहा कि इसका AI सूट – क्लाउड इन्फ्रास्ट्रक्चर और AI अनुप्रयोगों सहित – वार्षिक राजस्व में कम से कम $ 13 बिलियन (लगभग 111,211 करोड़ रुपये) में लाने के लिए गति पर था।

कंपनी ने प्लेंटीफुल उपाख्यानों की पेशकश की है, जिसमें बताया गया है कि कॉर्पोरेट ग्राहक कैसे कोपिलॉट, माइक्रोसॉफ्ट के हस्ताक्षर एआई उत्पाद को ले रहे हैं, लेकिन कुल ग्राहक की गिनती या उन बिक्री के वित्तीय प्रभाव का खुलासा नहीं किया है। कुछ कॉर्पोरेट ग्राहकों का कहना है कि उपकरणों को बहुत सारे आंतरिक ट्वीक और कर्मचारी प्रशिक्षण की आवश्यकता होती है, और कई लोग एक के रूप में कोपिलॉट के अपने उपयोग का वर्णन करते हैं मापा रोलआउट और ट्रायल की श्रृंखला, अपने सभी कर्मियों को महंगा सॉफ्टवेयर से लैस करने के लिए एक भीड़ के बजाय।

योजनाओं की घोषणा के बाद सप्ताह कुल्हाड़ी 6,000 श्रमिकया लगभग तीन प्रतिशत कार्यबल, कंपनी के पास सैनिकों को रैली करने का भी कारण है। नडेला ने कटौती को संबोधित करके बैठक शुरू की, यह कहते हुए कि वे प्रदर्शन के बजाय एक पुनर्गठन से संबंधित थे। समाप्ति गिर गई मुश्किल कंपनी के उत्पादों का निर्माण करने वाले लोगों पर, यह दिखाते हुए कि एआई की उम्र में इंजीनियरिंग नौकरियों की गारंटी भी नहीं है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Published

on

By

Google ने साइनगेमा की घोषणा की है, जो एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल है जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है। मॉडल, जो मॉडल ऑफ मॉडल का हिस्सा होगा, वर्तमान में माउंटेन व्यू-आधारित टेक दिग्गज द्वारा परीक्षण किया जा रहा है और इस साल के अंत में लॉन्च होने की उम्मीद है। अन्य सभी Gemma मॉडल के समान, Singgemma एक ओपन-सोर्स AI मॉडल भी होगा, जो व्यक्तियों और व्यवसायों के लिए उपलब्ध है। यह पहली बार Google I/O 2025 कीनोट के दौरान दिखाया गया था, और यह भाषण और सुनने की अक्षमता वाले लोगों की मदद करने के लिए डिज़ाइन किया गया है जो प्रभावी रूप से उन लोगों के साथ संवाद करते हैं जो साइन लैंग्वेज को नहीं समझते हैं।

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), Google डीपमाइंड के आधिकारिक हैंडल ने एआई मॉडल का एक डेमो और इसकी रिलीज की तारीख के बारे में कुछ विवरण साझा किए। हालाँकि, यह पहली बार नहीं है जब हमने साइनगेममा को देखा है। यह भी संक्षेप में Google I/O इवेंट में Gus Martin, Gemma Product Manager द्वारा दीपमाइंड में दिखाया गया था।

शोकेस के दौरान, मार्टिंस ने इस बात पर प्रकाश डाला कि एआई मॉडल वास्तविक समय में साइन लैंग्वेज से टेक्स्ट ट्रांसलेशन प्रदान करने में सक्षम है, जिससे आमने-सामने संचार को सहज बना दिया गया है। मॉडल को साइन भाषाओं के विभिन्न शैलियों के डेटासेट पर भी प्रशिक्षित किया गया था, हालांकि, यह अंग्रेजी भाषा में अनुवाद करते समय अमेरिकी साइन लैंग्वेज (एएसएल) के साथ सर्वश्रेष्ठ प्रदर्शन करता है।

अनुसार बहुभाषी के लिए, चूंकि यह एक ओपन-सोर्स मॉडल है, इसलिए SignGemma इंटरनेट से कनेक्ट करने की आवश्यकता के बिना कार्य कर सकता है। यह सीमित कनेक्टिविटी वाले क्षेत्रों में उपयोग करने के लिए उपयुक्त बनाता है। यह कहा जाता है मिथुन नैनो फ्रेमवर्क और हाथ के आंदोलनों, आकृतियों और चेहरे के भावों को ट्रैक और विश्लेषण करने के लिए एक विज़न ट्रांसफार्मर का उपयोग करता है। डेवलपर्स के लिए इसे उपलब्ध कराने से परे, गूगल मॉडल को अपने मौजूदा एआई टूल में एकीकृत कर सकता है, जैसे कि मिथुन लाइव।

इसे “साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल” कहते हुए, दीपमाइंड ने इस बात पर प्रकाश डाला कि यह इस साल के अंत में जारी किया जाएगा। एक्सेसिबिलिटी-केंद्रित बड़े भाषा मॉडल वर्तमान में अपने शुरुआती परीक्षण चरण में है, और टेक दिग्गज ने एक प्रकाशित किया है ब्याज -रूप व्यक्तियों को इसे आज़माने और प्रतिक्रिया प्रदान करने के लिए आमंत्रित करने के लिए।


Continue Reading

AI & Automation

Xbox मोबाइल ऐप्स पर सार्वजनिक परीक्षण में अब गेमिंग एआई चैटबॉट के लिए Microsoft का कोपिलॉट

Published

on

By

Microsoft ने बुधवार को गेमिंग के लिए Xbox गेमर्स, कोपिलॉट के लिए अपने आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट का सार्वजनिक परीक्षण शुरू किया। यह वर्तमान में iOS और Android उपकरणों पर मोबाइल के लिए Xbox ऐप के बीटा संस्करण में उपलब्ध है। रेडमंड-आधारित टेक दिग्गज ने कहा कि एआई चैटबॉट खेलों के बारे में प्रश्नों का जवाब दे सकता है, एक खेल में एक स्तर को हराने के लिए सुझाव प्रदान कर सकता है, और यहां तक ​​कि एक उपयोगकर्ता द्वारा खेले गए अन्य गेम के आधार पर खेलों को खेलने की सलाह भी देता है। कंपनी ने बीटा परीक्षकों को नए अनुभव के बारे में प्रतिक्रिया प्रदान करने के लिए भी कहा है।

गेमिंग के लिए कोपिलॉट गेमर्स के लिए दूसरी स्क्रीन के साथी के रूप में आता है

एक न्यूज़ रूम में डाकMicrosoft के Xbox डिवीजन ने व्यक्तियों का चयन करने के लिए चैटबॉट के रोलआउट की घोषणा की। इस शुरुआती परीक्षण में, गेमिंग के लिए कोपिलॉट आईओएस और एंड्रॉइड पर एक्सबॉक्स ऐप के बीटा संस्करण का उपयोग करने वालों के लिए उपलब्ध होगा। प्रारंभिक पूर्वावलोकन 18 या उससे अधिक उम्र के खिलाड़ियों के लिए अंग्रेजी भाषा में उपलब्ध है।

सह पायलट गेमिंग के लिए वर्तमान में ऑस्ट्रेलिया, ब्राजील, कनाडा, भारत, जापान, मलेशिया, न्यूजीलैंड, सिंगापुर, दक्षिण अफ्रीका और अमेरिका सहित बड़ी संख्या में क्षेत्रों में परीक्षण किया जा रहा है। वर्तमान में, एआई चैटबॉट यूरोपीय संघ देशों और यूके में उपलब्ध नहीं है। Microsoft ने कहा कि इन क्षेत्रों को बाद की तारीख में जोड़ा जाएगा।

गेमिंग के लिए गेमिंग 1 कोपिलॉट गेमिंग के लिए कोपिलॉट

गेमिंग के लिए कोपिलॉट
फोटो क्रेडिट: Xbox

चैटबॉट वर्तमान में एक दूसरी स्क्रीन पर उपलब्ध है, ताकि यह गेमर्स को उनके कोर गेमप्ले अनुभव से विचलित न करे। गेमिंग के लिए Copilot उपयोगकर्ता की Xbox गतिविधि का उपयोग कर सकता है, जिसमें खाता डेटा, खेल इतिहास और उपलब्धियां शामिल हैं, और उस जानकारी के आधार पर इसकी प्रतिक्रियाओं को संदर्भित कर सकते हैं। इसके अतिरिक्त, यह उपयोगकर्ताओं की सहायता के लिए वेब से जानकारी भी दे सकता है।

गेमिंग के लिए कोपिलॉट के इस संस्करण के साथ, उपयोगकर्ता किसी भी गेम के बारे में प्रश्न पूछ सकते हैं। उदाहरण के लिए, वे Minecraft में आवश्यक सामग्रियों के बारे में चैटबॉट से पूछ सकते हैं कि एक तलवार को तैयार करने के लिए या हॉगवर्ट्स विरासत में पहले परीक्षण के बॉस को कैसे हराया जाए। उपयोगकर्ता गेमिंग सिफारिशों के लिए चैटबॉट भी पूछ सकते हैं। वे या तो उस तरह के गेम का वर्णन कर सकते हैं जो वे खेलना चाहते हैं, या एआई उपयोगकर्ताओं के गेमिंग इतिहास के आधार पर नए गेम खेलने के लिए सुझाव दे सकता है।

इसके अतिरिक्त, उपयोगकर्ता अपने खेल के इतिहास या खातों के बारे में भी सवाल पूछ सकते हैं। ये प्रश्न उनकी Xbox उपलब्धियों या सदस्यता विवरण के आसपास हो सकते हैं।

Continue Reading

AI & Automation

$ 300 मिलियन XAI डील के बाद उपयोगकर्ताओं को ग्रोक चैटबॉट वितरित करने के लिए टेलीग्राम

Published

on

By

एलोन मस्क के एआई स्टार्टअप XAI मैसेजिंग ऐप पर अपने ग्रोक चैटबॉट को तैनात करने के लिए टेलीग्राम $ 300 मिलियन (लगभग 2,564 करोड़ रुपये) का भुगतान करेंगे, जिसका उद्देश्य प्लेटफ़ॉर्म के एक बिलियन से अधिक उपयोगकर्ताओं को टैप करना है और उबालते कृत्रिम खुफिया बाजार में अपनी प्रतिस्पर्धी बढ़त को तेज करना होगा।

एक साल के सौदे के तहत, XAI भी दे देंगे तार मैसेजिंग ऐप, टेलीग्राम संस्थापक के माध्यम से की गई किसी भी सदस्यता बिक्री का आधा हिस्सा पावेल डुरोव बुधवार को पहले एक्स पर एक पोस्ट में कहा, यह कहते हुए कि $ 300 मिलियन (लगभग 2,564 करोड़ रुपये) का भुगतान नकद और स्टॉक में किया जाएगा।

ड्यूरोव ने कहा कि XAI केवल डेटा का उपयोग करेगा जो टेलीग्राम उपयोगकर्ता स्पष्ट रूप से साझा करते हैं घिसना प्रत्यक्ष बातचीत के माध्यम से।

कस्तूरी कहा कि एक्स पर पोस्ट के जवाब में कोई सौदा नहीं किया गया है, जिस पर डुरोव ने कहा कि पार्टियां सिद्धांत रूप में सहमत हैं लेकिन औपचारिकताएं लंबित थीं।

यह सौदा XAI प्रदान कर सकता है, जिसने इस साल की शुरुआत में X का अधिग्रहण किया था, जिसमें अपने AI मॉडल को प्रशिक्षित करने और विकसित करने के लिए मूल्यवान डेटा था।

कई ओपन-सोर्स रिपॉजिटरी थकने के साथ, एआई कंपनियों को गुणवत्ता वाले डेटा की सोर्सिंग में बढ़ती चुनौतियों का सामना करना पड़ता है, जैसे कि फर्मों को धक्का देना मेटा प्लेटफ़ॉर्म मॉडल प्रशिक्षण के लिए एआई के साथ सार्वजनिक बातचीत का उपयोग करने के लिए।

अपनी गोपनीयता नीति के अनुसार, एक्स अपने एआई मॉडल को प्रशिक्षित करने के लिए उपयोगकर्ताओं से सार्वजनिक पदों का उपयोग करता है। यह तुरंत स्पष्ट नहीं था कि क्या XAI टेलीग्राम से डेटा का समान रूप से उपयोग करेगा।

XAI, जिसने इस साल कई टाई-अप में प्रवेश किया है, एआई इन्फ्रास्ट्रक्चर और वित्तीय सेवाओं दोनों में अपनी स्थिति को बढ़ाने के लिए, टिप्पणी के लिए रॉयटर्स के अनुरोध का तुरंत जवाब नहीं दिया।

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

डीपसेक ने आर 1 मॉडल को अद्यतन किया, जैसे कि एआई रेस गर्म हो जाती है

Published

on

By

दीपसेक ने कहा कि इसने आर 1 आर्टिफिशियल-इंटेलिजेंस मॉडल को अपग्रेड किया है जिसने इस साल की शुरुआत में चीनी स्टार्टअप को वैश्विक प्रमुखता के लिए प्रेरित करने में मदद की है।

दीपसेक एक अधिकारी में एक कंपनी के प्रतिनिधि के पद के अनुसार, इसे “मामूली परीक्षण अपग्रेड” के रूप में वर्णित किया और उपयोगकर्ताओं को बताया कि वे इसका परीक्षण शुरू कर सकते हैं। WeChat बुधवार को समूह।

हांग्जो-आधारित स्टार्टअप वैश्विक तकनीकी उद्योग को चौंका दिया जनवरी में जब इसने आर 1 का अनावरण किया, तो एक एआई मॉडल जिसने पश्चिमी खिलाड़ियों को कई मानकीकृत मैट्रिक्स पर पछाड़ दिया, जो कि केवल कई मिलियन डॉलर की लागत से कथित तौर पर था। इसने वैश्विक तकनीकी शेयरों में एक मार्ग को ट्रिगर किया क्योंकि निवेशकों ने सवाल किया कि क्या अग्रणी फर्मों को अभी भी महत्वपूर्ण मात्रा में खर्च करने की आवश्यकता होगी सेवाएं।

R1 की शुरुआत भी चला जाना चीन में अतिरिक्त एआई मॉडल लॉन्च करने की दौड़। संस्थापक लिआंग वेनफेंग देश की सबसे अच्छी सिलिकॉन वैली के साथ प्रतिस्पर्धा करने की क्षमता का प्रतीक बन गए।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


सैमसंग गैलेक्सी S26 श्रृंखला थिनर लेंस मॉड्यूल को सक्षम करने के लिए इंकजेट प्रिंटिंग का उपयोग करने के लिए: रिपोर्ट



Xiaomi RS रिपोर्ट करता है। Q1 2025 में 1.31 लाख करोड़ राजस्व, रु। 1.2 लाख करोड़ का निशान फिर से


Continue Reading

AI & Automation

ओपनई की वायरल घिबली ट्रेंड एक गोपनीयता खदान हो सकती है, विशेषज्ञों का कहना है

Published

on

By

जब तक आप पूरी तरह से सोशल मीडिया और इंटरनेट पॉप संस्कृति से एक चट्टान या परहेज के नीचे रहते हैं, तब तक आपको कम से कम घिबली प्रवृत्ति के बारे में सुना होगा, अगर हजारों छवियों को लोकप्रिय सामाजिक प्लेटफार्मों में बाढ़ नहीं करते देखा गया है। पिछले कुछ हफ्तों में, लाखों व्यक्तियों ने अपनी छवियों को स्टूडियो घिबली-शैली की कला में बदलने के लिए Openai की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट का उपयोग किया है। हयाओ मियाजाकी की फिल्मों की सनकी, हाथ से तैयार सौंदर्यशास्त्र में व्यक्तिगत तस्वीरों, मेमों और ऐतिहासिक दृश्यों को बदलने की उपकरण की क्षमता, जैसे कि स्पिरिटेड अवे और मेरे पड़ोसी टोटरो की तरह, लाखों लोगों ने इस पर अपने हाथों की कोशिश की है।

इस प्रवृत्ति के परिणामस्वरूप Openai के AI चैटबोट के लिए लोकप्रियता में भारी वृद्धि हुई है। हालांकि, जबकि व्यक्ति खुशी से अपने, अपने परिवार और दोस्तों की चैटबॉट छवियों को खिला रहे हैं, विशेषज्ञों ने वायरल घिबली प्रवृत्ति पर गोपनीयता और डेटा सुरक्षा चिंताओं को उठाया है। ये कोई तुच्छ चिंता भी नहीं हैं। विशेषज्ञों पर प्रकाश डाला गया है कि अपनी छवियों को जमा करके, उपयोगकर्ता संभावित रूप से कंपनी को इन छवियों पर अपने एआई मॉडल को प्रशिक्षित करने दे रहे हैं।

इसके अतिरिक्त, एक दूर की नापाक समस्या यह है कि उनके चेहरे का डेटा हमेशा के लिए इंटरनेट का हिस्सा हो सकता है, जिससे गोपनीयता का स्थायी नुकसान हो सकता है। बुरे अभिनेताओं के हाथों में, यह डेटा साइबर क्राइम जैसे पहचान की चोरी भी कर सकता है। इसलिए, अब जब धूल जम गई है, तो आइए हम ओपनई के घिबली प्रवृत्ति के गहरे निहितार्थों को तोड़ दें, जिसमें वैश्विक भागीदारी देखी गई है।

घिबली प्रवृत्ति की उत्पत्ति और उदय

ओपनई मार्च के अंतिम सप्ताह में CHATGPT में देशी छवि पीढ़ी सुविधा का परिचय दिया। GPT-4O आर्टिफिशियल इंटेलिजेंस (AI) मॉडल में जोड़ी गई नई क्षमताओं द्वारा संचालित, यह फीचर पहली बार प्लेटफ़ॉर्म के भुगतान किए गए उपयोगकर्ताओं के लिए जारी किया गया था, और एक हफ्ते बाद, इसे फ्री टियर पर भी उन लोगों के लिए विस्तारित किया गया था। जबकि चटपट Dall-E मॉडल के माध्यम से छवियां उत्पन्न कर सकते हैं, GPT-4O मॉडल ने बेहतर क्षमताओं को लाया, जैसे कि एक इनपुट के रूप में एक छवि को जोड़ना, बेहतर पाठ प्रतिपादन, और इनलाइन संपादन के लिए उच्च त्वरित पालन।

सुविधाओं के शुरुआती अपनाने वालों ने जल्दी से प्रयोग करना शुरू कर दिया, और इनपुट के रूप में छवियों को जोड़ने की क्षमता एक लोकप्रिय हो गई क्योंकि यह देखने के लिए बहुत अधिक मजेदार है कि आपकी तस्वीरों को कलाकृति में बदल दिया जाए, जो पाठ संकेतों का उपयोग करके जेनेरिक छवियों को बनाने की तुलना में कलाकृति में बदल जाए। हालांकि ट्रेंड के सच्चे प्रवर्तक का पता लगाना अविश्वसनीय रूप से मुश्किल है, सॉफ्टवेयर इंजीनियर और एआई उत्साही ग्रांट स्लैटन को लोकप्रिय के रूप में श्रेय दिया जाता है।

उसका डाकजहां उन्होंने अपनी, अपनी पत्नी और अपने पारिवारिक कुत्ते की एक छवि को सौंदर्य-घिबली-शैली की कला में बदल दिया, इसे लिखने के समय 52 मिलियन से अधिक बार देखा, 16,000 बुकमार्क और 5,900 रेपोस्ट।

हालांकि, Ghibli- शैली की छवियों को बनाने वाले उपयोगकर्ताओं की कुल संख्या पर सटीक आंकड़े उपलब्ध नहीं हैं, ऊपर दिए गए संकेतक, X (पूर्व में ट्विटर के रूप में जाना जाता है), फेसबुक, इंस्टाग्राम और Reddit जैसे सोशल मीडिया प्लेटफार्मों पर इन छवियों के व्यापक साझाकरण के साथ, सुझाव देते हैं कि भागीदारी लाखों में हो सकती है।

यह प्रवृत्ति व्यक्तिगत उपयोगकर्ताओं से परे भी बढ़ी है, ब्रांड और यहां तक ​​कि सरकारी संस्थाओं के साथ, जैसे कि भारत सरकार की मायगोविंडिया एक्स खाताghibli-inspired विजुअल बनाकर भाग लेना। सचिन तेंदुलकर, अमिताभ बच्चन जैसी हस्तियों को भी सोशल मीडिया पर इन छवियों को साझा करते हुए देखा गया था।

गोपनीयता और डेटा सुरक्षा चिंताओं को घिबली प्रवृत्ति के पीछे

इसके समर्थन के अनुसार पृष्ठोंOpenAI अपने AI मॉडल को प्रशिक्षित करने के लिए, पाठ, चित्र और फ़ाइल अपलोड सहित उपयोगकर्ता सामग्री एकत्र करता है। प्लेटफ़ॉर्म पर एक ऑप्ट-आउट विधि उपलब्ध है, जो सक्रिय है जो कंपनी को उपयोगकर्ता के डेटा को इकट्ठा करने से मना कर देगा। हालांकि, कंपनी उपयोगकर्ताओं को स्पष्ट रूप से उस विकल्प के बारे में नहीं बताती है कि यह एआई मॉडल को प्रशिक्षित करने के लिए डेटा एकत्र करता है जब वे पहली बार प्लेटफ़ॉर्म को पंजीकृत और एक्सेस कर रहे होते हैं (यह CHATGPT का हिस्सा है उपयोग की शर्तेंलेकिन अधिकांश उपयोगकर्ता यह नहीं पढ़ते हैं। “स्पष्ट” भाग एक पॉप-अप पेज को संदर्भित करता है जो डेटा संग्रह और ऑप्ट-आउट तंत्र को उजागर करता है)।

इसका मतलब है कि अधिकांश सामान्य उपयोगकर्ता, जिनमें शामिल हैं, जो घिबली-शैली की कला उत्पन्न करने के लिए अपनी छवियों को साझा कर रहे हैं, उन्हें गोपनीयता नियंत्रण के बारे में कोई जानकारी नहीं है, और वे डिफ़ॉल्ट रूप से एआई फर्म के साथ अपना डेटा साझा करते हैं। तो, वास्तव में इस डेटा का क्या होता है?

ओपनई के अनुसार सहायता पृष्ठजब तक कोई उपयोगकर्ता मैन्युअल रूप से चैट को हटाता है, तब तक डेटा को उसके सर्वर पर सदा के लिए संग्रहीत किया जाता है। डेटा को हटाने के बाद भी, अपने सर्वर से स्थायी विलोपन 30 दिन तक का समय लग सकता है। हालांकि, जब उपयोगकर्ता डेटा OpenAI के साथ साझा किया जाता है, तो कंपनी अपने AI मॉडल को प्रशिक्षित करने के लिए डेटा का उपयोग कर सकती है (टीमों, उद्यम या शिक्षा योजनाओं पर लागू नहीं होती है)।

“जब किसी भी एआई मॉडल को किसी भी जानकारी पर पूर्व-प्रशिक्षित किया जाता है, तो यह मॉडल के मापदंडों का हिस्सा बन जाता है। भले ही कोई कंपनी अपने स्टोरेज सिस्टम से उपयोगकर्ता डेटा को हटा देती है, प्रशिक्षण प्रक्रिया को उलटना बेहद मुश्किल है। जबकि यह इनपुट डेटा को पुनर्जीवित करने की संभावना नहीं है, क्योंकि कंपनियों ने डिक्लासिफ़ायर को जोड़ दिया है, एआई मॉडल निश्चित रूप से डेटा से इसका लाभ उठाता है।”

लेकिन, क्या नुकसान है – कुछ पूछ सकते हैं। Openai या किसी भी अन्य AI प्लेटफॉर्म में यहां का नुकसान स्पष्ट सहमति के बिना उपयोगकर्ता डेटा एकत्र करना है कि उपयोगकर्ताओं को नहीं पता है और इसका उपयोग कैसे किया जाता है, इस पर कोई नियंत्रण नहीं है।

“एक बार जब कोई फोटो अपलोड हो जाता है, तो यह हमेशा स्पष्ट नहीं होता है कि प्लेटफ़ॉर्म इसके साथ क्या करता है।

मुखर्जी ने यह भी बताया कि डेटा ब्रीच की दुर्लभ घटना में, जहां उपयोगकर्ता डेटा बुरे अभिनेताओं द्वारा चुराया जाता है, परिणाम गंभीर हो सकते हैं। डीपफेक के उदय के साथ, बुरे अभिनेता नकली सामग्री बनाने के लिए डेटा का दुरुपयोग कर सकते हैं जो व्यक्तियों की प्रतिष्ठा या यहां तक ​​कि पहचान धोखाधड़ी जैसे परिदृश्यों को नुकसान पहुंचाता है।

परिणाम लंबे समय तक चलने वाले हो सकते हैं

आशावादी पाठकों के लिए एक मामला बनाया जा सकता है कि एक डेटा उल्लंघन एक दुर्लभ संभावना है। हालांकि, वे व्यक्ति चेहरे की विशेषताओं के साथ आने वाली स्थायित्व की समस्या पर विचार नहीं कर रहे हैं।

क्लाउडसेक के शोधकर्ता गगन अग्रवाल ने कहा, “व्यक्तिगत पहचान योग्य जानकारी (पीआईआई) या कार्ड के विवरण के विपरीत, जिनमें से सभी को बदला/बदला जा सकता है, चेहरे की विशेषताओं को स्थायी रूप से डिजिटल पदचिह्न के रूप में छोड़ दिया जाता है, गोपनीयता के लिए एक स्थायी नुकसान छोड़ दिया।”

इसका मतलब यह है कि भले ही एक डेटा ब्रीच 20 साल बाद होता है, जिनकी छवियां लीक हो जाती हैं, उन्हें अभी भी सुरक्षा जोखिमों का सामना करना पड़ेगा। अग्रवाल ने कहा कि आज, इस तरह के ओपन-सोर्स इंटेलिजेंस (OSINT) टूल मौजूद हैं जो इंटरनेट-वाइड फेस सर्च कर सकते हैं। यदि डेटासेट गलत हाथों में आता है, तो यह उन लाखों लोगों के लिए एक बड़ा जोखिम पैदा कर सकता है जिन्होंने घिबली प्रवृत्ति में भाग लिया था।

लेकिन समस्या केवल अधिक लोगों को क्लाउड-आधारित मॉडल और प्रौद्योगिकियों के साथ अपना डेटा साझा करने के लिए बढ़ाने वाली है। हाल के दिनों में, हमने देखा है Google ने अपने VEO 3 वीडियो जनरेशन मॉडल का परिचय दिया यह न केवल लोगों के हाइपरलिस्टिक वीडियो बना सकता है, बल्कि उनमें संवाद और पृष्ठभूमि ध्वनियों को भी शामिल कर सकता है। मॉडल छवि-आधारित वीडियो पीढ़ी का समर्थन करता है, जो जल्द ही एक और समान प्रवृत्ति को जन्म दे सकता है।

यहां विचार भय या व्यामोह बनाने के लिए नहीं है, बल्कि उन जोखिमों के बारे में जागरूकता उत्पन्न करने के लिए है जब उपयोगकर्ताओं को लगता है कि जब वे प्रतीत होता है कि निर्दोष इंटरनेट रुझानों में भाग लेते हैं या क्लाउड-आधारित एआई मॉडल के साथ डेटा साझा करते हैं। उसी का ज्ञान लोगों को भविष्य में अच्छी तरह से सूचित विकल्प बनाने में सक्षम करेगा।

जैसा कि मुखर्जी बताते हैं, “उपयोगकर्ताओं को डिजिटल मज़ा के लिए अपनी गोपनीयता का व्यापार नहीं करना चाहिए। पारदर्शिता, नियंत्रण और सुरक्षा को शुरू से ही अनुभव का हिस्सा बनने की आवश्यकता है।”

यह तकनीक अभी भी अपने नवजात चरण में है, और नई क्षमताओं के रूप में उभरने के बाद, अधिक रुझान दिखाई देने के लिए निश्चित हैं। घंटे की आवश्यकता को ध्यान में रखना है क्योंकि उपयोगकर्ता ऐसे उपकरणों के साथ बातचीत करते हैं। आग के बारे में पुरानी कहावत भी एआई पर लागू होती है: यह एक अच्छा सेवक है लेकिन एक बुरा गुरु है।

Continue Reading

AI & Automation

ओपेरा नियॉन एजेंटिक ब्राउज़र अनावरण किया गया, यात्राओं की योजना बनाने और वेबसाइटों का निर्माण करने के लिए एआई एजेंटों का उपयोग करता है

Published

on

By

कंपनी के नवीनतम आर्टिफिशियल इंटेलिजेंस (एआई) एजेंट-संचालित ब्राउज़र, ओपेरा नियॉन का मंगलवार को अनावरण किया गया। नॉर्वेजियन टेक दिग्गज ने कहा कि एजेंटिक वेब के लिए नए ब्राउज़र का अनुभव विकसित किया जा रहा था, और यह फिर से बताता है कि एक ब्राउज़र कैसे दिखता है और कार्य करता है। यह एआई-संचालित एजेंटिक वर्कफ़्लोज़ के निर्माण पर केंद्रित है जो या तो उपयोगकर्ता के साथ काम करते हैं या पृष्ठभूमि में स्वायत्त रूप से कार्य करते हैं। जबकि कंपनी ने कोई रिलीज की तारीख नहीं दी, उसने कहा कि ओपेरा नियॉन जल्द ही सीमित, आमंत्रित-केवल पहुंच के साथ रिलीज़ होगा।

ओपेरा अपने एआई एजेंट-संचालित वेब ब्राउज़िंग प्लेटफॉर्म का अनावरण करता है

की एक श्रृंखला में पदों एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपेरा के आधिकारिक हैंडल ने नए एजेंटिक वेब ब्राउज़र की घोषणा की। नए ब्राउज़र का वर्णन करते हुए, कंपनी ने कहा, “ओपेरा नियॉन आपके साथ या आपके लिए ब्राउज़ कर सकता है, कार्रवाई कर सकता है और आपको काम करने में मदद कर सकता है।” विशेष रूप से, कंपनी पहले अपने समुदाय के सदस्यों को आमंत्रित आधार पर ब्राउज़र तक पहुंच प्रदान करेगी, और बाद में यह एक भुगतान सदस्यता के हिस्से के रूप में उपलब्ध होगी। ओपेरा भी एक खोला है माइक्रोसाइट वेब ब्राउज़र के लिए जहां व्यक्ति एक वेटलिस्ट के लिए साइन अप कर सकते हैं ताकि इसे आज़माने के लिए आमंत्रित किया जा सके।

ओपेरा नियॉन में मुख्य रूप से तीन विशेषताएं हैं। पहले चैट कहा जाता है, जो एक चैटबॉट जैसा अनुभव है, जहां उपयोगकर्ता प्राकृतिक भाषा में अपने प्रश्नों को टाइप कर सकते हैं और एआई एजेंट जानकारी पाएंगे और इसे साझा करेंगे। यह वेब खोज फ़ंक्शन के साथ किसी भी अन्य AI चैटबॉट की तरह काम करता है। यह पाठ, अनुवाद, अनुसंधान विषय, और बहुत कुछ भी उत्पन्न कर सकता है।

दूसरी विशेषता, डब डू, को एक ब्राउज़र-आधारित एजेंट के रूप में वर्णित किया गया है जो कुछ कार्यों को पूरा कर सकता है जैसे कि एक रेस्तरां में एक टेबल बुक करना, यात्रा की योजना बनाना, और कार्ट में उत्पादों को जोड़ना। यह कंपनी के हाल ही में संचालित है अनावरण किया ब्राउज़र ऑपरेटर एआई एजेंट, और यह पृष्ठभूमि में स्वायत्त रूप से कार्यों को पूरा कर सकता है।

अंत में, मेक कंपनी की सबसे महत्वाकांक्षी पेशकश है। इसका उपयोग एक वेबसाइट बनाने, एक दस्तावेज़ बनाने या एक रेट्रो गेम विकसित करने के लिए किया जा सकता है। कंपनी ने अपने कामकाज में गहराई से नहीं देखा, लेकिन विवरण के आधार पर, यह एक कोडिंग एजेंट द्वारा संचालित प्रतीत होता है, Openai के कोडेक्स के समान।

इस समय कोई अन्य सुविधाएँ सामने नहीं आईं। हालांकि, कंपनी ने इस बात पर प्रकाश डाला कि ओपेरा नियॉन नए और अभिनव एजेंटिक विशेषताओं का परीक्षण करने के लिए अपने खेल के मैदान के रूप में कार्य करेगी।

Continue Reading

AI & Automation

एन्थ्रोपिक की क्लाउड एआई चैटबॉट को वॉयस मोड फीचर मिलता है, रियल-टाइम टू-वे वार्तालाप प्रदान करता है

Published

on

By

एन्थ्रोपिक अंत में अपने क्लाउड चैटबॉट में वॉयस मोड क्षमता जोड़ रहा है। मंगलवार को, आर्टिफिशियल इंटेलिजेंस (एआई) फर्म ने रियल-टाइम टू-वे वॉयस वार्तालाप फीचर के रोलआउट की घोषणा की, जो क्लाउड के मोबाइल ऐप में उपलब्ध होगी। अपनी हाल ही में जारी वेब सर्च फीचर के समान, कंपनी को वॉयस मोड पार्टी में देर हो गई है, जिसमें ओपनआईएआई के चैट, Google की मिथुन, और माइक्रोसॉफ्ट के कोपिलॉट जैसे प्रमुख प्रतियोगियों के साथ पहले से ही इस सुविधा की पेशकश कर रहे हैं। एंथ्रोपिक वर्तमान में क्लाउड के सभी उपयोगकर्ताओं के लिए सुविधा को रोल कर रहा है, लेकिन कुछ प्रीमियम सुविधाएँ केवल भुगतान किए गए ग्राहकों के लिए उपलब्ध हैं।

क्लाउड अब आपसे बात कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), एंथ्रोपिक के आधिकारिक हैंडल ने वॉयस मोड फीचर को रिलीज़ करने की घोषणा की। यह वर्तमान में बीटा में उपलब्ध है और केवल अंग्रेजी भाषा का समर्थन करता है। क्लाउड उपयोगकर्ताओं को अगले कुछ हफ्तों में मोबाइल ऐप में सुविधा मिलेगी।

इसके समर्थन पर सुविधा का वर्णन करना पेजकंपनी ने कहा, “वॉयस मोड आपको अपने iOS और Android उपकरणों पर क्लाउड के साथ पूरी तरह से बोली जाने वाली बातचीत करने की अनुमति देता है।” यह अनिवार्य रूप से एक वास्तविक समय के दो-तरफ़ा वॉयस वार्तालाप सुविधा है, जो कि मिथुन लाइव और चैट के उन्नत वॉयस मोड के समान है। कंपनी द्वारा साझा किए गए एक डेमो के आधार पर, आवाज अभिव्यंजक नहीं है, लेकिन यह एक पाठ-से-भाषण (टीटीएस)-जैसे रोबोट आवाज भी नहीं है। क्लाउड धाराप्रवाह प्रतिक्रिया करता है, लेकिन एक तटस्थ स्वर में।

क्लाउड के वॉयस मोड का एक अनूठा पहलू यह है कि उपयोगकर्ता एआई के साथ बातचीत करते समय स्क्रीन पर बातचीत से प्रमुख बिंदु देख सकते हैं। उपयोगकर्ता प्रवाह को बाधित किए बिना, एक ही बातचीत के भीतर पाठ और वॉयस मोड के बीच भी स्विच कर सकते हैं। पेड सब्सक्राइबर वॉयस वार्तालापों के माध्यम से अपने Google डॉक्स, कैलेंडर, जीमेल और वेब खोजों तक भी पहुंच सकते हैं।

फीचर का उपयोग करने के लिए, उपयोगकर्ताओं को क्लाउड मोबाइल ऐप खोलना होगा और टेक्स्ट फ़ील्ड के भीतर स्थित वॉयस मोड बटन (माइक्रोफोन आइकन के बगल में साउंड वेव आइकन) पर टैप करना होगा। उपयोगकर्ता तब कई आवाज विकल्पों में से चुनने में सक्षम होंगे। एक बार जब उन्होंने अपनी पसंदीदा आवाज उठाई, तो उपयोगकर्ता वॉयस वार्तालाप शुरू कर सकते हैं।

क्लाउड वॉयस मोड क्लाउड वॉयस मोड को नियंत्रित करता है

वॉयस मोड क्लाउड में नियंत्रण करता है
फोटो क्रेडिट: एन्थ्रोपिक

वॉयस मोड इंटरफ़ेस कई नए बटन के साथ आता है। एक बार जब उपयोगकर्ता ने संदेश बोला, तो उन्हें संदेश भेजने के लिए अप तीर को टैप करना होगा। स्टॉप स्क्वायर क्लाउड की प्रतिक्रिया को बाधित करता है। प्लस आइकन कैमरा, फ़ोटो या फ़ाइलों को खोलता है, और एक्स बटन वॉयस मोड से बाहर निकलता है।

विशेष रूप से, के मुक्त स्तर पर क्लाउड सत्र सीमा को मारने से पहले लगभग 20-30 वॉयस मैसेज भेजने में सक्षम होंगे। यह सीमा दैनिक ताज़ा करेगी।


Continue Reading

Trending