AI & Automation

Tencent ने Hunyuanportrait, एक ओपन-सोर्स AI मॉडल को एनिमेटिंग पोर्ट्रेट के लिए लॉन्च किया

Published

3 days ago

May 29, 2025

admin

Tencent ने मंगलवार को एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किया जो अभी भी चित्र छवियों को चेतन कर सकता है। डब्ड हन्युआनपोर्ट्रेट, लार्ज लैंग्वेज मॉडल (एलएलएम) प्रसार आर्किटेक्चर पर आधारित है, और एक संदर्भ छवि और एक मार्गदर्शक वीडियो के आधार पर यथार्थवादी एनीमेशन के साथ वीडियो उत्पन्न कर सकता है। परियोजना के पीछे के शोधकर्ताओं ने इस बात पर प्रकाश डाला कि मॉडल चेहरे के डेटा और स्थानिक आंदोलनों दोनों को सटीक रूप से संदर्भ छवि में सिंक करने के लिए कैप्चर कर सकता है। Tencent ने अब Hunyuanportrait AI मॉडल को खोल दिया है, और इसे लोकप्रिय रिपॉजिटरी से स्थानीय रूप से डाउनलोड और चलाया जा सकता है।

Tencent का Hunyuanportratit अभी भी जीवन के लिए चित्र ला सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), टेन्सेंट हुनयुआन के आधिकारिक हैंडल ने घोषणा की कि हुनुअनपोर्ट्रेट मॉडल अब खुले समुदाय के लिए उपलब्ध है। AI मॉडल को Tencent से डाउनलोड किया जा सकता है GitHub और गले का चेहरा लिस्टिंग। इसके अतिरिक्त, एक प्री-प्रिंट कागज़ मॉडल का विस्तार करना भी Arxiv पर होस्ट किया जा रहा है। विशेष रूप से, AI मॉडल अकादमिक और अनुसंधान-आधारित उपयोग के मामलों के लिए उपलब्ध है, लेकिन व्यावसायिक उपयोग के लिए नहीं।

Hunyuanportrait एक संदर्भ छवि और ड्राइविंग वीडियो का उपयोग करके लाइफलाइक एनिमेटेड वीडियो उत्पन्न कर सकता है। यह चेहरे के डेटा को कैप्चर करता है और वीडियो से सिर पोज देता है और उन्हें स्टिल पोर्ट्रेट इमेज पर प्रक्षेपित करता है। कंपनी का दावा है कि आंदोलन का सिंक सटीक है, और यहां तक कि सूक्ष्म चेहरे की अभिव्यक्ति में परिवर्तन भी दोहराया जाता है।

हुन्युआनपोरिट्रैट आर्किटेक्चर
फोटो क्रेडिट: tencent

अपने मॉडल पर पेजTencent शोधकर्ताओं ने Hunyuanportrait की वास्तुकला को विस्तृत किया। यह एक स्थिति नियंत्रण एनकोडर के साथ स्थिर प्रसार मॉडल की वास्तुकला पर बनाया गया है। ये पूर्व-प्रशिक्षित एनकोडर वीडियो में गति की जानकारी और पहचान को कम करते हैं। डेटा को नियंत्रण संकेतों के रूप में कैप्चर किया जाता है, जो तब एक डेनोइजिंग UNET के माध्यम से स्टिल पोर्ट्रेट में इंजेक्ट किया जाता है। कंपनी का दावा है कि यह दोनों स्थानिक सटीकता के साथ -साथ आउटपुट में अस्थायी स्थिरता दोनों लाता है।

Tencent का दावा है कि AI मॉडल लौकिक स्थिरता और नियंत्रणीयता के मापदंडों पर मौजूदा ओपन-सोर्स विकल्पों को बेहतर बनाता है, लेकिन इन मैट्रिक्स को स्वतंत्र रूप से सत्यापित नहीं किया गया है।

इस तरह के मॉडल फिल्म निर्माण और एनीमेशन उद्योगों में उपयोगी हो सकते हैं। परंपरागत रूप से, एनिमेटर मैन्युअल रूप से कीफ्रेम फेशियल एक्सप्रेशन या एरेस्टिकली मोशन कैप्चर सिस्टम का उपयोग करता है ताकि वर्णों को वास्तविक रूप से चेतन किया जा सके। Hunyuanportrait जैसे मॉडल उन्हें केवल चरित्र डिजाइन और लक्ष्य आंदोलनों और चेहरे के भावों को खिलाने की अनुमति देंगे, और यह आउटपुट उत्पन्न करने में सक्षम होगा। इस तरह के एलएलएम में उच्च गुणवत्ता वाले एनीमेशन को छोटे स्टूडियो और स्वतंत्र रचनाकारों के लिए सुलभ बनाने की क्षमता है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube।

Realme Neo 7 टर्बो के साथ Mediatek Dimentess

Related Topics:

Up Next
Microsoft टाउन हॉल में AI बिक्री को टाल देता है, बार्कलेज अनुबंध का खुलासा करता है

Don't Miss
Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Continue Reading

You may like

Click to comment

Leave a Reply
Cancel reply
Your email address will not be published. Required fields are marked *
Comment *
Name *

Email *

Website

Save my name, email, and website in this browser for the next time I comment.

AI & Automation

स्प्रेडशीट उत्पन्न करने, रिपोर्ट बनाने और वेब ऐप बनाने की क्षमता के साथ लॉन्च किए गए पेरप्लेक्सिटी लैब्स

Published
2 days ago
on
May 30, 2025

By
admin

Perplexity Labs, एक नई कृत्रिम बुद्धिमत्ता (AI) फीचर पेरप्लेक्सिटी प्लेटफॉर्म के भीतर, गुरुवार को पेश किया गया था। कंपनी का कहना है कि नया मोड टेक्स्ट प्रॉम्प्ट को पूर्ण प्रोजेक्ट्स जैसे रिपोर्ट, स्प्रेडशीट और यहां तक कि सरल वेब ऐप्स में बदल सकता है। Perplexity Labs उन जटिल कार्यों को करने के लिए गहरी वेब ब्राउज़िंग और कोड निष्पादन का उपयोग करता है जो प्लेटफ़ॉर्म के दायरे से परे थे। नई सुविधा सैन फ्रांसिस्को स्थित एआई फर्म द्वारा आईओएस के लिए पेरप्लेक्सिटी असिस्टेंट जारी होने के एक महीने बाद आई है।

किसी कार्य को पूरा करने में perplexity लैब्स को लगभग 10 मिनट लगते हैं

कंपनी का कहना है कि Perplexity Labs एक बढ़ाया संस्करण है गहरे अनुसंधान के लिए, और यह वर्तमान में सभी perplexity प्रो ग्राहकों के लिए उपलब्ध है। उत्तरार्द्ध जटिल प्रश्नों के व्यापक उत्तर उत्पन्न करता है जिन्हें आमतौर पर कई खोजों की आवश्यकता होती है। नई सुविधा, कई विशिष्ट उपकरणों के उपयोग के साथ और कार्य पर अधिक समय खर्च करके, कार्रवाई भी कर सकती है और दस्तावेज़ और वेब ऐप उत्पन्न करने के लिए कमांड निष्पादित कर सकती है।

Perplexity Labs का परिचय: ट्रेडिंग ट्रेडिंग स्ट्रैटेजीज, डैशबोर्ड, रियल एस्टेट रिसर्च के लिए हेडलेस ब्राउज़िंग कार्यों जैसे कि रियल एस्टेट रिसर्च, बिल्डिंग मिनी-वेब ऐप्स, स्टोरीबोर्ड और उत्पन्न परिसंपत्तियों की एक निर्देशिका जैसे अधिक जटिल कार्यों के लिए आपकी खोजों को करने का एक नया तरीका। pic.twitter.com/apb5jk5kwd

– अरविंद श्रीनिवास (@aravsrinivas) 29 मई, 2025

Perplexity Labs कंपनी के अनुसार गहरी वेब ब्राउज़िंग, कोड निष्पादन, चार्ट निर्माण और छवि निर्माण कर सकते हैं। कंपनी ने यह निर्दिष्ट नहीं किया कि क्या ये एजेंट टूल हैं, और यदि नई सुविधा एक मल्टी-एजेंट वर्कफ़्लो का समर्थन करती है। यह भी पता नहीं था कि अलग -अलग बड़े भाषा मॉडल (एलएलएम) छवि निर्माण और कोड निष्पादन जैसी क्षमताओं को शक्ति प्रदान कर रहे थे।

कंपनी का कहना है कि पेरप्लेक्सिटी लैब्स डेटा को स्ट्रक्चरिंग डेटा, फॉर्मूले को लागू करने और चार्ट और डॉक्यूमेंट बनाने जैसे कार्यों को करने के लिए कोड लिख और निष्पादित कर सकते हैं। कार्य के दौरान बनाई गई किसी भी दस्तावेज, कोड फ़ाइलों, चार्ट और छवियों को एक अलग संपत्ति टैब में जोड़ा जाता है। उपयोगकर्ता इन फ़ाइलों को वहां से देख और डाउनलोड कर सकते हैं। एक ऐप टैब भी है जो बुनियादी डैशबोर्ड, स्लाइडशो और वेबसाइटों के निर्माण में सक्षम बनाता है।

सुविधा का विवरण यह एक एजेंट की क्षमता की तरह ध्वनि करता है। विकलता कहते हैं कि “स्व-पर्यवेक्षित” कार्यों को पूरा करने में 10 मिनट या उससे अधिक समय लग सकता है। जबकि उपयोगकर्ता चेन-ऑफ-थॉट (सीओटी) देख सकते हैं, यह स्पष्ट नहीं है कि वे प्रारंभिक संकेत को संपादित करने या परिणाम की दिशा को बदलने के लिए एआई को रोक या बाधित कर सकते हैं।

कंपनी ने उन कार्यों के उदाहरण भी साझा किए जो कि पेरप्लेक्सिटी लैब्स संभाल सकते हैं। इनमें एक विशिष्ट स्टॉक या इवेंट के आसपास एक ट्रेडिंग रणनीति बनाना, एक दृश्य स्टोरीबोर्ड और पटकथा के साथ एक शैली-मिश्रित फिल्म अवधारणा उत्पन्न करना, कंपनी प्रोफाइल बनाना, या तुलनात्मक डेटा विज़ुअलाइज़ेशन बनाना शामिल है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube।

ओप्पो ने एन 5 फ्लिप को विकास में कथित तौर पर पाते हैं, नए कैमरा लेआउट के साथ अद्यतन डिजाइन पर स्कीमैटिक्स संकेत

Continue Reading

AI & Automation

Gmail Google कार्यक्षेत्र के साथ मिथुन एआई-संचालित सारांश कार्ड का परिचय देता है

Published
2 days ago
on
May 30, 2025

By
admin

Google कार्यक्षेत्र के हिस्से के रूप में Gmail को आर्टिफिशियल इंटेलिजेंस (AI) द्वारा संचालित एक नई फीचर के साथ अपडेट किया गया है, जिसमें ड्रॉप हो सकता है। माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की है कि यह ईमेल में सारांश कार्ड जोड़ रहा है जो या तो बहुत लंबे हैं, या एक लंबे ईमेल थ्रेड का हिस्सा हैं। ये सारांश कार्ड उपयोगकर्ताओं को संदेश के बारे में संदर्भ प्रदान करने के लिए ईमेल के शीर्ष पर स्वचालित रूप से दिखाई देंगे, और मिथुन एआई का उपयोग करके उत्पन्न होते हैं। नवीनतम अपडेट में Google चैट, Google डॉक्स और Google मीट में नई AI सुविधाएँ भी शामिल हैं।

Gmail अब AI सारांश स्वचालित रूप से दिखाता है

Google कार्यक्षेत्र उपयोगकर्ता जिनके पास सेवा के लिए एक सक्रिय सदस्यता है, अब देखेंगे gmail पर ईमेल सारांश एक अलग तरीके से, कंपनी के अनुसार। इससे पहले, उपयोगकर्ताओं को एक ईमेल खोलना था और विशेष ईमेल या थ्रेड का एआई-जनित सारांश देखने के लिए मिथुन आइकन पर टैप करना था।

Gmail में सारांश कार्ड
फोटो क्रेडिट: Google

नवीनतम अपडेट के साथ, मिथुन बुद्धिमानी से उन ईमेलों की पहचान करेंगे जिनके लिए एक सारांश की आवश्यकता होती है, और स्वचालित रूप से इसे ईमेल के शीर्ष पर रखे एक सारांश कार्ड में दिखाते हैं। जब भी लोग धागे का जवाब देते हैं, तो सारांश भी स्वचालित रूप से ताज़ा हो जाएगा। सारांश कार्ड को भी ढह सकता है जब उपयोगकर्ताओं को लगता है कि यह उपयोगी नहीं है।

गूगल चैट कुछ नई सुविधाएँ भी मिल रही हैं। मिथुन अब चैट के घर के दृश्य में संदेशों को संक्षेप में प्रस्तुत करेगा, इसलिए उपयोगकर्ता यह समझ सकते हैं कि किन संदेशों को उनके तत्काल ध्यान देने की आवश्यकता है। यह सुविधा अंग्रेजी, स्पेनिश और छह अन्य भाषाओं में उपलब्ध है।

मिथुन एक साझा कार्यक्षेत्र फ़ाइल की सामग्री का विश्लेषण और सारांश भी दे सकता है। इसलिए, यदि कोई सहकर्मी एक डॉक्टर या स्लाइड साझा करता है, तो उपयोगकर्ता दस्तावेज़ खोलने से पहले साइड पैनल में एक सारांश देख पाएगा।

गूगल डॉक्स एक नया एआई सुविधा भी मिल रही है जिसे सारांश बिल्डिंग ब्लॉक कहा जाता है। जब मिथुन एक दस्तावेज़ का सारांश उत्पन्न करता है, तो उपयोगकर्ता इसे शीर्ष पर सम्मिलित कर सकते हैं, जिससे दर्शकों को गोता लगाने से पहले संदर्भ को समझना आसान हो जाता है। हर बार दस्तावेज़ को संपादित किया जाता है, नवीनतम संस्करण दिखाने के लिए सारांश को ताज़ा किया जा सकता है।

कंपनी ने नए डायनेमिक लेआउट को भी उजागर किया है गूगल मीट यह उपयोगकर्ताओं को “कमरे” और “व्यक्तिगत” टाइलों के बीच चयन करने की अनुमति देता है। कमरे की टाइल के लिए आदर्श है जब एक ही डिवाइस का उपयोग कई प्रतिभागियों को दिखाने के लिए किया जा रहा है, जबकि व्यक्तिगत टाइल एकल प्रतिभागी के चेहरे पर केंद्रित है।

Continue Reading

AI & Automation

Microsoft टाउन हॉल में AI बिक्री को टाल देता है, बार्कलेज अनुबंध का खुलासा करता है

Published
2 days ago
on
May 30, 2025

By
admin

Microsoft ने गुरुवार को एक कंपनीव्यापी टाउन हॉल के दौरान कॉर्पोरेट ग्राहकों को आर्टिफिशियल इंटेलिजेंस (AI) टूल बेचने की प्रगति की, जिसमें बार्कलेज पीएलसी के साथ एक प्रमुख सौदा भी शामिल था।

मुख्य वाणिज्यिक अधिकारी जुडसन अल्थॉफ ने कर्मचारियों को बताया कि इवेंट से परिचित लोगों के अनुसार, बार्कलेज ने माइक्रोसॉफ्ट के कोपिलॉट एआई सहायकों के लिए 100,000 लाइसेंस खरीदने के लिए सहमति व्यक्त की। अल्थॉफ ने यह भी कहा कि कई दर्जन ग्राहकों – जिनमें एक्सेंचर, टोयोटा मोटर, वोक्सवैगन एजी और सीमेंस एजी शामिल हैं – में 100,000 से अधिक कोपिलॉट उपयोगकर्ता हैं, जो लोगों के अनुसार, जिन्होंने आंतरिक टिप्पणियों पर चर्चा करने के लिए गुमनामी का अनुरोध किया था।

माइक्रोसॉफ्ट कोपिलॉट को अपनाने पर ध्यान केंद्रित कर रहा है और बारीकी से ट्रैक कर रहा है कि ग्राहक कार्यबल का कौन सा हिस्सा टूल, मुख्य कार्यकारी अधिकारी का उपयोग कर रहा है सत्य नडेला घटना के दौरान कहा। प्रति माह $ 30 (लगभग 2,566 रुपये) की सूची की कीमतों पर, अल्थॉफ द्वारा उद्धृत सौदों में से प्रत्येक में प्रति वर्ष लाखों डॉलर के दसियों के लायक होंगे – हालांकि बड़े ग्राहकों को आमतौर पर थोक छूट मिलती है।

Microsoft ने टिप्पणी करने से इनकार कर दिया। बार्कलेज, एक्सेंचर, टोयोटा, वोक्सवैगन और सीमेंस के प्रतिनिधियों ने टिप्पणी नहीं की।

दुनिया के सबसे बड़े सॉफ्टवेयर निर्माता को एआई उत्पादों के व्यवसायीकरण में एक नेता माना जाता है, इसके साथ घनिष्ठ साझेदारी के लिए धन्यवाद चटपट निर्माता ओपनईऔर उत्पादकता अनुप्रयोगों के अपने सूट में कोपिलॉट एम्बेड कर रहा है।

फिर भी, वॉल स्ट्रीट इस बात के सबूतों को देखने के लिए उत्सुक है कि मल्टीबिलियन-डॉलर का दांव भुगतान कर रहा है। जनवरी में, Microsoft ने कहा कि इसका AI सूट – क्लाउड इन्फ्रास्ट्रक्चर और AI अनुप्रयोगों सहित – वार्षिक राजस्व में कम से कम $ 13 बिलियन (लगभग 111,211 करोड़ रुपये) में लाने के लिए गति पर था।

कंपनी ने प्लेंटीफुल उपाख्यानों की पेशकश की है, जिसमें बताया गया है कि कॉर्पोरेट ग्राहक कैसे कोपिलॉट, माइक्रोसॉफ्ट के हस्ताक्षर एआई उत्पाद को ले रहे हैं, लेकिन कुल ग्राहक की गिनती या उन बिक्री के वित्तीय प्रभाव का खुलासा नहीं किया है। कुछ कॉर्पोरेट ग्राहकों का कहना है कि उपकरणों को बहुत सारे आंतरिक ट्वीक और कर्मचारी प्रशिक्षण की आवश्यकता होती है, और कई लोग एक के रूप में कोपिलॉट के अपने उपयोग का वर्णन करते हैं मापा रोलआउट और ट्रायल की श्रृंखला, अपने सभी कर्मियों को महंगा सॉफ्टवेयर से लैस करने के लिए एक भीड़ के बजाय।

योजनाओं की घोषणा के बाद सप्ताह कुल्हाड़ी 6,000 श्रमिकया लगभग तीन प्रतिशत कार्यबल, कंपनी के पास सैनिकों को रैली करने का भी कारण है। नडेला ने कटौती को संबोधित करके बैठक शुरू की, यह कहते हुए कि वे प्रदर्शन के बजाय एक पुनर्गठन से संबंधित थे। समाप्ति गिर गई मुश्किल कंपनी के उत्पादों का निर्माण करने वाले लोगों पर, यह दिखाते हुए कि एआई की उम्र में इंजीनियरिंग नौकरियों की गारंटी भी नहीं है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Published
3 days ago
on
May 29, 2025

By
admin

Google ने साइनगेमा की घोषणा की है, जो एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल है जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है। मॉडल, जो मॉडल ऑफ मॉडल का हिस्सा होगा, वर्तमान में माउंटेन व्यू-आधारित टेक दिग्गज द्वारा परीक्षण किया जा रहा है और इस साल के अंत में लॉन्च होने की उम्मीद है। अन्य सभी Gemma मॉडल के समान, Singgemma एक ओपन-सोर्स AI मॉडल भी होगा, जो व्यक्तियों और व्यवसायों के लिए उपलब्ध है। यह पहली बार Google I/O 2025 कीनोट के दौरान दिखाया गया था, और यह भाषण और सुनने की अक्षमता वाले लोगों की मदद करने के लिए डिज़ाइन किया गया है जो प्रभावी रूप से उन लोगों के साथ संवाद करते हैं जो साइन लैंग्वेज को नहीं समझते हैं।

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), Google डीपमाइंड के आधिकारिक हैंडल ने एआई मॉडल का एक डेमो और इसकी रिलीज की तारीख के बारे में कुछ विवरण साझा किए। हालाँकि, यह पहली बार नहीं है जब हमने साइनगेममा को देखा है। यह भी संक्षेप में Google I/O इवेंट में Gus Martin, Gemma Product Manager द्वारा दीपमाइंड में दिखाया गया था।

हम SignGemma की घोषणा करने के लिए रोमांचित हैं, जो कि साइन लैंग्वेज को बोले गए पाठ में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल है। 🧏

यह खुला मॉडल इस साल के अंत में जेम्मा मॉडल परिवार में आ रहा है, जिसमें समावेशी तकनीक के लिए नई संभावनाएं हैं।

अपनी प्रतिक्रिया और रुचि को जल्दी साझा करें … pic.twitter.com/nhl9g5y8ta

– Google DeepMind (@googledeepmind) 27 मई, 2025

शोकेस के दौरान, मार्टिंस ने इस बात पर प्रकाश डाला कि एआई मॉडल वास्तविक समय में साइन लैंग्वेज से टेक्स्ट ट्रांसलेशन प्रदान करने में सक्षम है, जिससे आमने-सामने संचार को सहज बना दिया गया है। मॉडल को साइन भाषाओं के विभिन्न शैलियों के डेटासेट पर भी प्रशिक्षित किया गया था, हालांकि, यह अंग्रेजी भाषा में अनुवाद करते समय अमेरिकी साइन लैंग्वेज (एएसएल) के साथ सर्वश्रेष्ठ प्रदर्शन करता है।

अनुसार बहुभाषी के लिए, चूंकि यह एक ओपन-सोर्स मॉडल है, इसलिए SignGemma इंटरनेट से कनेक्ट करने की आवश्यकता के बिना कार्य कर सकता है। यह सीमित कनेक्टिविटी वाले क्षेत्रों में उपयोग करने के लिए उपयुक्त बनाता है। यह कहा जाता है मिथुन नैनो फ्रेमवर्क और हाथ के आंदोलनों, आकृतियों और चेहरे के भावों को ट्रैक और विश्लेषण करने के लिए एक विज़न ट्रांसफार्मर का उपयोग करता है। डेवलपर्स के लिए इसे उपलब्ध कराने से परे, गूगल मॉडल को अपने मौजूदा एआई टूल में एकीकृत कर सकता है, जैसे कि मिथुन लाइव।

इसे “साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल” कहते हुए, दीपमाइंड ने इस बात पर प्रकाश डाला कि यह इस साल के अंत में जारी किया जाएगा। एक्सेसिबिलिटी-केंद्रित बड़े भाषा मॉडल वर्तमान में अपने शुरुआती परीक्षण चरण में है, और टेक दिग्गज ने एक प्रकाशित किया है ब्याज -रूप व्यक्तियों को इसे आज़माने और प्रतिक्रिया प्रदान करने के लिए आमंत्रित करने के लिए।

Continue Reading

AI & Automation

Xbox मोबाइल ऐप्स पर सार्वजनिक परीक्षण में अब गेमिंग एआई चैटबॉट के लिए Microsoft का कोपिलॉट

Published
3 days ago
on
May 29, 2025

By
admin

Microsoft ने बुधवार को गेमिंग के लिए Xbox गेमर्स, कोपिलॉट के लिए अपने आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट का सार्वजनिक परीक्षण शुरू किया। यह वर्तमान में iOS और Android उपकरणों पर मोबाइल के लिए Xbox ऐप के बीटा संस्करण में उपलब्ध है। रेडमंड-आधारित टेक दिग्गज ने कहा कि एआई चैटबॉट खेलों के बारे में प्रश्नों का जवाब दे सकता है, एक खेल में एक स्तर को हराने के लिए सुझाव प्रदान कर सकता है, और यहां तक कि एक उपयोगकर्ता द्वारा खेले गए अन्य गेम के आधार पर खेलों को खेलने की सलाह भी देता है। कंपनी ने बीटा परीक्षकों को नए अनुभव के बारे में प्रतिक्रिया प्रदान करने के लिए भी कहा है।

गेमिंग के लिए कोपिलॉट गेमर्स के लिए दूसरी स्क्रीन के साथी के रूप में आता है

एक न्यूज़ रूम में डाकMicrosoft के Xbox डिवीजन ने व्यक्तियों का चयन करने के लिए चैटबॉट के रोलआउट की घोषणा की। इस शुरुआती परीक्षण में, गेमिंग के लिए कोपिलॉट आईओएस और एंड्रॉइड पर एक्सबॉक्स ऐप के बीटा संस्करण का उपयोग करने वालों के लिए उपलब्ध होगा। प्रारंभिक पूर्वावलोकन 18 या उससे अधिक उम्र के खिलाड़ियों के लिए अंग्रेजी भाषा में उपलब्ध है।

सह पायलट गेमिंग के लिए वर्तमान में ऑस्ट्रेलिया, ब्राजील, कनाडा, भारत, जापान, मलेशिया, न्यूजीलैंड, सिंगापुर, दक्षिण अफ्रीका और अमेरिका सहित बड़ी संख्या में क्षेत्रों में परीक्षण किया जा रहा है। वर्तमान में, एआई चैटबॉट यूरोपीय संघ देशों और यूके में उपलब्ध नहीं है। Microsoft ने कहा कि इन क्षेत्रों को बाद की तारीख में जोड़ा जाएगा।

गेमिंग के लिए कोपिलॉट
फोटो क्रेडिट: Xbox

चैटबॉट वर्तमान में एक दूसरी स्क्रीन पर उपलब्ध है, ताकि यह गेमर्स को उनके कोर गेमप्ले अनुभव से विचलित न करे। गेमिंग के लिए Copilot उपयोगकर्ता की Xbox गतिविधि का उपयोग कर सकता है, जिसमें खाता डेटा, खेल इतिहास और उपलब्धियां शामिल हैं, और उस जानकारी के आधार पर इसकी प्रतिक्रियाओं को संदर्भित कर सकते हैं। इसके अतिरिक्त, यह उपयोगकर्ताओं की सहायता के लिए वेब से जानकारी भी दे सकता है।

गेमिंग के लिए कोपिलॉट के इस संस्करण के साथ, उपयोगकर्ता किसी भी गेम के बारे में प्रश्न पूछ सकते हैं। उदाहरण के लिए, वे Minecraft में आवश्यक सामग्रियों के बारे में चैटबॉट से पूछ सकते हैं कि एक तलवार को तैयार करने के लिए या हॉगवर्ट्स विरासत में पहले परीक्षण के बॉस को कैसे हराया जाए। उपयोगकर्ता गेमिंग सिफारिशों के लिए चैटबॉट भी पूछ सकते हैं। वे या तो उस तरह के गेम का वर्णन कर सकते हैं जो वे खेलना चाहते हैं, या एआई उपयोगकर्ताओं के गेमिंग इतिहास के आधार पर नए गेम खेलने के लिए सुझाव दे सकता है।

इसके अतिरिक्त, उपयोगकर्ता अपने खेल के इतिहास या खातों के बारे में भी सवाल पूछ सकते हैं। ये प्रश्न उनकी Xbox उपलब्धियों या सदस्यता विवरण के आसपास हो सकते हैं।

Continue Reading

AI & Automation

$ 300 मिलियन XAI डील के बाद उपयोगकर्ताओं को ग्रोक चैटबॉट वितरित करने के लिए टेलीग्राम

Published
3 days ago
on
May 29, 2025

By
admin

एलोन मस्क के एआई स्टार्टअप XAI मैसेजिंग ऐप पर अपने ग्रोक चैटबॉट को तैनात करने के लिए टेलीग्राम $ 300 मिलियन (लगभग 2,564 करोड़ रुपये) का भुगतान करेंगे, जिसका उद्देश्य प्लेटफ़ॉर्म के एक बिलियन से अधिक उपयोगकर्ताओं को टैप करना है और उबालते कृत्रिम खुफिया बाजार में अपनी प्रतिस्पर्धी बढ़त को तेज करना होगा।

एक साल के सौदे के तहत, XAI भी दे देंगे तार मैसेजिंग ऐप, टेलीग्राम संस्थापक के माध्यम से की गई किसी भी सदस्यता बिक्री का आधा हिस्सा पावेल डुरोव बुधवार को पहले एक्स पर एक पोस्ट में कहा, यह कहते हुए कि $ 300 मिलियन (लगभग 2,564 करोड़ रुपये) का भुगतान नकद और स्टॉक में किया जाएगा।

ड्यूरोव ने कहा कि XAI केवल डेटा का उपयोग करेगा जो टेलीग्राम उपयोगकर्ता स्पष्ट रूप से साझा करते हैं घिसना प्रत्यक्ष बातचीत के माध्यम से।

कस्तूरी कहा कि एक्स पर पोस्ट के जवाब में कोई सौदा नहीं किया गया है, जिस पर डुरोव ने कहा कि पार्टियां सिद्धांत रूप में सहमत हैं लेकिन औपचारिकताएं लंबित थीं।

यह सौदा XAI प्रदान कर सकता है, जिसने इस साल की शुरुआत में X का अधिग्रहण किया था, जिसमें अपने AI मॉडल को प्रशिक्षित करने और विकसित करने के लिए मूल्यवान डेटा था।

कई ओपन-सोर्स रिपॉजिटरी थकने के साथ, एआई कंपनियों को गुणवत्ता वाले डेटा की सोर्सिंग में बढ़ती चुनौतियों का सामना करना पड़ता है, जैसे कि फर्मों को धक्का देना मेटा प्लेटफ़ॉर्म मॉडल प्रशिक्षण के लिए एआई के साथ सार्वजनिक बातचीत का उपयोग करने के लिए।

अपनी गोपनीयता नीति के अनुसार, एक्स अपने एआई मॉडल को प्रशिक्षित करने के लिए उपयोगकर्ताओं से सार्वजनिक पदों का उपयोग करता है। यह तुरंत स्पष्ट नहीं था कि क्या XAI टेलीग्राम से डेटा का समान रूप से उपयोग करेगा।

XAI, जिसने इस साल कई टाई-अप में प्रवेश किया है, एआई इन्फ्रास्ट्रक्चर और वित्तीय सेवाओं दोनों में अपनी स्थिति को बढ़ाने के लिए, टिप्पणी के लिए रॉयटर्स के अनुरोध का तुरंत जवाब नहीं दिया।

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

डीपसेक ने आर 1 मॉडल को अद्यतन किया, जैसे कि एआई रेस गर्म हो जाती है

Published
3 days ago
on
May 29, 2025

By
admin

दीपसेक ने कहा कि इसने आर 1 आर्टिफिशियल-इंटेलिजेंस मॉडल को अपग्रेड किया है जिसने इस साल की शुरुआत में चीनी स्टार्टअप को वैश्विक प्रमुखता के लिए प्रेरित करने में मदद की है।

दीपसेक एक अधिकारी में एक कंपनी के प्रतिनिधि के पद के अनुसार, इसे “मामूली परीक्षण अपग्रेड” के रूप में वर्णित किया और उपयोगकर्ताओं को बताया कि वे इसका परीक्षण शुरू कर सकते हैं। WeChat बुधवार को समूह।

हांग्जो-आधारित स्टार्टअप वैश्विक तकनीकी उद्योग को चौंका दिया जनवरी में जब इसने आर 1 का अनावरण किया, तो एक एआई मॉडल जिसने पश्चिमी खिलाड़ियों को कई मानकीकृत मैट्रिक्स पर पछाड़ दिया, जो कि केवल कई मिलियन डॉलर की लागत से कथित तौर पर था। इसने वैश्विक तकनीकी शेयरों में एक मार्ग को ट्रिगर किया क्योंकि निवेशकों ने सवाल किया कि क्या अग्रणी फर्मों को अभी भी महत्वपूर्ण मात्रा में खर्च करने की आवश्यकता होगी ऐ सेवाएं।

R1 की शुरुआत भी चला जाना चीन में अतिरिक्त एआई मॉडल लॉन्च करने की दौड़। संस्थापक लिआंग वेनफेंग देश की सबसे अच्छी सिलिकॉन वैली के साथ प्रतिस्पर्धा करने की क्षमता का प्रतीक बन गए।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube।

सैमसंग गैलेक्सी S26 श्रृंखला थिनर लेंस मॉड्यूल को सक्षम करने के लिए इंकजेट प्रिंटिंग का उपयोग करने के लिए: रिपोर्ट

Xiaomi RS रिपोर्ट करता है। Q1 2025 में 1.31 लाख करोड़ राजस्व, रु। 1.2 लाख करोड़ का निशान फिर से

Continue Reading

AI & Automation

ओपनई की वायरल घिबली ट्रेंड एक गोपनीयता खदान हो सकती है, विशेषज्ञों का कहना है

Published
3 days ago
on
May 29, 2025

By
admin

जब तक आप पूरी तरह से सोशल मीडिया और इंटरनेट पॉप संस्कृति से एक चट्टान या परहेज के नीचे रहते हैं, तब तक आपको कम से कम घिबली प्रवृत्ति के बारे में सुना होगा, अगर हजारों छवियों को लोकप्रिय सामाजिक प्लेटफार्मों में बाढ़ नहीं करते देखा गया है। पिछले कुछ हफ्तों में, लाखों व्यक्तियों ने अपनी छवियों को स्टूडियो घिबली-शैली की कला में बदलने के लिए Openai की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट का उपयोग किया है। हयाओ मियाजाकी की फिल्मों की सनकी, हाथ से तैयार सौंदर्यशास्त्र में व्यक्तिगत तस्वीरों, मेमों और ऐतिहासिक दृश्यों को बदलने की उपकरण की क्षमता, जैसे कि स्पिरिटेड अवे और मेरे पड़ोसी टोटरो की तरह, लाखों लोगों ने इस पर अपने हाथों की कोशिश की है।

इस प्रवृत्ति के परिणामस्वरूप Openai के AI चैटबोट के लिए लोकप्रियता में भारी वृद्धि हुई है। हालांकि, जबकि व्यक्ति खुशी से अपने, अपने परिवार और दोस्तों की चैटबॉट छवियों को खिला रहे हैं, विशेषज्ञों ने वायरल घिबली प्रवृत्ति पर गोपनीयता और डेटा सुरक्षा चिंताओं को उठाया है। ये कोई तुच्छ चिंता भी नहीं हैं। विशेषज्ञों पर प्रकाश डाला गया है कि अपनी छवियों को जमा करके, उपयोगकर्ता संभावित रूप से कंपनी को इन छवियों पर अपने एआई मॉडल को प्रशिक्षित करने दे रहे हैं।

इसके अतिरिक्त, एक दूर की नापाक समस्या यह है कि उनके चेहरे का डेटा हमेशा के लिए इंटरनेट का हिस्सा हो सकता है, जिससे गोपनीयता का स्थायी नुकसान हो सकता है। बुरे अभिनेताओं के हाथों में, यह डेटा साइबर क्राइम जैसे पहचान की चोरी भी कर सकता है। इसलिए, अब जब धूल जम गई है, तो आइए हम ओपनई के घिबली प्रवृत्ति के गहरे निहितार्थों को तोड़ दें, जिसमें वैश्विक भागीदारी देखी गई है।

घिबली प्रवृत्ति की उत्पत्ति और उदय

ओपनई मार्च के अंतिम सप्ताह में CHATGPT में देशी छवि पीढ़ी सुविधा का परिचय दिया। GPT-4O आर्टिफिशियल इंटेलिजेंस (AI) मॉडल में जोड़ी गई नई क्षमताओं द्वारा संचालित, यह फीचर पहली बार प्लेटफ़ॉर्म के भुगतान किए गए उपयोगकर्ताओं के लिए जारी किया गया था, और एक हफ्ते बाद, इसे फ्री टियर पर भी उन लोगों के लिए विस्तारित किया गया था। जबकि चटपट Dall-E मॉडल के माध्यम से छवियां उत्पन्न कर सकते हैं, GPT-4O मॉडल ने बेहतर क्षमताओं को लाया, जैसे कि एक इनपुट के रूप में एक छवि को जोड़ना, बेहतर पाठ प्रतिपादन, और इनलाइन संपादन के लिए उच्च त्वरित पालन।

सुविधाओं के शुरुआती अपनाने वालों ने जल्दी से प्रयोग करना शुरू कर दिया, और इनपुट के रूप में छवियों को जोड़ने की क्षमता एक लोकप्रिय हो गई क्योंकि यह देखने के लिए बहुत अधिक मजेदार है कि आपकी तस्वीरों को कलाकृति में बदल दिया जाए, जो पाठ संकेतों का उपयोग करके जेनेरिक छवियों को बनाने की तुलना में कलाकृति में बदल जाए। हालांकि ट्रेंड के सच्चे प्रवर्तक का पता लगाना अविश्वसनीय रूप से मुश्किल है, सॉफ्टवेयर इंजीनियर और एआई उत्साही ग्रांट स्लैटन को लोकप्रिय के रूप में श्रेय दिया जाता है।

उसका डाकजहां उन्होंने अपनी, अपनी पत्नी और अपने पारिवारिक कुत्ते की एक छवि को सौंदर्य-घिबली-शैली की कला में बदल दिया, इसे लिखने के समय 52 मिलियन से अधिक बार देखा, 16,000 बुकमार्क और 5,900 रेपोस्ट।

हालांकि, Ghibli- शैली की छवियों को बनाने वाले उपयोगकर्ताओं की कुल संख्या पर सटीक आंकड़े उपलब्ध नहीं हैं, ऊपर दिए गए संकेतक, X (पूर्व में ट्विटर के रूप में जाना जाता है), फेसबुक, इंस्टाग्राम और Reddit जैसे सोशल मीडिया प्लेटफार्मों पर इन छवियों के व्यापक साझाकरण के साथ, सुझाव देते हैं कि भागीदारी लाखों में हो सकती है।

यह प्रवृत्ति व्यक्तिगत उपयोगकर्ताओं से परे भी बढ़ी है, ब्रांड और यहां तक कि सरकारी संस्थाओं के साथ, जैसे कि भारत सरकार की मायगोविंडिया एक्स खाताghibli-inspired विजुअल बनाकर भाग लेना। सचिन तेंदुलकर, अमिताभ बच्चन जैसी हस्तियों को भी सोशल मीडिया पर इन छवियों को साझा करते हुए देखा गया था।

गोपनीयता और डेटा सुरक्षा चिंताओं को घिबली प्रवृत्ति के पीछे

इसके समर्थन के अनुसार पृष्ठोंOpenAI अपने AI मॉडल को प्रशिक्षित करने के लिए, पाठ, चित्र और फ़ाइल अपलोड सहित उपयोगकर्ता सामग्री एकत्र करता है। प्लेटफ़ॉर्म पर एक ऑप्ट-आउट विधि उपलब्ध है, जो सक्रिय है जो कंपनी को उपयोगकर्ता के डेटा को इकट्ठा करने से मना कर देगा। हालांकि, कंपनी उपयोगकर्ताओं को स्पष्ट रूप से उस विकल्प के बारे में नहीं बताती है कि यह एआई मॉडल को प्रशिक्षित करने के लिए डेटा एकत्र करता है जब वे पहली बार प्लेटफ़ॉर्म को पंजीकृत और एक्सेस कर रहे होते हैं (यह CHATGPT का हिस्सा है उपयोग की शर्तेंलेकिन अधिकांश उपयोगकर्ता यह नहीं पढ़ते हैं। “स्पष्ट” भाग एक पॉप-अप पेज को संदर्भित करता है जो डेटा संग्रह और ऑप्ट-आउट तंत्र को उजागर करता है)।

इसका मतलब है कि अधिकांश सामान्य उपयोगकर्ता, जिनमें शामिल हैं, जो घिबली-शैली की कला उत्पन्न करने के लिए अपनी छवियों को साझा कर रहे हैं, उन्हें गोपनीयता नियंत्रण के बारे में कोई जानकारी नहीं है, और वे डिफ़ॉल्ट रूप से एआई फर्म के साथ अपना डेटा साझा करते हैं। तो, वास्तव में इस डेटा का क्या होता है?

ओपनई के अनुसार सहायता पृष्ठजब तक कोई उपयोगकर्ता मैन्युअल रूप से चैट को हटाता है, तब तक डेटा को उसके सर्वर पर सदा के लिए संग्रहीत किया जाता है। डेटा को हटाने के बाद भी, अपने सर्वर से स्थायी विलोपन 30 दिन तक का समय लग सकता है। हालांकि, जब उपयोगकर्ता डेटा OpenAI के साथ साझा किया जाता है, तो कंपनी अपने AI मॉडल को प्रशिक्षित करने के लिए डेटा का उपयोग कर सकती है (टीमों, उद्यम या शिक्षा योजनाओं पर लागू नहीं होती है)।

“जब किसी भी एआई मॉडल को किसी भी जानकारी पर पूर्व-प्रशिक्षित किया जाता है, तो यह मॉडल के मापदंडों का हिस्सा बन जाता है। भले ही कोई कंपनी अपने स्टोरेज सिस्टम से उपयोगकर्ता डेटा को हटा देती है, प्रशिक्षण प्रक्रिया को उलटना बेहद मुश्किल है। जबकि यह इनपुट डेटा को पुनर्जीवित करने की संभावना नहीं है, क्योंकि कंपनियों ने डिक्लासिफ़ायर को जोड़ दिया है, एआई मॉडल निश्चित रूप से डेटा से इसका लाभ उठाता है।”

लेकिन, क्या नुकसान है – कुछ पूछ सकते हैं। Openai या किसी भी अन्य AI प्लेटफॉर्म में यहां का नुकसान स्पष्ट सहमति के बिना उपयोगकर्ता डेटा एकत्र करना है कि उपयोगकर्ताओं को नहीं पता है और इसका उपयोग कैसे किया जाता है, इस पर कोई नियंत्रण नहीं है।

“एक बार जब कोई फोटो अपलोड हो जाता है, तो यह हमेशा स्पष्ट नहीं होता है कि प्लेटफ़ॉर्म इसके साथ क्या करता है।

मुखर्जी ने यह भी बताया कि डेटा ब्रीच की दुर्लभ घटना में, जहां उपयोगकर्ता डेटा बुरे अभिनेताओं द्वारा चुराया जाता है, परिणाम गंभीर हो सकते हैं। डीपफेक के उदय के साथ, बुरे अभिनेता नकली सामग्री बनाने के लिए डेटा का दुरुपयोग कर सकते हैं जो व्यक्तियों की प्रतिष्ठा या यहां तक कि पहचान धोखाधड़ी जैसे परिदृश्यों को नुकसान पहुंचाता है।

परिणाम लंबे समय तक चलने वाले हो सकते हैं

आशावादी पाठकों के लिए एक मामला बनाया जा सकता है कि एक डेटा उल्लंघन एक दुर्लभ संभावना है। हालांकि, वे व्यक्ति चेहरे की विशेषताओं के साथ आने वाली स्थायित्व की समस्या पर विचार नहीं कर रहे हैं।

क्लाउडसेक के शोधकर्ता गगन अग्रवाल ने कहा, “व्यक्तिगत पहचान योग्य जानकारी (पीआईआई) या कार्ड के विवरण के विपरीत, जिनमें से सभी को बदला/बदला जा सकता है, चेहरे की विशेषताओं को स्थायी रूप से डिजिटल पदचिह्न के रूप में छोड़ दिया जाता है, गोपनीयता के लिए एक स्थायी नुकसान छोड़ दिया।”

इसका मतलब यह है कि भले ही एक डेटा ब्रीच 20 साल बाद होता है, जिनकी छवियां लीक हो जाती हैं, उन्हें अभी भी सुरक्षा जोखिमों का सामना करना पड़ेगा। अग्रवाल ने कहा कि आज, इस तरह के ओपन-सोर्स इंटेलिजेंस (OSINT) टूल मौजूद हैं जो इंटरनेट-वाइड फेस सर्च कर सकते हैं। यदि डेटासेट गलत हाथों में आता है, तो यह उन लाखों लोगों के लिए एक बड़ा जोखिम पैदा कर सकता है जिन्होंने घिबली प्रवृत्ति में भाग लिया था।

लेकिन समस्या केवल अधिक लोगों को क्लाउड-आधारित मॉडल और प्रौद्योगिकियों के साथ अपना डेटा साझा करने के लिए बढ़ाने वाली है। हाल के दिनों में, हमने देखा है Google ने अपने VEO 3 वीडियो जनरेशन मॉडल का परिचय दिया यह न केवल लोगों के हाइपरलिस्टिक वीडियो बना सकता है, बल्कि उनमें संवाद और पृष्ठभूमि ध्वनियों को भी शामिल कर सकता है। मॉडल छवि-आधारित वीडियो पीढ़ी का समर्थन करता है, जो जल्द ही एक और समान प्रवृत्ति को जन्म दे सकता है।

यहां विचार भय या व्यामोह बनाने के लिए नहीं है, बल्कि उन जोखिमों के बारे में जागरूकता उत्पन्न करने के लिए है जब उपयोगकर्ताओं को लगता है कि जब वे प्रतीत होता है कि निर्दोष इंटरनेट रुझानों में भाग लेते हैं या क्लाउड-आधारित एआई मॉडल के साथ डेटा साझा करते हैं। उसी का ज्ञान लोगों को भविष्य में अच्छी तरह से सूचित विकल्प बनाने में सक्षम करेगा।

जैसा कि मुखर्जी बताते हैं, “उपयोगकर्ताओं को डिजिटल मज़ा के लिए अपनी गोपनीयता का व्यापार नहीं करना चाहिए। पारदर्शिता, नियंत्रण और सुरक्षा को शुरू से ही अनुभव का हिस्सा बनने की आवश्यकता है।”

यह तकनीक अभी भी अपने नवजात चरण में है, और नई क्षमताओं के रूप में उभरने के बाद, अधिक रुझान दिखाई देने के लिए निश्चित हैं। घंटे की आवश्यकता को ध्यान में रखना है क्योंकि उपयोगकर्ता ऐसे उपकरणों के साथ बातचीत करते हैं। आग के बारे में पुरानी कहावत भी एआई पर लागू होती है: यह एक अच्छा सेवक है लेकिन एक बुरा गुरु है।

Continue Reading

AI & Automation

ओपेरा नियॉन एजेंटिक ब्राउज़र अनावरण किया गया, यात्राओं की योजना बनाने और वेबसाइटों का निर्माण करने के लिए एआई एजेंटों का उपयोग करता है

Published
4 days ago
on
May 28, 2025

By
admin

कंपनी के नवीनतम आर्टिफिशियल इंटेलिजेंस (एआई) एजेंट-संचालित ब्राउज़र, ओपेरा नियॉन का मंगलवार को अनावरण किया गया। नॉर्वेजियन टेक दिग्गज ने कहा कि एजेंटिक वेब के लिए नए ब्राउज़र का अनुभव विकसित किया जा रहा था, और यह फिर से बताता है कि एक ब्राउज़र कैसे दिखता है और कार्य करता है। यह एआई-संचालित एजेंटिक वर्कफ़्लोज़ के निर्माण पर केंद्रित है जो या तो उपयोगकर्ता के साथ काम करते हैं या पृष्ठभूमि में स्वायत्त रूप से कार्य करते हैं। जबकि कंपनी ने कोई रिलीज की तारीख नहीं दी, उसने कहा कि ओपेरा नियॉन जल्द ही सीमित, आमंत्रित-केवल पहुंच के साथ रिलीज़ होगा।

ओपेरा अपने एआई एजेंट-संचालित वेब ब्राउज़िंग प्लेटफॉर्म का अनावरण करता है

की एक श्रृंखला में पदों एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपेरा के आधिकारिक हैंडल ने नए एजेंटिक वेब ब्राउज़र की घोषणा की। नए ब्राउज़र का वर्णन करते हुए, कंपनी ने कहा, “ओपेरा नियॉन आपके साथ या आपके लिए ब्राउज़ कर सकता है, कार्रवाई कर सकता है और आपको काम करने में मदद कर सकता है।” विशेष रूप से, कंपनी पहले अपने समुदाय के सदस्यों को आमंत्रित आधार पर ब्राउज़र तक पहुंच प्रदान करेगी, और बाद में यह एक भुगतान सदस्यता के हिस्से के रूप में उपलब्ध होगी। ओपेरा भी एक खोला है माइक्रोसाइट वेब ब्राउज़र के लिए जहां व्यक्ति एक वेटलिस्ट के लिए साइन अप कर सकते हैं ताकि इसे आज़माने के लिए आमंत्रित किया जा सके।

ओपेरा नियॉन में मुख्य रूप से तीन विशेषताएं हैं। पहले चैट कहा जाता है, जो एक चैटबॉट जैसा अनुभव है, जहां उपयोगकर्ता प्राकृतिक भाषा में अपने प्रश्नों को टाइप कर सकते हैं और एआई एजेंट जानकारी पाएंगे और इसे साझा करेंगे। यह वेब खोज फ़ंक्शन के साथ किसी भी अन्य AI चैटबॉट की तरह काम करता है। यह पाठ, अनुवाद, अनुसंधान विषय, और बहुत कुछ भी उत्पन्न कर सकता है।

दूसरी विशेषता, डब डू, को एक ब्राउज़र-आधारित एजेंट के रूप में वर्णित किया गया है जो कुछ कार्यों को पूरा कर सकता है जैसे कि एक रेस्तरां में एक टेबल बुक करना, यात्रा की योजना बनाना, और कार्ट में उत्पादों को जोड़ना। यह कंपनी के हाल ही में संचालित है अनावरण किया ब्राउज़र ऑपरेटर एआई एजेंट, और यह पृष्ठभूमि में स्वायत्त रूप से कार्यों को पूरा कर सकता है।

अंत में, मेक कंपनी की सबसे महत्वाकांक्षी पेशकश है। इसका उपयोग एक वेबसाइट बनाने, एक दस्तावेज़ बनाने या एक रेट्रो गेम विकसित करने के लिए किया जा सकता है। कंपनी ने अपने कामकाज में गहराई से नहीं देखा, लेकिन विवरण के आधार पर, यह एक कोडिंग एजेंट द्वारा संचालित प्रतीत होता है, Openai के कोडेक्स के समान।

इस समय कोई अन्य सुविधाएँ सामने नहीं आईं। हालांकि, कंपनी ने इस बात पर प्रकाश डाला कि ओपेरा नियॉन नए और अभिनव एजेंटिक विशेषताओं का परीक्षण करने के लिए अपने खेल के मैदान के रूप में कार्य करेगी।

Continue Reading

AI & Automation

एन्थ्रोपिक की क्लाउड एआई चैटबॉट को वॉयस मोड फीचर मिलता है, रियल-टाइम टू-वे वार्तालाप प्रदान करता है

Published
4 days ago
on
May 28, 2025

By
admin

एन्थ्रोपिक अंत में अपने क्लाउड चैटबॉट में वॉयस मोड क्षमता जोड़ रहा है। मंगलवार को, आर्टिफिशियल इंटेलिजेंस (एआई) फर्म ने रियल-टाइम टू-वे वॉयस वार्तालाप फीचर के रोलआउट की घोषणा की, जो क्लाउड के मोबाइल ऐप में उपलब्ध होगी। अपनी हाल ही में जारी वेब सर्च फीचर के समान, कंपनी को वॉयस मोड पार्टी में देर हो गई है, जिसमें ओपनआईएआई के चैट, Google की मिथुन, और माइक्रोसॉफ्ट के कोपिलॉट जैसे प्रमुख प्रतियोगियों के साथ पहले से ही इस सुविधा की पेशकश कर रहे हैं। एंथ्रोपिक वर्तमान में क्लाउड के सभी उपयोगकर्ताओं के लिए सुविधा को रोल कर रहा है, लेकिन कुछ प्रीमियम सुविधाएँ केवल भुगतान किए गए ग्राहकों के लिए उपलब्ध हैं।

क्लाउड अब आपसे बात कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), एंथ्रोपिक के आधिकारिक हैंडल ने वॉयस मोड फीचर को रिलीज़ करने की घोषणा की। यह वर्तमान में बीटा में उपलब्ध है और केवल अंग्रेजी भाषा का समर्थन करता है। क्लाउड उपयोगकर्ताओं को अगले कुछ हफ्तों में मोबाइल ऐप में सुविधा मिलेगी।

हम मोबाइल पर बीटा में वॉयस मोड को रोल कर रहे हैं।

वॉयस वार्तालाप शुरू करने की कोशिश करें और क्लाउड को अपने कैलेंडर को संक्षेप में प्रस्तुत करने या अपने डॉक्स को खोजने के लिए कहें। pic.twitter.com/xvo5vhiceb

– एन्थ्रोप्रोपिक (@एंथ्रोपिकाई) 27 मई, 2025

इसके समर्थन पर सुविधा का वर्णन करना पेजकंपनी ने कहा, “वॉयस मोड आपको अपने iOS और Android उपकरणों पर क्लाउड के साथ पूरी तरह से बोली जाने वाली बातचीत करने की अनुमति देता है।” यह अनिवार्य रूप से एक वास्तविक समय के दो-तरफ़ा वॉयस वार्तालाप सुविधा है, जो कि मिथुन लाइव और चैट के उन्नत वॉयस मोड के समान है। कंपनी द्वारा साझा किए गए एक डेमो के आधार पर, आवाज अभिव्यंजक नहीं है, लेकिन यह एक पाठ-से-भाषण (टीटीएस)-जैसे रोबोट आवाज भी नहीं है। क्लाउड धाराप्रवाह प्रतिक्रिया करता है, लेकिन एक तटस्थ स्वर में।

क्लाउड के वॉयस मोड का एक अनूठा पहलू यह है कि उपयोगकर्ता एआई के साथ बातचीत करते समय स्क्रीन पर बातचीत से प्रमुख बिंदु देख सकते हैं। उपयोगकर्ता प्रवाह को बाधित किए बिना, एक ही बातचीत के भीतर पाठ और वॉयस मोड के बीच भी स्विच कर सकते हैं। पेड सब्सक्राइबर वॉयस वार्तालापों के माध्यम से अपने Google डॉक्स, कैलेंडर, जीमेल और वेब खोजों तक भी पहुंच सकते हैं।

फीचर का उपयोग करने के लिए, उपयोगकर्ताओं को क्लाउड मोबाइल ऐप खोलना होगा और टेक्स्ट फ़ील्ड के भीतर स्थित वॉयस मोड बटन (माइक्रोफोन आइकन के बगल में साउंड वेव आइकन) पर टैप करना होगा। उपयोगकर्ता तब कई आवाज विकल्पों में से चुनने में सक्षम होंगे। एक बार जब उन्होंने अपनी पसंदीदा आवाज उठाई, तो उपयोगकर्ता वॉयस वार्तालाप शुरू कर सकते हैं।

वॉयस मोड क्लाउड में नियंत्रण करता है
फोटो क्रेडिट: एन्थ्रोपिक

वॉयस मोड इंटरफ़ेस कई नए बटन के साथ आता है। एक बार जब उपयोगकर्ता ने संदेश बोला, तो उन्हें संदेश भेजने के लिए अप तीर को टैप करना होगा। स्टॉप स्क्वायर क्लाउड की प्रतिक्रिया को बाधित करता है। प्लस आइकन कैमरा, फ़ोटो या फ़ाइलों को खोलता है, और एक्स बटन वॉयस मोड से बाहर निकलता है।

विशेष रूप से, के मुक्त स्तर पर क्लाउड सत्र सीमा को मारने से पहले लगभग 20-30 वॉयस मैसेज भेजने में सक्षम होंगे। यह सीमा दैनिक ताज़ा करेगी।

Continue Reading

Trending

Internet & Social Media2 months ago

ट्विटर एक्स बन जाता है: कैसे एलोन मस्क अपने 1999 में एक ‘सब कुछ ऐप’ बनाने के अपने सपने की ओर काम कर रहा है

AI & Automation2 months ago

Google चैट में मिथुन कार्यक्षेत्र उपयोगकर्ताओं के लिए रोल आउट, अपठित वार्तालापों को संक्षेप में प्रस्तुत कर सकता है

Tech News2 months ago

Poco X7 and X7 Pro Review: The Mid-Range Marvels

Tech News2 months ago

Realme 14 5g स्नैपड्रैगन 6 जनरल 4 SOC के साथ, बाईपास चार्जिंग लॉन्च: मूल्य, सुविधाएँ

Gadgets2 months ago

सैमसंग गैलेक्सी टैब S9+ विनिर्देशों geekbench पर टैबलेट सतहों के रूप में रिसाव: सभी विवरण

AI & Automation2 months ago

NDTV Gadgets 360 Awards 2025: Check out the Nominations for India’s Most Trusted Award Show

Gadgets2 months ago

Xiaomi Pad 6s Pro ने 22 फरवरी को लॉन्च करने की पुष्टि की; डिजाइन, प्रमुख विनिर्देशों का पता चला

Tech News2 months ago

Realme gt 7t ने कार्यों में होने के लिए इत्तला दे दी; एनएफसी समर्थन की पेशकश करने के लिए कहा

Gadgets3 months ago

Xiaomi Pad 7, Xiaomi Pad 7 Pro 11.2-इंच 3.2K डिस्प्ले के साथ, हाइपरोस 2 UI लॉन्च: मूल्य, विनिर्देश

Tech News3 months ago

POCO F7 प्रो कुंजी सुविधाओं की सतह ऑनलाइन; एक स्नैपड्रैगन 8 जनरल 3 एसओसी मिल सकता है

Tech News2 months ago

मोटोरोला एज 60 प्रो की लीक हुई छवियां कथित तौर पर एक नए बटन को शामिल करने की ओर संकेत करती हैं

Tech News2 months ago

NDTV Gadgets 360 Awards 2025: Check out the Nominations for India’s Most Trusted Award Show

Tech News3 months ago

Realme 14 Pro+ 5G अब भारत में 512GB स्टोरेज के साथ उपलब्ध है: मूल्य, उपलब्धता

Tech News3 months ago

सैमसंग वन यूआई 7 बीटा गैलेक्सी जेड फ्लिप 6, गैलेक्सी जेड फोल्ड 6 में भारत, यूएस, और बहुत कुछ का विस्तार करता है

Internet & Social Media2 months ago

ट्विटर ने स्वैच्छिक यूरोपीय संघ की विघटन कोड से बाहर निकलता है, लेकिन दायित्व बने हुए हैं, यूरोपीय संघ आयुक्त कहते हैं

AI & Automation2 months ago

Microsoft कथित तौर पर Microsoft 365 सदस्यता और लंबी पैदल यात्रा की कीमतों के साथ Copilot AI को बंडल करना

Tech News3 months ago

Xiaomi Holi बिक्री Redmi Note 14 5G, नोट 13 श्रृंखला और अन्य फोन पर छूट लाती है

Internet & Social Media2 months ago

Ray-Ban Meta Smart Glasses Review: Versatile and Practical

Internet & Social Media3 months ago

मेटा ने कथित तौर पर AI उपयोगकर्ताओं के ‘सैकड़ों हजारों’ को फेसबुक, इंस्टाग्राम पर जोड़ने की योजना बनाई है

Internet & Social Media2 months ago

एक्स वीडियो कॉलिंग सपोर्ट की पुष्टि सीईओ लिंडा याकारिनो ने एलोन मस्क के नेतृत्व वाली फर्म के रूप में कार्यक्षमता का विस्तार किया

Anil Ingenious

Tencent ने Hunyuanportrait, एक ओपन-सोर्स AI मॉडल को एनिमेटिंग पोर्ट्रेट के लिए लॉन्च किया

Tencent का Hunyuanportratit अभी भी जीवन के लिए चित्र ला सकता है

You may like

Leave a Reply Cancel reply

Leave a Reply

स्प्रेडशीट उत्पन्न करने, रिपोर्ट बनाने और वेब ऐप बनाने की क्षमता के साथ लॉन्च किए गए पेरप्लेक्सिटी लैब्स

किसी कार्य को पूरा करने में perplexity लैब्स को लगभग 10 मिनट लगते हैं

Gmail Google कार्यक्षेत्र के साथ मिथुन एआई-संचालित सारांश कार्ड का परिचय देता है

Gmail अब AI सारांश स्वचालित रूप से दिखाता है

Microsoft टाउन हॉल में AI बिक्री को टाल देता है, बार्कलेज अनुबंध का खुलासा करता है

Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

Xbox मोबाइल ऐप्स पर सार्वजनिक परीक्षण में अब गेमिंग एआई चैटबॉट के लिए Microsoft का कोपिलॉट

गेमिंग के लिए कोपिलॉट गेमर्स के लिए दूसरी स्क्रीन के साथी के रूप में आता है

$ 300 मिलियन XAI डील के बाद उपयोगकर्ताओं को ग्रोक चैटबॉट वितरित करने के लिए टेलीग्राम

डीपसेक ने आर 1 मॉडल को अद्यतन किया, जैसे कि एआई रेस गर्म हो जाती है

ओपनई की वायरल घिबली ट्रेंड एक गोपनीयता खदान हो सकती है, विशेषज्ञों का कहना है

घिबली प्रवृत्ति की उत्पत्ति और उदय

गोपनीयता और डेटा सुरक्षा चिंताओं को घिबली प्रवृत्ति के पीछे

परिणाम लंबे समय तक चलने वाले हो सकते हैं

ओपेरा अपने एआई एजेंट-संचालित वेब ब्राउज़िंग प्लेटफॉर्म का अनावरण करता है

एन्थ्रोपिक की क्लाउड एआई चैटबॉट को वॉयस मोड फीचर मिलता है, रियल-टाइम टू-वे वार्तालाप प्रदान करता है

क्लाउड अब आपसे बात कर सकता है

Trending

Leave a Reply
Cancel reply