Connect with us

AI & Automation

एन्थ्रोपिक की क्लाउड एआई चैटबॉट को वॉयस मोड फीचर मिलता है, रियल-टाइम टू-वे वार्तालाप प्रदान करता है

Published

on

एन्थ्रोपिक अंत में अपने क्लाउड चैटबॉट में वॉयस मोड क्षमता जोड़ रहा है। मंगलवार को, आर्टिफिशियल इंटेलिजेंस (एआई) फर्म ने रियल-टाइम टू-वे वॉयस वार्तालाप फीचर के रोलआउट की घोषणा की, जो क्लाउड के मोबाइल ऐप में उपलब्ध होगी। अपनी हाल ही में जारी वेब सर्च फीचर के समान, कंपनी को वॉयस मोड पार्टी में देर हो गई है, जिसमें ओपनआईएआई के चैट, Google की मिथुन, और माइक्रोसॉफ्ट के कोपिलॉट जैसे प्रमुख प्रतियोगियों के साथ पहले से ही इस सुविधा की पेशकश कर रहे हैं। एंथ्रोपिक वर्तमान में क्लाउड के सभी उपयोगकर्ताओं के लिए सुविधा को रोल कर रहा है, लेकिन कुछ प्रीमियम सुविधाएँ केवल भुगतान किए गए ग्राहकों के लिए उपलब्ध हैं।

क्लाउड अब आपसे बात कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), एंथ्रोपिक के आधिकारिक हैंडल ने वॉयस मोड फीचर को रिलीज़ करने की घोषणा की। यह वर्तमान में बीटा में उपलब्ध है और केवल अंग्रेजी भाषा का समर्थन करता है। क्लाउड उपयोगकर्ताओं को अगले कुछ हफ्तों में मोबाइल ऐप में सुविधा मिलेगी।

इसके समर्थन पर सुविधा का वर्णन करना पेजकंपनी ने कहा, “वॉयस मोड आपको अपने iOS और Android उपकरणों पर क्लाउड के साथ पूरी तरह से बोली जाने वाली बातचीत करने की अनुमति देता है।” यह अनिवार्य रूप से एक वास्तविक समय के दो-तरफ़ा वॉयस वार्तालाप सुविधा है, जो कि मिथुन लाइव और चैट के उन्नत वॉयस मोड के समान है। कंपनी द्वारा साझा किए गए एक डेमो के आधार पर, आवाज अभिव्यंजक नहीं है, लेकिन यह एक पाठ-से-भाषण (टीटीएस)-जैसे रोबोट आवाज भी नहीं है। क्लाउड धाराप्रवाह प्रतिक्रिया करता है, लेकिन एक तटस्थ स्वर में।

क्लाउड के वॉयस मोड का एक अनूठा पहलू यह है कि उपयोगकर्ता एआई के साथ बातचीत करते समय स्क्रीन पर बातचीत से प्रमुख बिंदु देख सकते हैं। उपयोगकर्ता प्रवाह को बाधित किए बिना, एक ही बातचीत के भीतर पाठ और वॉयस मोड के बीच भी स्विच कर सकते हैं। पेड सब्सक्राइबर वॉयस वार्तालापों के माध्यम से अपने Google डॉक्स, कैलेंडर, जीमेल और वेब खोजों तक भी पहुंच सकते हैं।

फीचर का उपयोग करने के लिए, उपयोगकर्ताओं को क्लाउड मोबाइल ऐप खोलना होगा और टेक्स्ट फ़ील्ड के भीतर स्थित वॉयस मोड बटन (माइक्रोफोन आइकन के बगल में साउंड वेव आइकन) पर टैप करना होगा। उपयोगकर्ता तब कई आवाज विकल्पों में से चुनने में सक्षम होंगे। एक बार जब उन्होंने अपनी पसंदीदा आवाज उठाई, तो उपयोगकर्ता वॉयस वार्तालाप शुरू कर सकते हैं।

क्लाउड वॉयस मोड क्लाउड वॉयस मोड को नियंत्रित करता है

वॉयस मोड क्लाउड में नियंत्रण करता है
फोटो क्रेडिट: एन्थ्रोपिक

वॉयस मोड इंटरफ़ेस कई नए बटन के साथ आता है। एक बार जब उपयोगकर्ता ने संदेश बोला, तो उन्हें संदेश भेजने के लिए अप तीर को टैप करना होगा। स्टॉप स्क्वायर क्लाउड की प्रतिक्रिया को बाधित करता है। प्लस आइकन कैमरा, फ़ोटो या फ़ाइलों को खोलता है, और एक्स बटन वॉयस मोड से बाहर निकलता है।

विशेष रूप से, के मुक्त स्तर पर क्लाउड सत्र सीमा को मारने से पहले लगभग 20-30 वॉयस मैसेज भेजने में सक्षम होंगे। यह सीमा दैनिक ताज़ा करेगी।


Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

Google AI एज गैलरी ऐप जो Android पर जारी AI मॉडल को स्थानीय रूप से चला सकता है

Published

on

By

Google AI एज गैलरी, Android के लिए एक नया ऐप, जो उपयोगकर्ताओं को एक डिवाइस पर स्थानीय रूप से आर्टिफिशियल इंटेलिजेंस (AI) मॉडल चलाने का अनुभव करने की अनुमति देता है, रविवार को जारी किया गया था। माउंटेन व्यू-आधारित टेक दिग्गज का कहना है कि प्रायोगिक ऐप इंटरनेट कनेक्शन की आवश्यकता के बिना पूरी तरह से ऑन-डिवाइस (एलएलएम) को ढूंढ, डाउनलोड और चला सकता है। वर्तमान में, केवल सीमित संख्या में उपयोग के मामले ऐप के माध्यम से उपलब्ध हैं, जिसमें चैटिंग, छवि विश्लेषण, साथ ही कुछ पाठ-आधारित और कोडिंग कार्यों शामिल हैं। कंपनी ने कहा कि ऐप का एक iOS संस्करण जल्द ही जारी किया जाएगा।

यह ऐप वर्तमान में टेक दिग्गज के GitHub पर “प्रायोगिक अल्फा रिलीज़” के रूप में उपलब्ध है प्रविष्टि। कंपनी ने एक एंड्रॉइड एप्लिकेशन पैकेज (एपीके) फ़ाइल प्रदान की है जिसे डाउनलोड किया जा सकता है, साथ ही इसे एंड्रॉइड डिवाइस पर स्थापित करने के लिए एक विस्तृत गाइड भी है। ऐप, जो 115MB आकार में है, एक अनुमेय Apache 2.0 लाइसेंस के साथ उपलब्ध है, जो अकादमिक और वाणिज्यिक उपयोग दोनों मामलों की अनुमति देता है।

गैजेट 360 स्टाफ सदस्य बिना किसी परेशानी के ऐप को डाउनलोड और इंस्टॉल करने में सक्षम थे। यदि आप APK फ़ाइलों को स्थापित करने के लिए नए हैं, तो Google ने एक विस्तृत गाइड प्रदान किया है यहाँ। हालाँकि, ध्यान दें कि APK फ़ाइलों को डाउनलोड करना और इंस्टॉल करना हमेशा एक जोखिम भरा कदम है क्योंकि ये ऐप एक विश्वसनीय ऐप मार्केटप्लेस द्वारा सत्यापित नहीं किए जाते हैं और इसमें मैलवेयर हो सकता है। विशेष रूप से, हमें इस ऐप में कोई मैलवेयर या वायरस नहीं मिला।

Google AI एज गैलरी ऐप AI मॉडल की एक सूची के साथ आता है जिसे उपयोगकर्ता अपने उपकरणों पर स्थानीय रूप से डाउनलोड और चला सकते हैं। मॉडल की यह सूची इस बात पर निर्भर करती है कि डिवाइस कितना नया है और इसमें एआई-सक्षम चिपसेट है या नहीं। इसके अतिरिक्त, ऐप उपयोगकर्ताओं को आयात करने और एक मॉडल चलाने देता है जो पहले से ही डिवाइस पर डाउनलोड किया गया है।

इस ऐप के साथ तीन प्राथमिक सुविधाएँ हैं जो उपयोगकर्ता इस ऐप का पता लगा सकते हैं। सबसे पहले आस्क इमेज है, जो एक छवि विश्लेषण सुविधा है। एक मॉडल डाउनलोड करने और चलाने के बाद, उपयोगकर्ता एक छवि अपलोड कर सकेंगे और इसके बारे में एआई प्रश्न पूछ सकेंगे। दूसरा एआई चैट है, जो उपयोगकर्ताओं को मॉडल के साथ बातचीत करने देता है। चूंकि ऐप केवल स्थानीय मॉडल का समर्थन करता है, इसलिए इन मॉडलों को अप-टू-डेट ज्ञान नहीं हो सकता है।

अंत में, तीसरी सुविधा प्रॉम्प्ट लैब है, जो कई एआई-संचालित सुविधाओं जैसे कि टोन-आधारित पुनर्लेखन, पाठ सारांश, फ्री-फॉर्म पीढ़ी, साथ ही कोड स्निपेट पीढ़ी के साथ एक स्थान है। विशेष रूप से, किसी भी एआई मॉडल को चलाने के दौरान, उपयोगकर्ता टोकन, तापमान, त्वरक, और बहुत कुछ जैसे पहलुओं को कॉन्फ़िगर करने में सक्षम होंगे। उपयोगकर्ता मॉडल के बेंचमार्क मेट्रिक्स की भी जांच कर सकते हैं।

Continue Reading

AI & Automation

मेटा कथित तौर पर जोखिम मूल्यांकन के लिए एआई के साथ मानव समीक्षकों को बदलने की योजना बना रहा है

Published

on

By

मेटा कथित तौर पर अपने उत्पादों और सुविधाओं के लिए आर्टिफिशियल इंटेलिजेंस (एआई) के लिए जोखिम आकलन के एक बड़े हिस्से को स्थानांतरित करने की योजना बना रहा है। रिपोर्ट के अनुसार, मेनलो पार्क-आधारित सोशल मीडिया दिग्गज एआई को अपनी विशेषताओं और उत्पाद अपडेट के अनुमोदन को संभालने पर विचार कर रहा है, जो अब तक विशेष रूप से मानव मूल्यांकनकर्ताओं द्वारा संभाला गया था। यह परिवर्तन कथित तौर पर नए एल्गोरिदम, नई सुरक्षा सुविधाओं और विभिन्न सोशल मीडिया प्लेटफार्मों में सामग्री को कैसे साझा किया जाता है, के अलावा प्रभावित करेगा। निर्णय कथित तौर पर नई सुविधाओं, अपडेट और उत्पादों को रोल आउट करने की गति को बढ़ावा देगा।

एक एनपीआर के अनुसार प्रतिवेदनमेटा सभी आंतरिक जोखिम आकलन के 90 प्रतिशत तक स्वचालित करने की योजना बना रहा है। प्रकाशन ने दावा किया कि कंपनी के दस्तावेज प्राप्त किए हैं जो रणनीति में संभावित बदलाव का विस्तार करते हैं।

अब तक, इंस्टाग्राम, व्हाट्सएप, फेसबुक, या थ्रेड्स के लिए किसी भी नई सुविधाओं या अपडेट को मानव विशेषज्ञों के एक समूह से गुजरना पड़ा है, जिन्होंने इस निहितार्थ की समीक्षा की है कि परिवर्तन उपयोगकर्ताओं को कैसे प्रभावित करेगा, चाहे वह उनकी गोपनीयता का उल्लंघन करेगा, या नाबालिगों को नुकसान पहुंचाएगा। मूल्यांकन, जिसे कथित तौर पर गोपनीयता और अखंडता समीक्षा के रूप में जाना जाता है, ने यह भी मूल्यांकन किया कि क्या एक सुविधा गलत सूचना या विषाक्त सामग्री में वृद्धि कर सकती है।

एआई जोखिम मूल्यांकन को संभालने के साथ, उत्पाद टीमों को कथित तौर पर नई सुविधा के बारे में एक प्रश्नावली भरने के बाद “त्वरित निर्णय” प्राप्त होगा। AI प्रणाली को या तो सुविधा को मंजूरी देने या आवश्यकताओं की एक सूची प्रदान करने के लिए कहा जाता है, जिसे परियोजना के आगे बढ़ने से पहले पूरा करने की आवश्यकता है। रिपोर्ट में दावा किया गया है कि उत्पाद टीम को यह सत्यापित करना होगा कि यह फीचर शुरू करने से पहले उन आवश्यकताओं को पूरा कर चुका है।

रिपोर्ट के अनुसार, कंपनी का मानना ​​है कि समीक्षा प्रक्रिया को एआई में स्थानांतरित करने से सुविधाओं और ऐप अपडेट के लिए रिलीज की गति में काफी वृद्धि होगी और उत्पाद टीमों को तेजी से काम करने की अनुमति मिलेगी। हालांकि, कुछ वर्तमान और पूर्व मेटा कर्मचारियों को कथित तौर पर इस बारे में चिंतित हैं कि क्या यह लाभ सख्त जांच की कीमत पर आएगा।

प्रकाशन के एक बयान में, मेटा कहा कि मानव समीक्षकों का उपयोग अभी भी “उपन्यास और जटिल मुद्दों” के लिए किया जा रहा था और एआई को केवल कम जोखिम वाले निर्णयों को संभालने की अनुमति दी गई थी। हालांकि, दस्तावेजों के आधार पर, रिपोर्ट में दावा किया गया है कि मेटा के नियोजित संक्रमण में एआई सुरक्षा, युवा जोखिम और अखंडता जैसे संभावित रूप से महत्वपूर्ण क्षेत्रों को संभालना शामिल है – एक क्षेत्र ने हिंसक सामग्री और “झूठ का प्रसार” जैसी वस्तुओं को संभालने के लिए कहा।

उत्पाद जोखिम आकलन से परिचित एक अनाम मेटा कर्मचारी ने एनपीआर को बताया कि स्वचालन प्रक्रिया अप्रैल में शुरू हुई और मई में जारी रही है। कर्मचारी को यह कहते हुए कहा, “मुझे लगता है कि यह काफी गैर -जिम्मेदाराना है कि हम क्यों मौजूद हैं। हम इस बात का मानवीय दृष्टिकोण प्रदान करते हैं कि चीजें कैसे गलत हो सकती हैं।”

विशेष रूप से, इस सप्ताह की शुरुआत में, मेटा जारी किया 2025 की पहली तिमाही के लिए इसकी अखंडता रिपोर्ट। रिपोर्ट में, कंपनी ने कहा, “हम एलएलएम को चुनिंदा नीति क्षेत्रों के लिए मानव प्रदर्शन से परे संचालित करते हुए देखना शुरू कर रहे हैं।”

सोशल मीडिया दिग्गज ने कहा कि उसने एआई मॉडल का उपयोग परिदृश्यों में समीक्षा कतारों से सामग्री को हटाने के लिए शुरू कर दिया है, जहां यह “अत्यधिक आश्वस्त” है कि उक्त सामग्री अपनी नीतियों का उल्लंघन नहीं करती है। इस कदम को सही ठहराते हुए, मेटा ने कहा, “यह हमारे समीक्षकों के लिए क्षमता को मुक्त करता है, जिससे उन्हें सामग्री पर अपनी विशेषज्ञता को प्राथमिकता देने की अनुमति मिलती है जो उल्लंघन की अधिक संभावना है।”

Continue Reading

AI & Automation

सैमसंग गैलेक्सी S26 श्रृंखला में कथित तौर पर मेजर एआई डील के पास कंपनियों के रूप में पेरप्लेक्सिटी ऐप शामिल है

Published

on

By

सैमसंग और पेरप्लेक्सिटी कथित तौर पर एक प्रमुख आर्टिफिशियल इंटेलिजेंस (एआई) सौदे के पास हैं, जो एआई ऐप को सैमसंग उपकरणों पर प्रीइंस्टॉल किया जाएगा। रिपोर्ट के अनुसार, आगामी गैलेक्सी S26 श्रृंखला पेरप्लेक्सिटी एआई ऐप और इसके हाल ही में लॉन्च किए गए एआई सहायक को बॉक्स से बाहर लॉन्च करने वाली पहली स्मार्टफोन हो सकती है। कथित तौर पर बहुआयामी सौदे में सैमसंग के लिए अपने वेब ब्राउज़र और बिक्सबी को पेरप्लेक्सिटी की खोज क्षमताओं के साथ एकीकृत करने के लिए एक विकल्प भी शामिल है। दक्षिण कोरियाई टेक दिग्गज अपने आगामी फंडिंग राउंड में एआई फर्म में भी निवेश कर सकते हैं।

एक प्रमुख एआई-केंद्रित सौदे के पास सैमसंग और पेरप्लेक्सिटी

एक ब्लूमबर्ग के अनुसार प्रतिवेदनसैमसंग और पेरप्लेक्सिटी ने हाल ही में एक व्यापक एआई सौदे के बारे में कई चर्चाएं की हैं। इस मामले से परिचित लोगों का हवाला देते हुए, रिपोर्ट में दावा किया गया कि सैमसंग अपने भविष्य के उपकरणों पर पेरप्लेक्सिटी ऐप और एआई सहायक को लोड कर सकता है। विशेष रूप से, एक पुरानी रिपोर्ट ने दावा किया कि दोनों संस्थाओं ने बातचीत शुरू की अप्रैल में एक एआई सौदे के बारे में।

आगे, SAMSUNG और Perplexity ने कथित तौर पर AI- संचालित ऑपरेटिंग सिस्टम और AI एजेंटों के लिए एक ऐप विकसित करने के बारे में चर्चा की है। ऐप को उपयोगकर्ताओं को एआई एजेंट बनाने के लिए कहा जाता है जो कि पेरप्लेक्सिटी के ऐप के साथ -साथ अन्य एआई सहायकों तक पहुंच सकते हैं।

एआई डील, जिसे समझौते के करीब कहा जाता है, को सैमसंग के वेब ब्राउज़र में एकीकृत होने वाले पेरप्लेक्सिटी के सर्च इंजन को भी देखा जा सकता है। इसके अतिरिक्त, कंपनी कथित तौर पर बिक्सबी वर्चुअल असिस्टेंट के भीतर एआई स्टार्टअप की क्षमताओं को भी जोड़ सकती है। इनके अलावा, टेक दिग्गज कथित तौर पर अपने अगले फंडिंग राउंड में पेरप्लेक्सिटी में निवेश करने की योजना बना रहे हैं। ब्लूमबर्ग के अनुसार, पेरप्लेक्सिटी $ 14 बिलियन (लगभग 1.1 लाख करोड़ रुपये) के मूल्यांकन पर, राउंड में $ 500 मिलियन (लगभग 4,270 करोड़ रुपये) जुटाना चाहती है।

रिपोर्ट के अनुसार, एआई सौदे की घोषणा इस साल जल्द ही की जा सकती है। हालांकि, विकलता एआई ऐप और एआई असिस्टेंट को पहले कहा जाता है कि गैलेक्सी S26 श्रृंखलाजो संभवतः जनवरी या फरवरी 2026 में पहुंच जाएगा। इन विवरणों को अंतिम नहीं कहा जाता है क्योंकि चर्चा चल रही है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


बिटकॉइन $ 104,900 तक गिर जाता है क्योंकि बाजार सुधार चरण से गुजरता है, अधिकांश altcoins नुकसान देखते हैं


Continue Reading

AI & Automation

Apple WWDC 2025 में कोई बड़ी AI घोषणा नहीं कर सकता है: रिपोर्ट

Published

on

By

Apple रिपोर्ट के अनुसार, 9-13 जून के बीच आयोजित होने वाले वर्ल्डवाइड डेवलपर्स कॉन्फ्रेंस (WWDC) 2025 में किसी भी प्रमुख कृत्रिम बुद्धिमत्ता (AI) की घोषणा करने की योजना नहीं बना रहा है। क्यूपर्टिनो-आधारित टेक दिग्गज को अभी भी अपनी पहले से घोषित एआई सुविधाओं पर शेड्यूल के पीछे कहा जाता है, और किसी भी नई सुविधाओं को पेश करने से बचेंगे, जो कि अपने ऑपरेटिंग सिस्टम के नए संस्करणों के समय तक तैयार नहीं होने के लिए तैयार नहीं हो सकते हैं। हालांकि, कंपनी अपने छोटे एआई मॉडल को थर्ड-पार्टी ऐप डेवलपर्स के लिए खोल सकती है और एआई-संचालित पावर मैनेजमेंट मोड का पूर्वावलोकन कर सकती है।

Apple इंटेलिजेंस WWDC 2025 में बैकसीट ले सकता है

उसकी शक्ति में न्यूजलैटरब्लूमबर्ग के मार्क गुरमन कहते हैं कि iPhone निर्माता के पास इसकी पाइपलाइन में कुछ AI उपकरण और विशेषताएं हैं, हालांकि, उन्हें इस साल जारी होने की संभावना नहीं है। Apple की WWDC योजनाओं से परिचित लोगों का हवाला देते हुए, रिपोर्ट में दावा किया गया कि इस साल के सम्मेलन में संभवतः किसी भी प्रमुख AI से संबंधित घोषणाओं को शामिल नहीं किया जाएगा और “Apple की कमियां (AI नेता के रूप में) और भी अधिक स्पष्ट हो सकती है।”

कंपनी अभी भी तीन एआई घोषणाएं कर सकती है, हालांकि। रिपोर्ट के अनुसार, Apple तीसरे पक्ष के ऐप डेवलपर्स को दे सकता था ऐप्स के भीतर एआई सुविधाओं को जोड़ने के लिए, या नए एआई-संचालित ऐप्स बनाने के लिए इसके इन-हाउस बड़े भाषा मॉडल (LLMS) तक पहुँचें। शुरू करने के लिए, टेक दिग्गज को अपने छोटे मॉडल को लगभग तीन बिलियन मापदंडों के साथ पेश करने के लिए कहा जाता है, जो पाठ-आधारित कार्यों को संभालते हैं।

अन्य रिपोर्ट की गई AI घोषणाओं में एक नया पावर मैनेजमेंट मोड शुरू करना शामिल है जो AI का उपयोग कुछ क्षमता में करेगा, AirPods के साथ अनुवाद ऐप का एकीकरण और महोदय मैऔर एआई-संचालित के रूप में सफारी ब्राउज़र और फोटो ऐप में कई मौजूदा सुविधाओं का एक संभावित रीब्रांडिंग।

गुरमन का दावा है कि इस वर्ष संभावित कमी एआई लाइनअप के बावजूद, कंपनी कई प्रमुख परियोजनाओं पर काम कर रही है जो आने वाले वर्षों में पेश की जा सकती हैं। उनमें से एक सिरी की अनिश्चित काल के लिए विलंबित विलंबित है। पिछले साल के WWDC पर, सेब दावा किया गया कि सिरी को जनरेटिव एआई क्षमताओं के साथ एकीकृत किया जाएगा, और यह संवादात्मक रूप से बोलने और प्रासंगिक आदेशों को समझने में सक्षम होगा।

Apple को भी काम करने के लिए कहा जाता है अपने शॉर्टकट ऐप में एआई क्षमताओं को जोड़ना और उपयोगकर्ताओं को प्राकृतिक भाषा संकेतों का उपयोग करके क्रियाएं बनाने दें। इसके अलावा, एक इन-हाउस एआई चैटबॉट जो वेब तक पहुंच सकता है, साथ ही एक एआई डॉक्टर सेवा भी जिसे आंतरिक रूप से शहतूत कहा जाता है, को भी कामों में कहा जाता है। ये सुविधाएँ कथित तौर पर 2026 में आ जाएंगी और अगले साल के WWDC का हिस्सा हो सकती हैं।

Continue Reading

AI & Automation

Apple ने WWDC 2025 में AI- संचालित क्षमताओं के साथ शॉर्टकट ऐप को ओवरहॉल किया

Published

on

By

सेब कहा जाता है कि इसके शॉर्टकट ऐप का एक सुधार तैयार किया जा रहा है। एक अनुभवी पत्रकार का दावा है कि क्यूपर्टिनो-आधारित टेक दिग्गज कृत्रिम बुद्धिमत्ता ला सकते हैं () Apple इंटेलिजेंस द्वारा संचालित क्षमताएं – iPhone, iPad और अन्य उपकरणों के लिए विशेषताओं के मालिकाना AI सूट – शॉर्टकट ऐप के लिए। रिपोर्ट बताती है कि यद्यपि Apple APP और WWDC 2025 में परिवर्तनों को डेमो करेगा, सार्वजनिक रिलीज 2026 तक देरी का सामना कर सकता है। शॉर्टकट ऐप में परिवर्तन उपयोगकर्ताओं को एक विशेष संगीत प्लेलिस्ट या अन्य कार्यों के निर्माण के लिए प्राकृतिक भाषा इंटरैक्शन में संलग्न करने में सक्षम हो सकता है।

शॉर्टकट ऐप ओवरहाल

के नवीनतम संस्करण में समाचार पत्र पर शक्तिब्लूमबर्ग के मार्क गुरमन ने अपने शॉर्टकट ऐप को ओवरहाल करने की Apple की योजनाओं पर प्रकाश डाला। कथित तौर पर विश्वव्यापी डेवलपर्स सम्मेलन में बदलावों की घोषणा की जाएगी (डब्ल्यूडब्ल्यूडीसी) 2025 जो 9 जून को कैलिफोर्निया के ऐप्पल पार्क में बंद हो जाता है। यह परियोजना Apple ऐप्स और ऑपरेटिंग सिस्टम में AI एकीकरण में सुधार की दिशा में एक बड़े धक्का का हिस्सा होने की उम्मीद है।

गुरमन के अनुसार, संशोधित शॉर्टकट ऐप उपयोगकर्ताओं को Apple इंटेलिजेंस मॉडल का उपयोग करके कस्टम इंटरैक्शन बनाने दे सकता है। उदाहरण के लिए, वे कथित तौर पर कुछ विशेषताओं को लॉन्च करने में सक्षम होंगे या iPhone, iPad और Mac जैसे Apple उपकरणों पर AI- संचालित शॉर्टकट का उपयोग करके एक चुनिंदा प्लेलिस्ट खेल सकते हैं।

जबकि WWDC 2025 उस गंतव्य होने की संभावना है जहां Apple शॉर्टकट्स ऐप के अपने ओवरहाल का पूर्वावलोकन करता है, उनमें से सभी को तुरंत जारी नहीं किया जा सकता है। गुरमन ने नोट किया कि जबकि इन परिवर्धन को पहले इस वर्ष पेश किए जाने की उम्मीद थी, देरी उन्हें 2026 तक धकेल सकती है।

एक बड़े मोर्चे पर, क्यूपर्टिनो-आधारित टेक दिग्गज को इस वर्ष के वार्षिक डेवलपर सम्मेलन के दौरान तृतीय-पक्ष डेवलपर्स के लिए अपने फाउंडेशन मॉडल, जिसमें लगभग तीन बिलियन पैरामीटर हैं, को खोलने की सूचना है। यह रचनाकारों को अपने ऑन-डिवाइस एआई तकनीक का लाभ उठाने दे सकता है जो वर्तमान में पाठ सारांश और अन्य हल्के कार्यों के लिए उपयोग किया जाता है। इस कदम के परिणामस्वरूप कई और अधिक सेब खुफिया-संचालित सुविधाओं की शुरुआत होने की उम्मीद है।

प्राथमिक जोड़ों में से एक एक अधिक संवादी इंटरफ़ेस के लिए अपने मूल में बड़े भाषा मॉडल (एलएलएम) द्वारा संचालित एक सिरी है। यह इसे सममूल्य पर लाने की संभावना है चैटगेट आवाज मोड। इस बीच, एक एआई डॉक्टर सेवा डब की गई शहतूत को भी एक पुन: डिज़ाइन किए गए स्वास्थ्य ऐप के साथ विकास में कहा जाता है, और इसे iOS 26 के लिए स्प्रिंग अपडेट के रूप में पेश किया जा सकता है। कंपनी कथित तौर पर एक चैटबॉट पर भी काम कर रही है जो चैट के लिए एक प्रतियोगी के रूप में काम करेगी। यह वेब से डेटा में खींचने में सक्षम हो सकता है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube



इस वर्ष लॉन्च से पहले मेटा कैंपस में iPad ऐप के लिए इंस्टाग्राम ‘सक्रिय रूप से परीक्षण किया जा रहा है: रिपोर्ट: रिपोर्ट


Continue Reading

AI & Automation

स्प्रेडशीट उत्पन्न करने, रिपोर्ट बनाने और वेब ऐप बनाने की क्षमता के साथ लॉन्च किए गए पेरप्लेक्सिटी लैब्स

Published

on

By

Perplexity Labs, एक नई कृत्रिम बुद्धिमत्ता (AI) फीचर पेरप्लेक्सिटी प्लेटफॉर्म के भीतर, गुरुवार को पेश किया गया था। कंपनी का कहना है कि नया मोड टेक्स्ट प्रॉम्प्ट को पूर्ण प्रोजेक्ट्स जैसे रिपोर्ट, स्प्रेडशीट और यहां तक ​​कि सरल वेब ऐप्स में बदल सकता है। Perplexity Labs उन जटिल कार्यों को करने के लिए गहरी वेब ब्राउज़िंग और कोड निष्पादन का उपयोग करता है जो प्लेटफ़ॉर्म के दायरे से परे थे। नई सुविधा सैन फ्रांसिस्को स्थित एआई फर्म द्वारा आईओएस के लिए पेरप्लेक्सिटी असिस्टेंट जारी होने के एक महीने बाद आई है।

किसी कार्य को पूरा करने में perplexity लैब्स को लगभग 10 मिनट लगते हैं

कंपनी का कहना है कि Perplexity Labs एक बढ़ाया संस्करण है गहरे अनुसंधान के लिए, और यह वर्तमान में सभी perplexity प्रो ग्राहकों के लिए उपलब्ध है। उत्तरार्द्ध जटिल प्रश्नों के व्यापक उत्तर उत्पन्न करता है जिन्हें आमतौर पर कई खोजों की आवश्यकता होती है। नई सुविधा, कई विशिष्ट उपकरणों के उपयोग के साथ और कार्य पर अधिक समय खर्च करके, कार्रवाई भी कर सकती है और दस्तावेज़ और वेब ऐप उत्पन्न करने के लिए कमांड निष्पादित कर सकती है।

Perplexity Labs कंपनी के अनुसार गहरी वेब ब्राउज़िंग, कोड निष्पादन, चार्ट निर्माण और छवि निर्माण कर सकते हैं। कंपनी ने यह निर्दिष्ट नहीं किया कि क्या ये एजेंट टूल हैं, और यदि नई सुविधा एक मल्टी-एजेंट वर्कफ़्लो का समर्थन करती है। यह भी पता नहीं था कि अलग -अलग बड़े भाषा मॉडल (एलएलएम) छवि निर्माण और कोड निष्पादन जैसी क्षमताओं को शक्ति प्रदान कर रहे थे।

कंपनी का कहना है कि पेरप्लेक्सिटी लैब्स डेटा को स्ट्रक्चरिंग डेटा, फॉर्मूले को लागू करने और चार्ट और डॉक्यूमेंट बनाने जैसे कार्यों को करने के लिए कोड लिख और निष्पादित कर सकते हैं। कार्य के दौरान बनाई गई किसी भी दस्तावेज, कोड फ़ाइलों, चार्ट और छवियों को एक अलग संपत्ति टैब में जोड़ा जाता है। उपयोगकर्ता इन फ़ाइलों को वहां से देख और डाउनलोड कर सकते हैं। एक ऐप टैब भी है जो बुनियादी डैशबोर्ड, स्लाइडशो और वेबसाइटों के निर्माण में सक्षम बनाता है।

सुविधा का विवरण यह एक एजेंट की क्षमता की तरह ध्वनि करता है। विकलता कहते हैं कि “स्व-पर्यवेक्षित” कार्यों को पूरा करने में 10 मिनट या उससे अधिक समय लग सकता है। जबकि उपयोगकर्ता चेन-ऑफ-थॉट (सीओटी) देख सकते हैं, यह स्पष्ट नहीं है कि वे प्रारंभिक संकेत को संपादित करने या परिणाम की दिशा को बदलने के लिए एआई को रोक या बाधित कर सकते हैं।

कंपनी ने उन कार्यों के उदाहरण भी साझा किए जो कि पेरप्लेक्सिटी लैब्स संभाल सकते हैं। इनमें एक विशिष्ट स्टॉक या इवेंट के आसपास एक ट्रेडिंग रणनीति बनाना, एक दृश्य स्टोरीबोर्ड और पटकथा के साथ एक शैली-मिश्रित फिल्म अवधारणा उत्पन्न करना, कंपनी प्रोफाइल बनाना, या तुलनात्मक डेटा विज़ुअलाइज़ेशन बनाना शामिल है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


ओप्पो ने एन 5 फ्लिप को विकास में कथित तौर पर पाते हैं, नए कैमरा लेआउट के साथ अद्यतन डिजाइन पर स्कीमैटिक्स संकेत


Continue Reading

AI & Automation

Gmail Google कार्यक्षेत्र के साथ मिथुन एआई-संचालित सारांश कार्ड का परिचय देता है

Published

on

By

Google कार्यक्षेत्र के हिस्से के रूप में Gmail को आर्टिफिशियल इंटेलिजेंस (AI) द्वारा संचालित एक नई फीचर के साथ अपडेट किया गया है, जिसमें ड्रॉप हो सकता है। माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की है कि यह ईमेल में सारांश कार्ड जोड़ रहा है जो या तो बहुत लंबे हैं, या एक लंबे ईमेल थ्रेड का हिस्सा हैं। ये सारांश कार्ड उपयोगकर्ताओं को संदेश के बारे में संदर्भ प्रदान करने के लिए ईमेल के शीर्ष पर स्वचालित रूप से दिखाई देंगे, और मिथुन एआई का उपयोग करके उत्पन्न होते हैं। नवीनतम अपडेट में Google चैट, Google डॉक्स और Google मीट में नई AI सुविधाएँ भी शामिल हैं।

Gmail अब AI सारांश स्वचालित रूप से दिखाता है

Google कार्यक्षेत्र उपयोगकर्ता जिनके पास सेवा के लिए एक सक्रिय सदस्यता है, अब देखेंगे gmail पर ईमेल सारांश एक अलग तरीके से, कंपनी के अनुसार। इससे पहले, उपयोगकर्ताओं को एक ईमेल खोलना था और विशेष ईमेल या थ्रेड का एआई-जनित सारांश देखने के लिए मिथुन आइकन पर टैप करना था।

जीमेल सारांश कार्ड जीमेल सारांश कार्ड

Gmail में सारांश कार्ड
फोटो क्रेडिट: Google

नवीनतम अपडेट के साथ, मिथुन बुद्धिमानी से उन ईमेलों की पहचान करेंगे जिनके लिए एक सारांश की आवश्यकता होती है, और स्वचालित रूप से इसे ईमेल के शीर्ष पर रखे एक सारांश कार्ड में दिखाते हैं। जब भी लोग धागे का जवाब देते हैं, तो सारांश भी स्वचालित रूप से ताज़ा हो जाएगा। सारांश कार्ड को भी ढह सकता है जब उपयोगकर्ताओं को लगता है कि यह उपयोगी नहीं है।

गूगल चैट कुछ नई सुविधाएँ भी मिल रही हैं। मिथुन अब चैट के घर के दृश्य में संदेशों को संक्षेप में प्रस्तुत करेगा, इसलिए उपयोगकर्ता यह समझ सकते हैं कि किन संदेशों को उनके तत्काल ध्यान देने की आवश्यकता है। यह सुविधा अंग्रेजी, स्पेनिश और छह अन्य भाषाओं में उपलब्ध है।

मिथुन एक साझा कार्यक्षेत्र फ़ाइल की सामग्री का विश्लेषण और सारांश भी दे सकता है। इसलिए, यदि कोई सहकर्मी एक डॉक्टर या स्लाइड साझा करता है, तो उपयोगकर्ता दस्तावेज़ खोलने से पहले साइड पैनल में एक सारांश देख पाएगा।

गूगल डॉक्स एक नया एआई सुविधा भी मिल रही है जिसे सारांश बिल्डिंग ब्लॉक कहा जाता है। जब मिथुन एक दस्तावेज़ का सारांश उत्पन्न करता है, तो उपयोगकर्ता इसे शीर्ष पर सम्मिलित कर सकते हैं, जिससे दर्शकों को गोता लगाने से पहले संदर्भ को समझना आसान हो जाता है। हर बार दस्तावेज़ को संपादित किया जाता है, नवीनतम संस्करण दिखाने के लिए सारांश को ताज़ा किया जा सकता है।

कंपनी ने नए डायनेमिक लेआउट को भी उजागर किया है गूगल मीट यह उपयोगकर्ताओं को “कमरे” और “व्यक्तिगत” टाइलों के बीच चयन करने की अनुमति देता है। कमरे की टाइल के लिए आदर्श है जब एक ही डिवाइस का उपयोग कई प्रतिभागियों को दिखाने के लिए किया जा रहा है, जबकि व्यक्तिगत टाइल एकल प्रतिभागी के चेहरे पर केंद्रित है।

Continue Reading

AI & Automation

Microsoft टाउन हॉल में AI बिक्री को टाल देता है, बार्कलेज अनुबंध का खुलासा करता है

Published

on

By

Microsoft ने गुरुवार को एक कंपनीव्यापी टाउन हॉल के दौरान कॉर्पोरेट ग्राहकों को आर्टिफिशियल इंटेलिजेंस (AI) टूल बेचने की प्रगति की, जिसमें बार्कलेज पीएलसी के साथ एक प्रमुख सौदा भी शामिल था।

मुख्य वाणिज्यिक अधिकारी जुडसन अल्थॉफ ने कर्मचारियों को बताया कि इवेंट से परिचित लोगों के अनुसार, बार्कलेज ने माइक्रोसॉफ्ट के कोपिलॉट एआई सहायकों के लिए 100,000 लाइसेंस खरीदने के लिए सहमति व्यक्त की। अल्थॉफ ने यह भी कहा कि कई दर्जन ग्राहकों – जिनमें एक्सेंचर, टोयोटा मोटर, वोक्सवैगन एजी और सीमेंस एजी शामिल हैं – में 100,000 से अधिक कोपिलॉट उपयोगकर्ता हैं, जो लोगों के अनुसार, जिन्होंने आंतरिक टिप्पणियों पर चर्चा करने के लिए गुमनामी का अनुरोध किया था।

माइक्रोसॉफ्ट कोपिलॉट को अपनाने पर ध्यान केंद्रित कर रहा है और बारीकी से ट्रैक कर रहा है कि ग्राहक कार्यबल का कौन सा हिस्सा टूल, मुख्य कार्यकारी अधिकारी का उपयोग कर रहा है सत्य नडेला घटना के दौरान कहा। प्रति माह $ 30 (लगभग 2,566 रुपये) की सूची की कीमतों पर, अल्थॉफ द्वारा उद्धृत सौदों में से प्रत्येक में प्रति वर्ष लाखों डॉलर के दसियों के लायक होंगे – हालांकि बड़े ग्राहकों को आमतौर पर थोक छूट मिलती है।

Microsoft ने टिप्पणी करने से इनकार कर दिया। बार्कलेज, एक्सेंचर, टोयोटा, वोक्सवैगन और सीमेंस के प्रतिनिधियों ने टिप्पणी नहीं की।

दुनिया के सबसे बड़े सॉफ्टवेयर निर्माता को एआई उत्पादों के व्यवसायीकरण में एक नेता माना जाता है, इसके साथ घनिष्ठ साझेदारी के लिए धन्यवाद चटपट निर्माता ओपनईऔर उत्पादकता अनुप्रयोगों के अपने सूट में कोपिलॉट एम्बेड कर रहा है।

फिर भी, वॉल स्ट्रीट इस बात के सबूतों को देखने के लिए उत्सुक है कि मल्टीबिलियन-डॉलर का दांव भुगतान कर रहा है। जनवरी में, Microsoft ने कहा कि इसका AI सूट – क्लाउड इन्फ्रास्ट्रक्चर और AI अनुप्रयोगों सहित – वार्षिक राजस्व में कम से कम $ 13 बिलियन (लगभग 111,211 करोड़ रुपये) में लाने के लिए गति पर था।

कंपनी ने प्लेंटीफुल उपाख्यानों की पेशकश की है, जिसमें बताया गया है कि कॉर्पोरेट ग्राहक कैसे कोपिलॉट, माइक्रोसॉफ्ट के हस्ताक्षर एआई उत्पाद को ले रहे हैं, लेकिन कुल ग्राहक की गिनती या उन बिक्री के वित्तीय प्रभाव का खुलासा नहीं किया है। कुछ कॉर्पोरेट ग्राहकों का कहना है कि उपकरणों को बहुत सारे आंतरिक ट्वीक और कर्मचारी प्रशिक्षण की आवश्यकता होती है, और कई लोग एक के रूप में कोपिलॉट के अपने उपयोग का वर्णन करते हैं मापा रोलआउट और ट्रायल की श्रृंखला, अपने सभी कर्मियों को महंगा सॉफ्टवेयर से लैस करने के लिए एक भीड़ के बजाय।

योजनाओं की घोषणा के बाद सप्ताह कुल्हाड़ी 6,000 श्रमिकया लगभग तीन प्रतिशत कार्यबल, कंपनी के पास सैनिकों को रैली करने का भी कारण है। नडेला ने कटौती को संबोधित करके बैठक शुरू की, यह कहते हुए कि वे प्रदर्शन के बजाय एक पुनर्गठन से संबंधित थे। समाप्ति गिर गई मुश्किल कंपनी के उत्पादों का निर्माण करने वाले लोगों पर, यह दिखाते हुए कि एआई की उम्र में इंजीनियरिंग नौकरियों की गारंटी भी नहीं है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Tencent ने Hunyuanportrait, एक ओपन-सोर्स AI मॉडल को एनिमेटिंग पोर्ट्रेट के लिए लॉन्च किया

Published

on

By

Tencent ने मंगलवार को एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किया जो अभी भी चित्र छवियों को चेतन कर सकता है। डब्ड हन्युआनपोर्ट्रेट, लार्ज लैंग्वेज मॉडल (एलएलएम) प्रसार आर्किटेक्चर पर आधारित है, और एक संदर्भ छवि और एक मार्गदर्शक वीडियो के आधार पर यथार्थवादी एनीमेशन के साथ वीडियो उत्पन्न कर सकता है। परियोजना के पीछे के शोधकर्ताओं ने इस बात पर प्रकाश डाला कि मॉडल चेहरे के डेटा और स्थानिक आंदोलनों दोनों को सटीक रूप से संदर्भ छवि में सिंक करने के लिए कैप्चर कर सकता है। Tencent ने अब Hunyuanportrait AI मॉडल को खोल दिया है, और इसे लोकप्रिय रिपॉजिटरी से स्थानीय रूप से डाउनलोड और चलाया जा सकता है।

Tencent का Hunyuanportratit अभी भी जीवन के लिए चित्र ला सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), टेन्सेंट हुनयुआन के आधिकारिक हैंडल ने घोषणा की कि हुनुअनपोर्ट्रेट मॉडल अब खुले समुदाय के लिए उपलब्ध है। AI मॉडल को Tencent से डाउनलोड किया जा सकता है GitHub और गले का चेहरा लिस्टिंग। इसके अतिरिक्त, एक प्री-प्रिंट कागज़ मॉडल का विस्तार करना भी Arxiv पर होस्ट किया जा रहा है। विशेष रूप से, AI मॉडल अकादमिक और अनुसंधान-आधारित उपयोग के मामलों के लिए उपलब्ध है, लेकिन व्यावसायिक उपयोग के लिए नहीं।

Hunyuanportrait एक संदर्भ छवि और ड्राइविंग वीडियो का उपयोग करके लाइफलाइक एनिमेटेड वीडियो उत्पन्न कर सकता है। यह चेहरे के डेटा को कैप्चर करता है और वीडियो से सिर पोज देता है और उन्हें स्टिल पोर्ट्रेट इमेज पर प्रक्षेपित करता है। कंपनी का दावा है कि आंदोलन का सिंक सटीक है, और यहां तक ​​कि सूक्ष्म चेहरे की अभिव्यक्ति में परिवर्तन भी दोहराया जाता है।

हुनयुआनपोरिट्रैट आर्किटेक्चर हुनुअनपोरट्रेट

हुन्युआनपोरिट्रैट आर्किटेक्चर
फोटो क्रेडिट: tencent

अपने मॉडल पर पेजTencent शोधकर्ताओं ने Hunyuanportrait की वास्तुकला को विस्तृत किया। यह एक स्थिति नियंत्रण एनकोडर के साथ स्थिर प्रसार मॉडल की वास्तुकला पर बनाया गया है। ये पूर्व-प्रशिक्षित एनकोडर वीडियो में गति की जानकारी और पहचान को कम करते हैं। डेटा को नियंत्रण संकेतों के रूप में कैप्चर किया जाता है, जो तब एक डेनोइजिंग UNET के माध्यम से स्टिल पोर्ट्रेट में इंजेक्ट किया जाता है। कंपनी का दावा है कि यह दोनों स्थानिक सटीकता के साथ -साथ आउटपुट में अस्थायी स्थिरता दोनों लाता है।

Tencent का दावा है कि AI मॉडल लौकिक स्थिरता और नियंत्रणीयता के मापदंडों पर मौजूदा ओपन-सोर्स विकल्पों को बेहतर बनाता है, लेकिन इन मैट्रिक्स को स्वतंत्र रूप से सत्यापित नहीं किया गया है।

इस तरह के मॉडल फिल्म निर्माण और एनीमेशन उद्योगों में उपयोगी हो सकते हैं। परंपरागत रूप से, एनिमेटर मैन्युअल रूप से कीफ्रेम फेशियल एक्सप्रेशन या एरेस्टिकली मोशन कैप्चर सिस्टम का उपयोग करता है ताकि वर्णों को वास्तविक रूप से चेतन किया जा सके। Hunyuanportrait जैसे मॉडल उन्हें केवल चरित्र डिजाइन और लक्ष्य आंदोलनों और चेहरे के भावों को खिलाने की अनुमति देंगे, और यह आउटपुट उत्पन्न करने में सक्षम होगा। इस तरह के एलएलएम में उच्च गुणवत्ता वाले एनीमेशन को छोटे स्टूडियो और स्वतंत्र रचनाकारों के लिए सुलभ बनाने की क्षमता है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


Realme Neo 7 टर्बो के साथ Mediatek Dimentess


Continue Reading

AI & Automation

Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Published

on

By

Google ने साइनगेमा की घोषणा की है, जो एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल है जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है। मॉडल, जो मॉडल ऑफ मॉडल का हिस्सा होगा, वर्तमान में माउंटेन व्यू-आधारित टेक दिग्गज द्वारा परीक्षण किया जा रहा है और इस साल के अंत में लॉन्च होने की उम्मीद है। अन्य सभी Gemma मॉडल के समान, Singgemma एक ओपन-सोर्स AI मॉडल भी होगा, जो व्यक्तियों और व्यवसायों के लिए उपलब्ध है। यह पहली बार Google I/O 2025 कीनोट के दौरान दिखाया गया था, और यह भाषण और सुनने की अक्षमता वाले लोगों की मदद करने के लिए डिज़ाइन किया गया है जो प्रभावी रूप से उन लोगों के साथ संवाद करते हैं जो साइन लैंग्वेज को नहीं समझते हैं।

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), Google डीपमाइंड के आधिकारिक हैंडल ने एआई मॉडल का एक डेमो और इसकी रिलीज की तारीख के बारे में कुछ विवरण साझा किए। हालाँकि, यह पहली बार नहीं है जब हमने साइनगेममा को देखा है। यह भी संक्षेप में Google I/O इवेंट में Gus Martin, Gemma Product Manager द्वारा दीपमाइंड में दिखाया गया था।

शोकेस के दौरान, मार्टिंस ने इस बात पर प्रकाश डाला कि एआई मॉडल वास्तविक समय में साइन लैंग्वेज से टेक्स्ट ट्रांसलेशन प्रदान करने में सक्षम है, जिससे आमने-सामने संचार को सहज बना दिया गया है। मॉडल को साइन भाषाओं के विभिन्न शैलियों के डेटासेट पर भी प्रशिक्षित किया गया था, हालांकि, यह अंग्रेजी भाषा में अनुवाद करते समय अमेरिकी साइन लैंग्वेज (एएसएल) के साथ सर्वश्रेष्ठ प्रदर्शन करता है।

अनुसार बहुभाषी के लिए, चूंकि यह एक ओपन-सोर्स मॉडल है, इसलिए SignGemma इंटरनेट से कनेक्ट करने की आवश्यकता के बिना कार्य कर सकता है। यह सीमित कनेक्टिविटी वाले क्षेत्रों में उपयोग करने के लिए उपयुक्त बनाता है। यह कहा जाता है मिथुन नैनो फ्रेमवर्क और हाथ के आंदोलनों, आकृतियों और चेहरे के भावों को ट्रैक और विश्लेषण करने के लिए एक विज़न ट्रांसफार्मर का उपयोग करता है। डेवलपर्स के लिए इसे उपलब्ध कराने से परे, गूगल मॉडल को अपने मौजूदा एआई टूल में एकीकृत कर सकता है, जैसे कि मिथुन लाइव।

इसे “साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल” कहते हुए, दीपमाइंड ने इस बात पर प्रकाश डाला कि यह इस साल के अंत में जारी किया जाएगा। एक्सेसिबिलिटी-केंद्रित बड़े भाषा मॉडल वर्तमान में अपने शुरुआती परीक्षण चरण में है, और टेक दिग्गज ने एक प्रकाशित किया है ब्याज -रूप व्यक्तियों को इसे आज़माने और प्रतिक्रिया प्रदान करने के लिए आमंत्रित करने के लिए।


Continue Reading

Trending