AI & Automation
मेटा ने कथित तौर पर यह स्पष्ट करने से इनकार कर दिया कि क्या रे-बैन मेटा स्मार्ट ग्लास द्वारा कैप्चर किए गए वीडियो निजी रहेंगे

मेटा कथित तौर पर इस बात पर चुप रह रहा है कि क्या वह अपने आर्टिफिशियल इंटेलिजेंस (एआई) पहनने योग्य डिवाइस रे-बैन मेटा स्मार्ट ग्लासेस से अपने बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित करने के लिए वीडियो और इमेज डेटा एकत्र कर रहा है। कंपनी ने एक नए रियल-टाइम वीडियो की घोषणा की विशेषता उस डिवाइस के लिए जो उपयोगकर्ता एआई को प्रश्नों का उत्तर देने के लिए कह सकते हैं और अपने परिवेश के आधार पर सुझाव मांग सकते हैं। हालांकि, इस डेटा पर क्या होता है, इस पर कोई स्पष्टता नहीं है कि एक बार एआई क्वेरी का जवाब देता है।
विचाराधीन सुविधा वास्तविक समय की वीडियो क्षमता है जो मेटा एआई को उपयोगकर्ताओं के परिवेश पर “लुक” करने की अनुमति देती है और उस दृश्य जानकारी को किसी भी क्वेरी का जवाब देने के लिए प्रक्रिया की प्रक्रिया कर सकती है। उदाहरण के लिए, एक उपयोगकर्ता इसे एक प्रसिद्ध लैंडमार्क की पहचान करने के लिए कह सकता है, इसे कोठरी दिखा सकता है और अलमारी के सुझावों के लिए पूछ सकता है, या यहां तक कि रेफ्रिजरेटर में सामग्री के आधार पर व्यंजनों के लिए पूछ सकता है।
हालांकि, इनमें से प्रत्येक कार्यक्षमता को संदर्भ को समझने के लिए निष्क्रिय वीडियो और परिवेश की छवियों को लेने के लिए रे-बैन मेटा स्मार्ट चश्मा की आवश्यकता होती है। सामान्य परिस्थितियों में, एक बार प्रतिक्रिया उत्पन्न हो जाने के बाद और उपयोगकर्ता ने बातचीत को समाप्त कर दिया है, डेटा को निजी सर्वर में छोड़ दिया जाना चाहिए यदि तुरंत हटाए न जाए। ऐसा इसलिए है क्योंकि बहुत सारे डेटा उपयोगकर्ता के घर और अन्य सामानों के बारे में निजी जानकारी हो सकते हैं।
लेकिन मेटा कथित तौर पर यह नहीं बता रहा है। यह पूछे जाने पर कि क्या कंपनी इस डेटा को संग्रहीत कर रही है और इस पर देशी एआई मॉडल को प्रशिक्षित कर रही है, एक मेटा प्रवक्ता बताया TechCrunch कि कंपनी सार्वजनिक रूप से मामले पर चर्चा नहीं कर रही है। एक अन्य प्रवक्ता ने कथित तौर पर इस बात पर प्रकाश डाला कि यह जानकारी बाहरी रूप से साझा नहीं की जा रही है और कहा कि “हम किसी भी तरह से नहीं कह रहे हैं।”
कंपनी का स्पष्ट रूप से यह बताने से इनकार करने से कि उपयोगकर्ता डेटा के साथ क्या होता है, निजी, और संभावित रूप से संवेदनशील प्रकृति के विषय में स्मार्ट चश्मा कैप्चर कर सकता है। जबकि मेटा ने पहले से ही फेसबुक और इंस्टाग्राम पर अपने यूएस-आधारित उपयोगकर्ताओं के सार्वजनिक उपयोगकर्ता डेटा पर अपने एआई मॉडल को प्रशिक्षित करने की पुष्टि की है, रे-बैन मेटा स्मार्ट चश्मा के डेटा सार्वजनिक नहीं हैं।
गैजेट्स 360 एक टिप्पणी के लिए मेटा में पहुंच गया है। कंपनी से एक बयान प्राप्त करने के बाद हम कहानी को अपडेट करेंगे।
AI & Automation
Google मिथुन उन्नत उपयोगकर्ता अब चैटबॉट को GitHub के साथ कनेक्ट कर सकते हैं

गूगल अपने आर्टिफिशियल इंटेलिजेंस (एआई) चैटबोट, मिथुन में एक नई सुविधा जोड़ रहा है। बुधवार को घोषित, मिथुन अब GitHub रिपॉजिटरी से जुड़ सकता है और कई कोडिंग कार्य कर सकता है। इनमें फ़ंक्शंस उत्पन्न करना और संशोधित करना, कोड की व्याख्या करना, कोडबेस के बारे में प्रश्नों का उत्तर देना, डिबगिंग कोड, और बहुत कुछ शामिल हैं। वर्तमान में, यह सुविधा केवल प्लेटफ़ॉर्म के भुगतान किए गए ग्राहकों के लिए उपलब्ध है। विशेष रूप से, माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की कि वह अब मिथुन को अधिक उपकरणों में विस्तारित करेगा, जिसमें स्मार्टवॉच, स्मार्ट टीवी, कारों में इन्फोटेनमेंट सिस्टम, और बहुत कुछ शामिल हैं।
मिथुन एडवांस्ड अब GitHub Repos तक पहुंच सकता है
में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), मिथुन ऐप के आधिकारिक हैंडल ने नई सुविधा की घोषणा की। द पोस्ट में कहा गया है, “मिथुन एडवांस्ड अब GitHub के साथ जुड़ता है, जिससे यह अधिक शक्तिशाली कोडिंग सहायक बन जाता है।” मोबाइल ऐप या वेब क्लाइंट के नवीनतम संस्करण का उपयोग करने वालों को नई सुविधा तक पहुंचने में सक्षम होना चाहिए। विशेष रूप से, यह सुविधा केवल मिथुन उन्नत ग्राहकों के लिए उपलब्ध है।
जबकि सुविधा चैटबॉट की कोडिंग क्षमता को बढ़ाती नहीं है, यह इसके उपयोग के मामले को अधिक व्यक्तिगत बनाता है। उपयोगकर्ता अब एआई को अपने रिपॉजिटरी से जोड़ सकते हैं और फिर पूछ सकते हैं मिथुन उनके बारे में प्रश्न या कोडबेस को डीबग करने के लिए पूछें।
Google का कहना है कि यह नई क्षमता मिथुन को कोड और फ़ंक्शंस को उत्पन्न करने और संशोधित करने, कोड का विश्लेषण और व्याख्या करने, क्वेरी, डेबग, और बहुत कुछ करने की अनुमति देगी। दिखाए गए एक उदाहरण में, मिथुन कोड का विश्लेषण करने और इसे और अधिक कुशल बनाने के तरीके दिखाने में सक्षम था।
सुविधा का उपयोग करने के लिए, मिथुन उन्नत उपयोगकर्ता पाठ फ़ील्ड के बाईं ओर प्लस आइकन (+) पर टैप कर सकते हैं और “आयात कोड” विकल्प का चयन कर सकते हैं। एक बार हो जाने के बाद, वे एक और टेक्स्ट बॉक्स देखेंगे जहां वे GitHub URL को पेस्ट कर सकते हैं। ये लिंक सार्वजनिक या निजी प्रतिनिधि से संबंधित हो सकते हैं, एआई दोनों के साथ काम करता है। विशेष रूप से, भारत में मिथुन उन्नत सदस्यता की लागत रु। 1,950 प्रति माह।
इस हफ्ते की शुरुआत में, टेक दिग्गज ने मिथुन के अधिक एंड्रॉइड डिवाइसों के विस्तार की घोषणा की। Google ने कहा कि आने वाले महीनों में, मिथुन को स्मार्टवॉच, स्मार्ट टीवी, इन-कार इन्फोटेनमेंट सिस्टम और यहां तक कि हेडसेट और स्मार्ट ग्लास में एकीकृत किया जाएगा।
AI & Automation
Tiktok AI- संचालित वैकल्पिक पाठ और अन्य पहुंच सुविधाओं के लिए समर्थन जोड़ता है

टिकटोक गुरुवार को तीन नई पहुंच-केंद्रित सुविधाओं की घोषणा की। ग्लोबल एक्सेसिबिलिटी अवेयरनेस डे के अवसर पर नई सुविधाओं की घोषणा की गई, जो मई में तीसरे गुरुवार को आती है (इस साल, यह 15 मई को है)। नई विशेषताओं में से एक वैकल्पिक पाठ (ALT पाठ) समर्थन के लिए एक अद्यतन है, जो अब स्वचालित वर्णनात्मक कैप्शन उत्पन्न करने के लिए कृत्रिम बुद्धिमत्ता (AI) का उपयोग करता है। अन्य एक्सेसिबिलिटी सुविधाओं में एक नया उच्च कंट्रास्ट मोड और बोल्ड टेक्स्ट के लिए समर्थन शामिल है। विशेष रूप से, इस सप्ताह की शुरुआत में, कंपनी पुर: एक नया इमेज-टू-वीडियो जनरेशन टूल।
Tiktok तीन नई एक्सेसिबिलिटी फीचर्स लाता है
एक न्यूज़ रूम में डाकवीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म ने तीन नई एक्सेसिबिलिटी फीचर्स को विस्तृत किया, जो उपयोगकर्ताओं के लिए पेश कर रहे थे। ये सुविधाएँ प्लेटफ़ॉर्म के मौजूदा एक्सेसिबिलिटी टूल्स में शामिल होंगी, जैसे कि वीडियो, डार्क मोड, टेक्स्ट-टू-स्पीच और थंबनेल एनीमेशन के लिए ऑटो-जनित कैप्शन।
पहली नई सुविधा एआई-जनित ALT पाठ है। Tiktok ने कई हफ्ते पहले फोटो पोस्ट के लिए ALT पाठ जोड़ा। उपयोगकर्ता मैन्युअल रूप से छवि का वर्णन करते हुए एक कैप्शन जोड़ सकते हैं, और इसे स्क्रीन पाठकों द्वारा ज़ोर से पढ़ा जा सकता है। अब, यह उन फ़ोटो के लिए वर्णनात्मक कैप्शन उत्पन्न करने के लिए AI का उपयोग करके सुविधा पर निर्माण कर रहा है जिनमें ALT पाठ नहीं है। कंपनी का कहना है कि यह उन लोगों के लिए प्रयोज्य में सुधार करेगा जो अंधे हैं, कम दृष्टि रखते हैं, या सामग्री को अलग तरह से प्रक्रिया करते हैं।
अगला मंच पर रंग विपरीत बढ़ाने का एक विकल्प है। Tiktok एक उच्च विपरीत मोड पेश कर रहा है जो पाठ, आइकन और उपयोगकर्ता इंटरफ़ेस तत्वों के अग्रभूमि रंग को बढ़ाता है। यह सुविधा में पाया जा सकता है सरल उपयोग भीतर विकल्प सेटिंगके रूप में चिह्नित रंग कंट्रास्ट बढ़ाएं। टिकटोक का कहना है कि यह मंच को कम दृष्टि वाले व्यक्तियों के लिए या कम विपरीत के प्रति संवेदनशील लोगों के लिए अधिक उपयोगकर्ता के अनुकूल बना देगा।
अंत में, प्लेटफ़ॉर्म उपकरणों में बोल्ड टेक्स्ट सेटिंग के लिए समर्थन भी जोड़ रहा है। यदि किसी डिवाइस ने टेक्स्ट सेटिंग को बोल्ड पर सेट किया है, तो वे अब सभी इन-ऐप टेक्स्ट देखेंगे, जिसमें नाम, टिप्पणियां, कैप्शन और संदेश भी शामिल हैं। यह उन उपयोगकर्ताओं के लिए पठनीयता बढ़ाएगा जो बोल्डर पाठ पसंद करते हैं या दृष्टि मुद्दे हैं। ये सभी नई सुविधाएँ अब नवीनतम अपडेट वाले सभी उपयोगकर्ताओं के लिए उपलब्ध हैं।
AI & Automation
Google DeepMind Alphaevolve का अनावरण करता है, एक कोडिंग एजेंट जो AI मतिभ्रम को कम करने के लिए डिज़ाइन किया गया है

Google DeepMind बुधवार को एक नए आर्टिफिशियल इंटेलिजेंस (एआई) कोडिंग एजेंट की घोषणा की जो एआई मॉडल की क्षमताओं को बढ़ा सकती है। डब्ड अल्फावोल्व, यह जटिल कंप्यूटिंग और गणितीय कार्यों में एल्गोरिदम को खोजने और अनुकूलित करने के लिए डिज़ाइन किया गया है। शक्तिशाली एआई प्रणाली माउंटेन व्यू-आधारित टेक दिग्गज के मिथुन मॉडल पर बनाई गई है, और यह बड़े भाषा मॉडल द्वारा उत्पन्न आउटपुट को स्वचालित मूल्यांकनकर्ताओं के साथ उत्पन्न करता है ताकि वास्तविकता में प्रतिक्रियाओं को जमीन पर रखा जा सके और मतिभ्रम के जोखिम को कम किया जा सके। इसके अलावा, सिस्टम को गणितीय समस्याओं को हल करने और अनुकूलित करने में क्षमता भी दिखाई गई है।
Google DeepMind अल्फावोलव कोडिंग एजेंट का परिचय देता है
में एक ब्लॉग भेजादीपमाइंड ने जिस नई तकनीक पर काम किया है, वह विस्तृत है। Alphaevolve एक AI मॉडल नहीं है, इसके बजाय, यह एजेंटिक क्षमताओं के साथ एक जटिल AI प्रणाली है। सिस्टम द्वारा किए गए प्राथमिक कार्यों में से एक एल्गोरिथ्म खोज और अनुकूलन है।
एआई मॉडल, एक मौलिक स्तर पर, कोड की एक श्रृंखला है। ये कोड आधार प्रक्रिया और संकलन जानकारी, इसे तोड़ते हैं, और आउटपुट उत्पन्न करने के लिए संभाव्य एल्गोरिदम का उपयोग करते हैं। हालांकि, चूंकि एआई सिस्टम अत्यधिक जटिल हैं, इसलिए उनके कोड आधार बड़े पैमाने पर हैं। यह बड़ा आकार अक्सर अनुकूलन और दक्षता-आधारित मुद्दों का कारण बनता है। अल्फावोलवे इसके साथ मदद कर सकता है, कंपनी ने कहा।
अल्फेवोल्व संरचना
फोटो क्रेडिट: Google
Alphaevolve स्वचालित मूल्यांकन मेट्रिक्स का उपयोग करता है, और इन मापदंडों का उपयोग करके, यह AI मॉडल द्वारा उत्पन्न किए गए प्रतिक्रियाओं को सत्यापित करता है, चलाता है और स्कोर करता है। गूगल कहा कि यह विधि प्रणाली को कई एआई मॉडल से प्रतिक्रियाओं का आकलन करने और मतिभ्रम के जोखिम को कम करने की अनुमति देती है। इसके अतिरिक्त, सिस्टम ऐसे कोड को भी ठीक और सुधार सकता है जो इस तरह के मतिभ्रम की अनुमति देता है।
टेक दिग्गज ने कहा कि अल्फेवोल्व ने Google के डेटा सेंटर, चिप डिज़ाइन और एआई प्रशिक्षण प्रक्रियाओं की दक्षता में सुधार किया है। दिलचस्प बात यह है कि यह अपने स्वयं के आधार एलएलएम के प्रशिक्षण में सुधार करने में भी सक्षम था। एक मामले में, इसने एक नई शेड्यूलिंग विधि की खोज की जो Google के वैश्विक गणना संसाधनों के लगभग 0.7 प्रतिशत को ठीक करती है – कंपनी के बड़े पैमाने पर बुनियादी ढांचे में लागू होने पर एक बड़ा लाभ।
चूंकि अल्फावोल्व कोड बेस और एल्गोरिदम के साथ काम करता है, इसलिए यह भी कहा जाता है कि गणितीय समस्या को हल करने के विभिन्न क्षेत्रों में उच्च क्षमता है, कंपनी ने कहा। कहा जाता है कि यह 4×4 कॉम्प्लेक्स मैट्रिसेस को गुणा करने के लिए एक तेज विधि की खोज की गई है, जो एक समाधान को हराकर 50 से अधिक वर्षों तक खड़ा था। 50 खुली गणितीय समस्याओं के परीक्षणों में, अल्फेवोलवे ने ज्यादातर मामलों में वर्तमान सर्वश्रेष्ठ समाधानों का मिलान किया, और यहां तक कि लगभग 20 प्रतिशत समस्याओं में उन पर सुधार किया, पोस्ट ने कहा।
AI & Automation
डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 एआई पीसी के साथ इंटेल कोर अल्ट्रा सीपीयू के साथ भारत में लॉन्च किया गया

गड्ढा कृत्रिम बुद्धिमत्ता की एक विस्तृत श्रृंखला लॉन्च की (ऐ) भारत में गुरुवार को पीसी। लाइनअप में तीन मॉडल शामिल हैं-डेल 14 प्लस, डेल 16 प्लस, और डेल 14 2-इन -1, जिन्हें डेल प्लस पोर्टफोलियो के हिस्से के रूप में नई यूनिफाइड ब्रांडिंग के तहत पेश किया गया है। कंपनी के अनुसार, इसके नए एआई पीसी नवीनतम इंटेल कोर अल्ट्रा प्रोसेसर द्वारा संचालित हैं और कोपिलॉट+ एआई क्षमताओं को वितरित करने के लिए बनाए गए हैं। जबकि डेल 14 प्लस और डेल 16 प्लस में एक पारंपरिक लैपटॉप डिज़ाइन है, डेल 14 2-इन -1 एक बहुमुखी पेशकश है जो लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण कर सकता है।
डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 मूल्य भारत में
डेल 14 2-इन -1 मूल्य भारत में रुपये से शुरू होता है। 96,899। इस बीच, डेल 14 प्लस और डेल 16 प्लस मॉडल की कीमत रु। 1,15,799 और रु। आधार विन्यास के लिए क्रमशः 1,08,499। लैपटॉप डेल.कॉम, डेल एक्सक्लूसिव स्टोर्स, रिटेल पार्टनर्स जैसे क्रोमा, रिलायंस रिटेल और विजय सेल्स, और अन्य मल्टी-ब्रांड आउटलेट्स और प्रमुख ई-कॉमर्स प्लेटफॉर्म के माध्यम से खरीद के लिए उपलब्ध होगा।
डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 विनिर्देश
डेल 14 प्लस और 14 2-इन -1 मॉडल में क्रमशः 14-इंच 2.5k (2,560 x 1,600 पिक्सल) एंटी-ग्लेयर नॉन-टचस्क्रीन डिस्प्ले और 14-इंच पूर्ण एचडी+ (1,920 x 1,200 पिक्सल) टच स्क्रीन डिस्प्ले हैं। इस बीच, डेल 16 प्लस में 16 इंच का पूर्ण एचडी+ (1,920 x 1,200 पिक्सेल) स्क्रीन है। 2-इन -1 मॉडल 360-डिग्री काज के साथ आता है जो इसे लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण में मदद करता है।
सभी मॉडलों में 300nits पीक चमक तक है। उन्हें आठ कोर के साथ एक इंटेल कोर अल्ट्रा 7 256V प्रोसेसर और 4.8GHz की पीक घड़ी की गति के साथ कॉन्फ़िगर किया जा सकता है। वे एक समर्पित तंत्रिका प्रसंस्करण इकाई (NPU) के साथ भी आते हैं, जो अकेले 47 TERA संचालन प्रति सेकंड (TOPS) के शिखर प्रदर्शन को देने का दावा किया जाता है। डब एआई पीसीएस, नए डेल प्लस मॉडल कोपिलॉट+ क्षमताओं के साथ आते हैं। कंपनी उपयोगकर्ताओं को अपनी उत्पादकता को अधिकतम करने में उपयोगकर्ताओं की मदद करने के लिए AI- चालित उपकरण जैसे रिकॉल और Cocreator भी प्रदान करती है।
पूरे डेल प्लस लाइनअप में एक्सप्रेसचार्ज तकनीक की सुविधा है जो लैपटॉप को 60 मिनट में 80 प्रतिशत तक बढ़ा सकती है। कनेक्टिविटी विकल्पों में वाई-फाई 7, ब्लूटूथ, यूएसबी 3.2 जनरल 1 टाइप-ए पोर्ट, यूएसबी 3.2 जनरल 2 टाइप-सी पोर्ट, डिस्प्लेपोर्ट 2.1 के साथ थंडरबोल्ट 4, एक एचडीएमआई 2.1 पोर्ट और 3.5 मिमी हेडफोन जैक शामिल हैं।
AI & Automation
Openai GPT-4.1 AI मॉडल का विस्तार करता है, जिसमें उन्नत कोडिंग क्षमताओं के साथ CHATGPT

ओपनई CHATGPT के लिए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल की हाल ही में जारी GPT-4.1 श्रृंखला के विस्तार की घोषणा की। ये मॉडल अब तक थे अनन्य कंपनी के एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के लिए, लेकिन गुरुवार को, सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि वे चैटबॉट के भीतर भी उपलब्ध होंगे। विशेष रूप से, GPT-4.1 और GPT-4.1 मिनी मॉडल वर्तमान में CHATGPT के लिए रोल आउट किए जा रहे हैं। कंपनी का कहना है कि इन नए मॉडल में कोडिंग-संबंधित कार्यों में उच्च प्रवीणता है और यह O3 मॉडल का विकल्प हो सकता है।
Openai के GPT-4.1 AI मॉडल अब CHATGPT में आ रहे हैं
में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईएआई के आधिकारिक हैंडल ने घोषणा की कि जीपीटी -4.1 एआई मॉडल अब सीधे CHATGPT में उपलब्ध होगा। कोडिंग कार्यों के लिए O3 मॉडल के विकल्प के रूप में इसे पिच करते हुए, कंपनी ने कहा कि विशेष मॉडल भी निम्नलिखित निर्देश में उत्कृष्टता प्राप्त करता है। यह “अधिक मॉडल” ड्रॉपडाउन मेनू में CHATGPT प्लस, प्रो और टीम उपयोगकर्ताओं के लिए उपलब्ध होगा।
इसके अतिरिक्त, एंटरप्राइज और ईडीयू ग्राहकों को आने वाले हफ्तों में मॉडल तक पहुंच मिलेगी। के मुक्त स्तर पर चटपट जल्द ही GPT-4.1 मिनी मॉडल तक पहुंच प्राप्त होगी, जो GPT-4O मिनी मॉडल की जगह होगी।
लॉन्च के समय, Openai ने कहा कि इन मॉडलों ने कोडिंग क्षमता में GPT-4O और GPT-4.5 AI दोनों मॉडल दोनों को बेहतर बनाया। आंतरिक परीक्षण के आधार पर, कंपनी ने दावा किया कि GPT-4.1 ने SWE-Bench सत्यापित बेंचमार्क पर 54.6 प्रतिशत स्कोर किया।
यह भी दावा किया जाता है कि अनुदेश के लिए मल्टीचैलेंज बेंचमार्क पर 38.3 प्रतिशत स्कोर किया है, और मल्टीमॉडल लॉन्ग संदर्भ समझ के लिए वीडियो-एमएमई बेंचमार्क पर 72 प्रतिशत। मॉडल की GPT-4.1 श्रृंखला में एक मिलियन टोकन तक की एक संदर्भ विंडो है।
जबकि GPT-4.1 इस श्रृंखला का प्रीमियम मॉडल बना हुआ है, GPT-4.1 मिनी को कई बेंचमार्क में GPT-4O को बेहतर बनाने का दावा किया गया है, जिसमें खुफिया मूल्यांकन भी शामिल है। Openai ने कहा कि मिनी मॉडल विलंबता को आधे से कम करता है और 4o की तुलना में 83 प्रतिशत कम खर्च होता है।
AI & Automation
स्थिरता एआई और एआरएम रिलीज लाइटवेट टेक्स-टू-ऑडियो मॉडल तेजी से ऑन-डिवाइस पीढ़ी के लिए अनुकूलित

स्थिरता एआई एआरएम के साथ साझेदारी में एक नया टेक्स्ट-टू-ऑडियो पीढ़ी आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल विकसित किया। बुधवार को घोषणा की गई, नए मॉडल को स्थिर ऑडियो ओपन स्मॉल करार दिया गया है, और यह कहा जाता है कि यह पाठ संकेतों का उपयोग करके छोटे ऑडियो नमूने उत्पन्न करने के लिए है। लंदन स्थित एआई फर्म ने कहा कि मॉडल हल्का है और पूरी तरह से एआरएम सीपीयू पर चलने के लिए अनुकूलित है। यह भी कहा जाता है कि यह एक तेज पीढ़ी का समय है, जिससे यह थोक उपयोग के मामलों के लिए उपयोगी है। ओपन-सोर्स ऑडियो मॉडल GitHub और Hugging Face से डाउनलोड करने के लिए उपलब्ध है।
स्थिरता एआई स्थिर ऑडियो खुला छोटा रिलीज करता है
एक न्यूज़ रूम में डाकएआई फर्म ने नए बड़े भाषा मॉडल को विस्तृत किया। यह स्थिर ऑडियो ओपन मॉडल का एक आसुत संस्करण है, जो था जारी किया जून 2024 में, और 47 सेकंड तक ऑडियो उत्पन्न कर सकते हैं। छोटे टेक्स्ट-टू-ऑडियो मॉडल को तेज पीढ़ी की गति और छोटे आकार पर ध्यान केंद्रित करने के साथ डिज़ाइन किया गया था।
स्थिर ऑडियो ओपन छोटा एक 341 मिलियन पैरामीटर मॉडल है जो ऑडियो के 11 सेकंड तक उत्पन्न कर सकता है। कंपनी का दावा है कि यह स्मार्टफोन पर स्थानीय रूप से चलने के दौरान आठ सेकंड से भी कम समय में एक ऑडियो नमूना उत्पन्न कर सकता है। दिलचस्प बात यह है कि स्टेबिलिटी एआई और एआरएम ने मोबाइल वर्ल्ड कांग्रेस (MWC) 2025 में जेनेरिक ऑडियो क्रिएशन के लिए अपने सहयोग की घोषणा की।
आर्किटेक्चर और ट्रेनिंग में आकर, स्थिर ऑडियो ओपन स्मॉल एक ट्रांसफॉर्मर आर्किटेक्चर पर आधारित एक अव्यक्त प्रसार मॉडल है। यह 4,86,492 ऑडियो रिकॉर्डिंग के डेटासेट पर प्रशिक्षित है। कंपनी ने कहा कि सभी ऑडियो फाइलें लाइसेंस प्राप्त हैं। पाठ कंडीशनिंग के लिए, एक सार्वजनिक रूप से उपलब्ध पूर्व-प्रशिक्षित T5 मॉडल का उपयोग किया गया था। एआई फर्म ने त्वरित पालन में सुधार करने और निष्कर्ष की गति को बढ़ाने के लिए प्रशिक्षण के बाद के चरण में प्रतिकूल संबंध-संकल्पना (एआरसी) एल्गोरिथ्म का उपयोग किया।
कंपनी के अनुसार, यह टेक्स्ट-टू-ऑडियो मॉडल ड्रम लूप, फोली, इंस्ट्रूमेंट रिफ़्स और एंबिएंट टेक्सचर बनाने के लिए अनुकूल है। इसके छोटे आकार के कारण, इसे एआरएम-पावर्ड स्मार्टफोन के साथ-साथ एज डिवाइस पर भी तैनात किया जा सकता है। मॉडल का उपयोग उन परिदृश्यों में भी किया जा सकता है जहां वास्तविक समय पीढ़ी और जवाबदेही पदार्थ।
स्थिर ऑडियो ओपन स्मॉल के मॉडल वेट को एआई फर्म के गले लगने वाले चेहरे पर डाउनलोड किया जा सकता है प्रविष्टिऔर कोड बेस GitHub पर पाया जा सकता है प्रविष्टि। AI मॉडल अनुमेय स्थिरता AI समुदाय लाइसेंस के तहत वाणिज्यिक और गैर-वाणिज्यिक उपयोग के लिए उपलब्ध है।
AI & Automation
Apple के शोधकर्ता Matrix3D का परिचय देते हैं, एक एकीकृत AI मॉडल जो 2D फ़ोटो को 3D ऑब्जेक्ट में बदल सकता है

सेब शोधकर्ताओं ने एक नया आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया जो कई 2 डी छवियों से 3 डी दृश्य उत्पन्न कर सकता है। बड़े भाषा मॉडल (LLM), डब किए गए Matrix3D, को कंपनी की मशीन लर्निंग टीम द्वारा नानजिंग विश्वविद्यालय और हांगकांग विश्वविद्यालय के विज्ञान और प्रौद्योगिकी विश्वविद्यालय (HKUST) के सहयोग से विकसित किया गया था। क्यूपर्टिनो-आधारित टेक दिग्गज ने एआई मॉडल को खुले समुदाय के लिए उपलब्ध कराया है, और इसे GitHub पर Apple की लिस्टिंग के माध्यम से डाउनलोड किया जा सकता है। Matrix3D के साथ, शोधकर्ताओं ने त्रुटियों के जोखिम को खत्म करने के लिए 3 डी पीढ़ी के पाइपलाइन को एकीकृत किया है।
Apple का Matrix3D मल्टी-टास्क फोटोग्राममेट्री का नवाचार करता है
में एक डाकटेक दिग्गज ने उस शोध को विस्तृत किया जो Matrix3D AI मॉडल के विकास में चला गया। जबकि कई 3 डी रेंडरिंग मॉडल पहले से मौजूद हैं, यह 3 डी व्यू बनाने के लिए पाइपलाइन को एकजुट करके मौजूदा स्थान को नवाचार करता है। कई मॉडल और घटकों के होने के बजाय, यहां, एक एकल एलएलएम कई फोटोग्राममेट्री सबटास्क करता है जैसे कि मुद्रा अनुमान, गहराई की भविष्यवाणी और उपन्यास दृश्य संश्लेषण।
विशेष रूप से, फोटोग्राममेट्री छवियों का विश्लेषण करके भौतिक वस्तुओं और वातावरण के बारे में सटीक माप और 3 डी जानकारी प्राप्त करने की तकनीक है। यह आमतौर पर विभिन्न कोणों से ली गई 2 डी छवियों से नक्शे, 3 डी मॉडल और माप बनाने के लिए उपयोग किया जाता है।
शोधकर्ताओं ने भी प्रकाशित किया है कागज़ ऑनलाइन प्रीप्रिंट जर्नल Arxiv पर नए मॉडल के बारे में। शोधों के अनुसार, Matrix3D एक मल्टीमॉडल डिफ्यूजन ट्रांसफार्मर (DIT) आर्किटेक्चर पर आधारित है। यह कई तौर -तरीकों जैसे कि छवि डेटा, कैमरा पैरामीटर और गहराई के नक्शे में डेटा को एकीकृत कर सकता है।
पेपर में, Apple के शोधकर्ताओं पर प्रकाश डाला गया कि मॉडल को एक मुखौटा सीखने की रणनीति का उपयोग करके प्रशिक्षित किया गया था, जहां छवि का एक हिस्सा बाधित होता है, और AI मॉडल को सही पिक्सेल खोजने के लिए प्रशिक्षित किया जाता है जो अंतराल में फिट होता है।
शोधकर्ताओं ने पाया कि एलएलएम विभिन्न कोणों से सिर्फ तीन छवियों के साथ एक संपूर्ण 3 डी ऑब्जेक्ट या दृश्य दृश्य उत्पन्न कर सकता है। जबकि मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटासेट का खुलासा नहीं किया गया था, मॉडल स्वयं कंपनी के GitHub पर एक अनुमेय Apple लाइसेंस के माध्यम से डाउनलोड, संशोधित करने और पुनर्वितरण के लिए उपलब्ध है प्रविष्टि।
AI & Automation
सैमसंग गैलेक्सी वॉच और गैलेक्सी बड्स 3 सीरीज़ एआई-पावर्ड जेमिनी इंटीग्रेशन जल्द ही प्राप्त करने के लिए

SAMSUNG बुधवार को एकीकरण की घोषणा की मिथुनGoogle की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट, अपने वियरबल्स के लाइनअप में। सैमसंग गैलेक्सी वॉच और आकाशगंगा कलियाँ 3 श्रृंखला उपयोगकर्ता जल्द ही अनुस्मारक स्थापित करने, ग्रंथों को सारांशित करने, मौसम के अपडेट प्राप्त करने और अन्य गतिविधियों के लिए एआई सहायक का लाभ उठाने में सक्षम होंगे जो एआई बॉट ने पहले फोन पर अनुमति दी थी। इस कदम के साथ, कंपनी गैलेक्सी इकोसिस्टम में सभी उपकरणों में एआई सुविधाओं की उपस्थिति का विस्तार करती है।
सैमसंग गैलेक्सी वॉच, गैलेक्सी बड्स पर मिथुन
एक प्रेस नोट में, सैमसंग ने कहा कि गैलेक्सी वॉच पर मिथुन की शुरूआत गैलेक्सी पहनने योग्य लाइनअप में पहली बार एकीकरण को चिह्नित करती है। इसे सैमसंग के प्रमुख ट्रू वायरलेस स्टीरियो (TWS) ईयरबड्स – गैलेक्सी बड्स 3 सीरीज़ में भी एकीकृत किया जाएगा, जिसमें सक्रियण प्रक्रिया को “यहां तक कि स्मूथ” के रूप में उद्धृत किया गया है।
गैलेक्सी वॉच पर, मिथुन नेचुरल वॉयस कमांड का उपयोग करके हाथों से मुक्त सहायता प्रदान की जाती है। उदाहरण के लिए, उपयोगकर्ता मिथुन से पूछ सकते हैं कि “मैं आज लॉकर 43 का उपयोग कर रहा हूं”, और एआई सहायक इसके लिए एक अनुस्मारक सेट करेगा। वे इसे त्वरित अवलोकन के लिए ईमेल को संक्षेप में प्रस्तुत करने के लिए भी कह सकते हैं। कंपनी का कहना है कि मिथुन प्रतिक्रिया देने और कार्रवाई करने के लिए ऐप्स में अनुरोधों को संभालता है।
सैमसंग कहते हैं, इस बीच, गैलेक्सी बड्स 3 सीरीज़ उपयोगकर्ताओं को मिथुन के साथ और भी अधिक सहज अनुभव हो सकता है। वे वॉयस कमांड या चुटकी का उपयोग कर सकते हैं और फोन के साथ बातचीत किए बिना, मौसम के अपडेट प्राप्त करने के लिए TWS Earbuds पर AI सहायक को आमंत्रित करने के लिए पकड़ सकते हैं।
विशेष रूप से, Google भी है लाना अधिक उपकरणों के लिए मिथुन। यह घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, Google I/O 2025 के लिए कंपनी का बिल्डअप जो अगले सप्ताह बंद हो जाता है। टेक दिग्गज के अनुसार, यह एंड्रॉइड टीवी के माध्यम से स्मार्ट टीवी पर, और एंड्रॉइड ऑटो के माध्यम से इन-कार इन्फोटेनमेंट सिस्टम के माध्यम से वियर ओएस के माध्यम से स्मार्टवॉच में आएगा। इसके अतिरिक्त, हेडसेट और स्मार्ट चश्मा द्वारा संचालित एंड्रॉइड एक्सआर ऑपरेटिंग सिस्टम एआई सहायक की क्षमताओं से भी लाभान्वित होगा।
जबकि उपलब्धता प्रश्न के तहत बनी हुई है, Google ने संकेत दिया कि मिथुन द्वारा संचालित सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।
AI & Automation
Microsoft संगठन-व्यापी कटौती में लगभग तीन प्रतिशत कार्यबल को बंद करने के लिए

Microsoft ने मंगलवार को कहा कि वह अपने कार्यबल के तीन प्रतिशत से भी कम या लगभग 6,000 कर्मचारियों को बंद कर रहा था, क्योंकि प्रौद्योगिकी दिग्गज आर्टिफिशियल इंटेलिजेंस पर अपने महत्वाकांक्षी दांव में अरबों डॉलर की फ़नलिंग करते हुए लागतों पर लगाम लगाते हैं।
कटौती सभी स्तरों और भौगोलिक क्षेत्रों में होगी और संभवतः सबसे बड़ी संभावना है माइक्रोसॉफ्ट 2023 में 10,000 कर्मचारियों को बंद कर दिया। कंपनी ने जनवरी में प्रदर्शन से संबंधित मुद्दों पर कम संख्या में कर्मचारियों को जाने दिया, लेकिन नए कटौती से संबंधित नहीं हैं, सीएनबीसी के अनुसार, जिसने पहली बार समाचार की सूचना दी थी।
बिग टेक एआई पर भारी खर्च कर रहा है क्योंकि वे नई तकनीक को एक प्रमुख विकास इंजन के रूप में देखते हैं, जबकि लाभ मार्जिन की सुरक्षा के लिए कहीं और लागत को कम करते हैं। गूगल पिछले एक साल में सैकड़ों कर्मचारियों को भी बंद कर दिया है, क्योंकि यह लागत को नियंत्रित करने और एआई को प्राथमिकता देने के लिए लगता है, मीडिया रिपोर्टों ने कहा है।
माइक्रोसॉफ्ट के प्रवक्ता ने मेल पर कहा, “हम एक गतिशील बाज़ार में सफलता के लिए कंपनी को सर्वोत्तम स्थिति के लिए आवश्यक संगठनात्मक परिवर्तनों को लागू करना जारी रखते हैं।”
कंपनी, जिसमें पिछले साल जून तक 2,28,000 श्रमिक थे, नियमित रूप से अपने मुख्य फोकस क्षेत्रों में स्टाफिंग को प्राथमिकता देने के लिए छंटनी का उपयोग करती है।
Microsoft ने अपने क्लाउड-कंप्यूटिंग व्यवसाय में मजबूत-से-अपेक्षित वृद्धि पोस्ट करने के हफ्तों बाद मंगलवार का कदम आता है नीला और नवीनतम तिमाही में ब्लोआउट परिणाम, एक अनिश्चित अर्थव्यवस्था में निवेशक को शांत करना।
लेकिन इसके एआई बुनियादी ढांचे को स्केल करने की लागत ने लाभप्रदता पर तौला है, माइक्रोसॉफ्ट क्लाउड मार्जिन के साथ मार्च तिमाही में एक साल पहले 72 प्रतिशत से 69 प्रतिशत तक पहुंच गया था।
Microsoft ने इस वित्तीय वर्ष में पूंजी खर्च करने में पूंजी में $ 80 बिलियन (लगभग 6,83,255 करोड़ रुपये) की शुरुआत की है, इसका उद्देश्य आर्टिफिशियल इंटेलिजेंस सेवाओं के लिए क्षमता को कम करने के लिए डेटा केंद्रों का विस्तार करना है।
डीए डेविडसन के विश्लेषक गिल लुरिया ने कहा कि छंटनी ने दिखाया कि माइक्रोसॉफ्ट अपने ऊंचे एआई निवेशों द्वारा बनाए गए मार्जिन दबाव को प्रबंधित कर रहा था।
“हम मानते हैं कि हर साल Microsoft मौजूदा स्तरों पर निवेश करता है, इसे अपने पूंजीगत व्यय के कारण उच्च मूल्यह्रास स्तरों के लिए बनाने के लिए कम से कम 10,000 तक हेडकाउंट को कम करने की आवश्यकता होगी,” उन्होंने कहा।
© थॉमसन रॉयटर्स 2025
(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)
AI & Automation
Tiktok कहानियों में फ़ोटो से वीडियो बनाने के लिए नए AI अलाइव टूल का परिचय देता है

टिकटोक एक नई आर्टिफिशियल इंटेलिजेंस (एआई) सुविधा पेश कर रही है जो उपयोगकर्ताओं को एक छवि को एक एनिमेटेड वीडियो में बदलने की अनुमति देगा। मंगलवार को, वर्टिकल वीडियो-आधारित सोशल मीडिया प्लेटफॉर्म ने एक नए एआई सुविधा की घोषणा की, जिसे एआई अलाइव कहा जाता है जो तस्वीरों से वीडियो बनाने के लिए जेनेरिक एआई तकनीक का उपयोग करता है। वर्तमान में, टूल का उपयोग केवल टिकटोक कहानियों में वीडियो उत्पन्न करने के लिए किया जा सकता है, न कि सीधे फ़ीड के लिए। इसके अतिरिक्त, कंपनी ने कहा कि यह उपयोगकर्ताओं द्वारा दुर्व्यवहार किए जा रहे फीचर के जोखिम को कम करने के लिए कई कदम उठा रहा है।
Tiktok ai अलाइव फीचर आपकी तस्वीरों को वीडियो में बदल सकता है
एक न्यूज़ रूम में डाक अपनी अमेरिकी वेबसाइट पर, टिकटोक ने नए एआई फीचर के रोलआउट की घोषणा की। यह किसी भी वीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म द्वारा पेश किया गया पहला एआई-संचालित इमेज-टू-वीडियो जनरेशन टूल है। इंस्टाग्राम, एक्स, और स्नैपचैट किसी भी एआई-संचालित वीडियो जनरेशन टूल की पेशकश नहीं करते हैं। जबकि YouTube शॉर्ट्स हाल ही में शुरू हुआ है परीक्षण एक टेक्स्ट-टू-वीडियो जनरेशन फीचर, इसे व्यापक रूप से रोल आउट नहीं किया गया है।
Tiktok AI अलाइव फीचर इनबॉक्स पेज या प्रोफाइल पेज के शीर्ष पर ब्लू प्लस आइकन (+) को टैप करके पाया जा सकता है। वहां, उपयोगकर्ताओं को पहले अपने स्टोरी एल्बम से एक ही छवि का चयन करना होगा। एआई अलाइव आइकन फोटो एडिट पेज पर दाईं ओर टूलबार पर स्थित है। इसे ऊपर से दूसरे स्थान पर रखा जाना चाहिए।
एआई अलाइव आइकन पर टैप करने से एक और विंडो खुलती है, जहां उपयोगकर्ता एक टेक्स्ट प्रॉम्प्ट जोड़ सकते हैं कि वे कैसे चाहते हैं कि छवि एनिमेटेड हो। यदि वे निश्चित नहीं हैं, तो वे एक ही पृष्ठ पर कई सुझाए गए पाठ संकेतों में से एक का भी उपयोग कर सकते हैं। एक बार हो जाने के बाद, वे जनरेट बटन को टैप कर सकते हैं और एक छोटा वीडियो बनाया जाता है। उपयोगकर्ता तब वीडियो पोस्ट कर सकते हैं, और लोग आपके लिए और फॉलो फ़ीड्स के साथ -साथ उपयोगकर्ता के प्रोफाइल पेज पर कहानी को वीडियो कर सकते हैं।
कंपनी ने कहा कि इसने अपलोड किए गए फोटो, टेक्स्ट प्रॉम्प्ट और एआई अलाइव वीडियो की समीक्षा करने के लिए मॉडरेशन तकनीक को लागू किया है, इससे पहले कि यह निर्माता को दिखाया जाए। एक अंतिम चेक तब होता है जब उपयोगकर्ता वीडियो को अपनी कहानी पर पोस्ट करता है। इसके अतिरिक्त, अन्य उपयोगकर्ता उन वीडियो की रिपोर्ट कर सकते हैं जो उन्हें लगता है कि प्लेटफ़ॉर्म के दिशानिर्देशों को तोड़ सकते हैं।
इसके अलावा, टिक्तोक भी एक दृश्यमान एआई-जनित लेबल जोड़ रहा है ताकि लोगों को यह पता चल सके कि यह एक सिंथेटिक वीडियो है। कंपनी ने कहा कि सामग्री सिद्धता और प्रामाणिकता (C2PA) मेटाडेटा के लिए गठबंधन, प्रमुख AI खिलाड़ियों के बीच एक मानक, हर AI- जनरेट किए गए वीडियो में भी जोड़ा जाता है, कंपनी ने कहा।
-
Internet & Social Media2 months ago
ट्विटर एक्स बन जाता है: कैसे एलोन मस्क अपने 1999 में एक ‘सब कुछ ऐप’ बनाने के अपने सपने की ओर काम कर रहा है
-
AI & Automation1 month ago
Google चैट में मिथुन कार्यक्षेत्र उपयोगकर्ताओं के लिए रोल आउट, अपठित वार्तालापों को संक्षेप में प्रस्तुत कर सकता है
-
Tech News2 months ago
Poco X7 and X7 Pro Review: The Mid-Range Marvels
-
Tech News2 months ago
Realme 14 5g स्नैपड्रैगन 6 जनरल 4 SOC के साथ, बाईपास चार्जिंग लॉन्च: मूल्य, सुविधाएँ
-
Gadgets2 months ago
सैमसंग गैलेक्सी टैब S9+ विनिर्देशों geekbench पर टैबलेट सतहों के रूप में रिसाव: सभी विवरण
-
Tech News2 months ago
Realme 14 Pro+ 5G अब भारत में 512GB स्टोरेज के साथ उपलब्ध है: मूल्य, उपलब्धता
-
Tech News2 months ago
Realme gt 7t ने कार्यों में होने के लिए इत्तला दे दी; एनएफसी समर्थन की पेशकश करने के लिए कहा
-
Gadgets2 months ago
Xiaomi Pad 6s Pro ने 22 फरवरी को लॉन्च करने की पुष्टि की; डिजाइन, प्रमुख विनिर्देशों का पता चला
-
Gadgets2 months ago
Xiaomi Pad 7, Xiaomi Pad 7 Pro 11.2-इंच 3.2K डिस्प्ले के साथ, हाइपरोस 2 UI लॉन्च: मूल्य, विनिर्देश
-
Tech News2 months ago
Xiaomi Holi बिक्री Redmi Note 14 5G, नोट 13 श्रृंखला और अन्य फोन पर छूट लाती है
-
Tech News2 months ago
POCO F7 प्रो कुंजी सुविधाओं की सतह ऑनलाइन; एक स्नैपड्रैगन 8 जनरल 3 एसओसी मिल सकता है
-
Tech News2 months ago
सैमसंग वन यूआई 7 बीटा गैलेक्सी जेड फ्लिप 6, गैलेक्सी जेड फोल्ड 6 में भारत, यूएस, और बहुत कुछ का विस्तार करता है
-
AI & Automation2 months ago
NDTV Gadgets 360 Awards 2025: Check out the Nominations for India’s Most Trusted Award Show
-
Tech News2 months ago
NDTV Gadgets 360 Awards 2025: Check out the Nominations for India’s Most Trusted Award Show
-
Tech News2 months ago
मोटोरोला एज 60 प्रो की लीक हुई छवियां कथित तौर पर एक नए बटन को शामिल करने की ओर संकेत करती हैं
-
Internet & Social Media2 months ago
मेटा ने कथित तौर पर AI उपयोगकर्ताओं के ‘सैकड़ों हजारों’ को फेसबुक, इंस्टाग्राम पर जोड़ने की योजना बनाई है
-
AI & Automation2 months ago
Microsoft कथित तौर पर Microsoft 365 सदस्यता और लंबी पैदल यात्रा की कीमतों के साथ Copilot AI को बंडल करना
-
Internet & Social Media2 months ago
एक्स वीडियो कॉलिंग सपोर्ट की पुष्टि सीईओ लिंडा याकारिनो ने एलोन मस्क के नेतृत्व वाली फर्म के रूप में कार्यक्षमता का विस्तार किया
-
Internet & Social Media2 months ago
मेटा इंस्टाग्राम, फेसबुक मैसेंजर पर किशोरों के लिए सख्त संदेश सेटिंग्स लाता है
-
Internet & Social Media2 months ago
Ray-Ban Meta Smart Glasses Review: Versatile and Practical