Connect with us

AI & Automation

मेटा ने कथित तौर पर यह स्पष्ट करने से इनकार कर दिया कि क्या रे-बैन मेटा स्मार्ट ग्लास द्वारा कैप्चर किए गए वीडियो निजी रहेंगे

Published

on

मेटा कथित तौर पर इस बात पर चुप रह रहा है कि क्या वह अपने आर्टिफिशियल इंटेलिजेंस (एआई) पहनने योग्य डिवाइस रे-बैन मेटा स्मार्ट ग्लासेस से अपने बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित करने के लिए वीडियो और इमेज डेटा एकत्र कर रहा है। कंपनी ने एक नए रियल-टाइम वीडियो की घोषणा की विशेषता उस डिवाइस के लिए जो उपयोगकर्ता एआई को प्रश्नों का उत्तर देने के लिए कह सकते हैं और अपने परिवेश के आधार पर सुझाव मांग सकते हैं। हालांकि, इस डेटा पर क्या होता है, इस पर कोई स्पष्टता नहीं है कि एक बार एआई क्वेरी का जवाब देता है।

विचाराधीन सुविधा वास्तविक समय की वीडियो क्षमता है जो मेटा एआई को उपयोगकर्ताओं के परिवेश पर “लुक” करने की अनुमति देती है और उस दृश्य जानकारी को किसी भी क्वेरी का जवाब देने के लिए प्रक्रिया की प्रक्रिया कर सकती है। उदाहरण के लिए, एक उपयोगकर्ता इसे एक प्रसिद्ध लैंडमार्क की पहचान करने के लिए कह सकता है, इसे कोठरी दिखा सकता है और अलमारी के सुझावों के लिए पूछ सकता है, या यहां तक ​​कि रेफ्रिजरेटर में सामग्री के आधार पर व्यंजनों के लिए पूछ सकता है।

हालांकि, इनमें से प्रत्येक कार्यक्षमता को संदर्भ को समझने के लिए निष्क्रिय वीडियो और परिवेश की छवियों को लेने के लिए रे-बैन मेटा स्मार्ट चश्मा की आवश्यकता होती है। सामान्य परिस्थितियों में, एक बार प्रतिक्रिया उत्पन्न हो जाने के बाद और उपयोगकर्ता ने बातचीत को समाप्त कर दिया है, डेटा को निजी सर्वर में छोड़ दिया जाना चाहिए यदि तुरंत हटाए न जाए। ऐसा इसलिए है क्योंकि बहुत सारे डेटा उपयोगकर्ता के घर और अन्य सामानों के बारे में निजी जानकारी हो सकते हैं।

लेकिन मेटा कथित तौर पर यह नहीं बता रहा है। यह पूछे जाने पर कि क्या कंपनी इस डेटा को संग्रहीत कर रही है और इस पर देशी एआई मॉडल को प्रशिक्षित कर रही है, एक मेटा प्रवक्ता बताया TechCrunch कि कंपनी सार्वजनिक रूप से मामले पर चर्चा नहीं कर रही है। एक अन्य प्रवक्ता ने कथित तौर पर इस बात पर प्रकाश डाला कि यह जानकारी बाहरी रूप से साझा नहीं की जा रही है और कहा कि “हम किसी भी तरह से नहीं कह रहे हैं।”

कंपनी का स्पष्ट रूप से यह बताने से इनकार करने से कि उपयोगकर्ता डेटा के साथ क्या होता है, निजी, और संभावित रूप से संवेदनशील प्रकृति के विषय में स्मार्ट चश्मा कैप्चर कर सकता है। जबकि मेटा ने पहले से ही फेसबुक और इंस्टाग्राम पर अपने यूएस-आधारित उपयोगकर्ताओं के सार्वजनिक उपयोगकर्ता डेटा पर अपने एआई मॉडल को प्रशिक्षित करने की पुष्टि की है, रे-बैन मेटा स्मार्ट चश्मा के डेटा सार्वजनिक नहीं हैं।

गैजेट्स 360 एक टिप्पणी के लिए मेटा में पहुंच गया है। कंपनी से एक बयान प्राप्त करने के बाद हम कहानी को अपडेट करेंगे।

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

Google मिथुन उन्नत उपयोगकर्ता अब चैटबॉट को GitHub के साथ कनेक्ट कर सकते हैं

Published

on

By

गूगल अपने आर्टिफिशियल इंटेलिजेंस (एआई) चैटबोट, मिथुन में एक नई सुविधा जोड़ रहा है। बुधवार को घोषित, मिथुन अब GitHub रिपॉजिटरी से जुड़ सकता है और कई कोडिंग कार्य कर सकता है। इनमें फ़ंक्शंस उत्पन्न करना और संशोधित करना, कोड की व्याख्या करना, कोडबेस के बारे में प्रश्नों का उत्तर देना, डिबगिंग कोड, और बहुत कुछ शामिल हैं। वर्तमान में, यह सुविधा केवल प्लेटफ़ॉर्म के भुगतान किए गए ग्राहकों के लिए उपलब्ध है। विशेष रूप से, माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की कि वह अब मिथुन को अधिक उपकरणों में विस्तारित करेगा, जिसमें स्मार्टवॉच, स्मार्ट टीवी, कारों में इन्फोटेनमेंट सिस्टम, और बहुत कुछ शामिल हैं।

मिथुन एडवांस्ड अब GitHub Repos तक पहुंच सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), मिथुन ऐप के आधिकारिक हैंडल ने नई सुविधा की घोषणा की। द पोस्ट में कहा गया है, “मिथुन एडवांस्ड अब GitHub के साथ जुड़ता है, जिससे यह अधिक शक्तिशाली कोडिंग सहायक बन जाता है।” मोबाइल ऐप या वेब क्लाइंट के नवीनतम संस्करण का उपयोग करने वालों को नई सुविधा तक पहुंचने में सक्षम होना चाहिए। विशेष रूप से, यह सुविधा केवल मिथुन उन्नत ग्राहकों के लिए उपलब्ध है।

जबकि सुविधा चैटबॉट की कोडिंग क्षमता को बढ़ाती नहीं है, यह इसके उपयोग के मामले को अधिक व्यक्तिगत बनाता है। उपयोगकर्ता अब एआई को अपने रिपॉजिटरी से जोड़ सकते हैं और फिर पूछ सकते हैं मिथुन उनके बारे में प्रश्न या कोडबेस को डीबग करने के लिए पूछें।

Google का कहना है कि यह नई क्षमता मिथुन को कोड और फ़ंक्शंस को उत्पन्न करने और संशोधित करने, कोड का विश्लेषण और व्याख्या करने, क्वेरी, डेबग, और बहुत कुछ करने की अनुमति देगी। दिखाए गए एक उदाहरण में, मिथुन कोड का विश्लेषण करने और इसे और अधिक कुशल बनाने के तरीके दिखाने में सक्षम था।

सुविधा का उपयोग करने के लिए, मिथुन उन्नत उपयोगकर्ता पाठ फ़ील्ड के बाईं ओर प्लस आइकन (+) पर टैप कर सकते हैं और “आयात कोड” विकल्प का चयन कर सकते हैं। एक बार हो जाने के बाद, वे एक और टेक्स्ट बॉक्स देखेंगे जहां वे GitHub URL को पेस्ट कर सकते हैं। ये लिंक सार्वजनिक या निजी प्रतिनिधि से संबंधित हो सकते हैं, एआई दोनों के साथ काम करता है। विशेष रूप से, भारत में मिथुन उन्नत सदस्यता की लागत रु। 1,950 प्रति माह।

इस हफ्ते की शुरुआत में, टेक दिग्गज ने मिथुन के अधिक एंड्रॉइड डिवाइसों के विस्तार की घोषणा की। Google ने कहा कि आने वाले महीनों में, मिथुन को स्मार्टवॉच, स्मार्ट टीवी, इन-कार इन्फोटेनमेंट सिस्टम और यहां तक ​​कि हेडसेट और स्मार्ट ग्लास में एकीकृत किया जाएगा।

Continue Reading

AI & Automation

Tiktok AI- संचालित वैकल्पिक पाठ और अन्य पहुंच सुविधाओं के लिए समर्थन जोड़ता है

Published

on

By

टिकटोक गुरुवार को तीन नई पहुंच-केंद्रित सुविधाओं की घोषणा की। ग्लोबल एक्सेसिबिलिटी अवेयरनेस डे के अवसर पर नई सुविधाओं की घोषणा की गई, जो मई में तीसरे गुरुवार को आती है (इस साल, यह 15 मई को है)। नई विशेषताओं में से एक वैकल्पिक पाठ (ALT पाठ) समर्थन के लिए एक अद्यतन है, जो अब स्वचालित वर्णनात्मक कैप्शन उत्पन्न करने के लिए कृत्रिम बुद्धिमत्ता (AI) का उपयोग करता है। अन्य एक्सेसिबिलिटी सुविधाओं में एक नया उच्च कंट्रास्ट मोड और बोल्ड टेक्स्ट के लिए समर्थन शामिल है। विशेष रूप से, इस सप्ताह की शुरुआत में, कंपनी पुर: एक नया इमेज-टू-वीडियो जनरेशन टूल।

Tiktok तीन नई एक्सेसिबिलिटी फीचर्स लाता है

एक न्यूज़ रूम में डाकवीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म ने तीन नई एक्सेसिबिलिटी फीचर्स को विस्तृत किया, जो उपयोगकर्ताओं के लिए पेश कर रहे थे। ये सुविधाएँ प्लेटफ़ॉर्म के मौजूदा एक्सेसिबिलिटी टूल्स में शामिल होंगी, जैसे कि वीडियो, डार्क मोड, टेक्स्ट-टू-स्पीच और थंबनेल एनीमेशन के लिए ऑटो-जनित कैप्शन।

पहली नई सुविधा एआई-जनित ALT पाठ है। Tiktok ने कई हफ्ते पहले फोटो पोस्ट के लिए ALT पाठ जोड़ा। उपयोगकर्ता मैन्युअल रूप से छवि का वर्णन करते हुए एक कैप्शन जोड़ सकते हैं, और इसे स्क्रीन पाठकों द्वारा ज़ोर से पढ़ा जा सकता है। अब, यह उन फ़ोटो के लिए वर्णनात्मक कैप्शन उत्पन्न करने के लिए AI का उपयोग करके सुविधा पर निर्माण कर रहा है जिनमें ALT पाठ नहीं है। कंपनी का कहना है कि यह उन लोगों के लिए प्रयोज्य में सुधार करेगा जो अंधे हैं, कम दृष्टि रखते हैं, या सामग्री को अलग तरह से प्रक्रिया करते हैं।

अगला मंच पर रंग विपरीत बढ़ाने का एक विकल्प है। Tiktok एक उच्च विपरीत मोड पेश कर रहा है जो पाठ, आइकन और उपयोगकर्ता इंटरफ़ेस तत्वों के अग्रभूमि रंग को बढ़ाता है। यह सुविधा में पाया जा सकता है सरल उपयोग भीतर विकल्प सेटिंगके रूप में चिह्नित रंग कंट्रास्ट बढ़ाएं। टिकटोक का कहना है कि यह मंच को कम दृष्टि वाले व्यक्तियों के लिए या कम विपरीत के प्रति संवेदनशील लोगों के लिए अधिक उपयोगकर्ता के अनुकूल बना देगा।

अंत में, प्लेटफ़ॉर्म उपकरणों में बोल्ड टेक्स्ट सेटिंग के लिए समर्थन भी जोड़ रहा है। यदि किसी डिवाइस ने टेक्स्ट सेटिंग को बोल्ड पर सेट किया है, तो वे अब सभी इन-ऐप टेक्स्ट देखेंगे, जिसमें नाम, टिप्पणियां, कैप्शन और संदेश भी शामिल हैं। यह उन उपयोगकर्ताओं के लिए पठनीयता बढ़ाएगा जो बोल्डर पाठ पसंद करते हैं या दृष्टि मुद्दे हैं। ये सभी नई सुविधाएँ अब नवीनतम अपडेट वाले सभी उपयोगकर्ताओं के लिए उपलब्ध हैं।


Continue Reading

AI & Automation

Google DeepMind Alphaevolve का अनावरण करता है, एक कोडिंग एजेंट जो AI मतिभ्रम को कम करने के लिए डिज़ाइन किया गया है

Published

on

By

Google DeepMind बुधवार को एक नए आर्टिफिशियल इंटेलिजेंस (एआई) कोडिंग एजेंट की घोषणा की जो एआई मॉडल की क्षमताओं को बढ़ा सकती है। डब्ड अल्फावोल्व, यह जटिल कंप्यूटिंग और गणितीय कार्यों में एल्गोरिदम को खोजने और अनुकूलित करने के लिए डिज़ाइन किया गया है। शक्तिशाली एआई प्रणाली माउंटेन व्यू-आधारित टेक दिग्गज के मिथुन मॉडल पर बनाई गई है, और यह बड़े भाषा मॉडल द्वारा उत्पन्न आउटपुट को स्वचालित मूल्यांकनकर्ताओं के साथ उत्पन्न करता है ताकि वास्तविकता में प्रतिक्रियाओं को जमीन पर रखा जा सके और मतिभ्रम के जोखिम को कम किया जा सके। इसके अलावा, सिस्टम को गणितीय समस्याओं को हल करने और अनुकूलित करने में क्षमता भी दिखाई गई है।

Google DeepMind अल्फावोलव कोडिंग एजेंट का परिचय देता है

में एक ब्लॉग भेजादीपमाइंड ने जिस नई तकनीक पर काम किया है, वह विस्तृत है। Alphaevolve एक AI मॉडल नहीं है, इसके बजाय, यह एजेंटिक क्षमताओं के साथ एक जटिल AI प्रणाली है। सिस्टम द्वारा किए गए प्राथमिक कार्यों में से एक एल्गोरिथ्म खोज और अनुकूलन है।

एआई मॉडल, एक मौलिक स्तर पर, कोड की एक श्रृंखला है। ये कोड आधार प्रक्रिया और संकलन जानकारी, इसे तोड़ते हैं, और आउटपुट उत्पन्न करने के लिए संभाव्य एल्गोरिदम का उपयोग करते हैं। हालांकि, चूंकि एआई सिस्टम अत्यधिक जटिल हैं, इसलिए उनके कोड आधार बड़े पैमाने पर हैं। यह बड़ा आकार अक्सर अनुकूलन और दक्षता-आधारित मुद्दों का कारण बनता है। अल्फावोलवे इसके साथ मदद कर सकता है, कंपनी ने कहा।

Alphaevolve काम कर रहे Google Alphaevolve

अल्फेवोल्व संरचना
फोटो क्रेडिट: Google

Alphaevolve स्वचालित मूल्यांकन मेट्रिक्स का उपयोग करता है, और इन मापदंडों का उपयोग करके, यह AI मॉडल द्वारा उत्पन्न किए गए प्रतिक्रियाओं को सत्यापित करता है, चलाता है और स्कोर करता है। गूगल कहा कि यह विधि प्रणाली को कई एआई मॉडल से प्रतिक्रियाओं का आकलन करने और मतिभ्रम के जोखिम को कम करने की अनुमति देती है। इसके अतिरिक्त, सिस्टम ऐसे कोड को भी ठीक और सुधार सकता है जो इस तरह के मतिभ्रम की अनुमति देता है।

टेक दिग्गज ने कहा कि अल्फेवोल्व ने Google के डेटा सेंटर, चिप डिज़ाइन और एआई प्रशिक्षण प्रक्रियाओं की दक्षता में सुधार किया है। दिलचस्प बात यह है कि यह अपने स्वयं के आधार एलएलएम के प्रशिक्षण में सुधार करने में भी सक्षम था। एक मामले में, इसने एक नई शेड्यूलिंग विधि की खोज की जो Google के वैश्विक गणना संसाधनों के लगभग 0.7 प्रतिशत को ठीक करती है – कंपनी के बड़े पैमाने पर बुनियादी ढांचे में लागू होने पर एक बड़ा लाभ।

चूंकि अल्फावोल्व कोड बेस और एल्गोरिदम के साथ काम करता है, इसलिए यह भी कहा जाता है कि गणितीय समस्या को हल करने के विभिन्न क्षेत्रों में उच्च क्षमता है, कंपनी ने कहा। कहा जाता है कि यह 4×4 कॉम्प्लेक्स मैट्रिसेस को गुणा करने के लिए एक तेज विधि की खोज की गई है, जो एक समाधान को हराकर 50 से अधिक वर्षों तक खड़ा था। 50 खुली गणितीय समस्याओं के परीक्षणों में, अल्फेवोलवे ने ज्यादातर मामलों में वर्तमान सर्वश्रेष्ठ समाधानों का मिलान किया, और यहां तक ​​कि लगभग 20 प्रतिशत समस्याओं में उन पर सुधार किया, पोस्ट ने कहा।

Continue Reading

AI & Automation

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 एआई पीसी के साथ इंटेल कोर अल्ट्रा सीपीयू के साथ भारत में लॉन्च किया गया

Published

on

By

गड्ढा कृत्रिम बुद्धिमत्ता की एक विस्तृत श्रृंखला लॉन्च की () भारत में गुरुवार को पीसी। लाइनअप में तीन मॉडल शामिल हैं-डेल 14 प्लस, डेल 16 प्लस, और डेल 14 2-इन -1, जिन्हें डेल प्लस पोर्टफोलियो के हिस्से के रूप में नई यूनिफाइड ब्रांडिंग के तहत पेश किया गया है। कंपनी के अनुसार, इसके नए एआई पीसी नवीनतम इंटेल कोर अल्ट्रा प्रोसेसर द्वारा संचालित हैं और कोपिलॉट+ एआई क्षमताओं को वितरित करने के लिए बनाए गए हैं। जबकि डेल 14 प्लस और डेल 16 प्लस में एक पारंपरिक लैपटॉप डिज़ाइन है, डेल 14 2-इन -1 एक बहुमुखी पेशकश है जो लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण कर सकता है।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 मूल्य भारत में

डेल 14 2-इन -1 मूल्य भारत में रुपये से शुरू होता है। 96,899। इस बीच, डेल 14 प्लस और डेल 16 प्लस मॉडल की कीमत रु। 1,15,799 और रु। आधार विन्यास के लिए क्रमशः 1,08,499। लैपटॉप डेल.कॉम, डेल एक्सक्लूसिव स्टोर्स, रिटेल पार्टनर्स जैसे क्रोमा, रिलायंस रिटेल और विजय सेल्स, और अन्य मल्टी-ब्रांड आउटलेट्स और प्रमुख ई-कॉमर्स प्लेटफॉर्म के माध्यम से खरीद के लिए उपलब्ध होगा।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 विनिर्देश

डेल 14 प्लस और 14 2-इन -1 मॉडल में क्रमशः 14-इंच 2.5k (2,560 x 1,600 पिक्सल) एंटी-ग्लेयर नॉन-टचस्क्रीन डिस्प्ले और 14-इंच पूर्ण एचडी+ (1,920 x 1,200 पिक्सल) टच स्क्रीन डिस्प्ले हैं। इस बीच, डेल 16 प्लस में 16 इंच का पूर्ण एचडी+ (1,920 x 1,200 पिक्सेल) स्क्रीन है। 2-इन -1 मॉडल 360-डिग्री काज के साथ आता है जो इसे लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण में मदद करता है।

सभी मॉडलों में 300nits पीक चमक तक है। उन्हें आठ कोर के साथ एक इंटेल कोर अल्ट्रा 7 256V प्रोसेसर और 4.8GHz की पीक घड़ी की गति के साथ कॉन्फ़िगर किया जा सकता है। वे एक समर्पित तंत्रिका प्रसंस्करण इकाई (NPU) के साथ भी आते हैं, जो अकेले 47 TERA संचालन प्रति सेकंड (TOPS) के शिखर प्रदर्शन को देने का दावा किया जाता है। डब एआई पीसीएस, नए डेल प्लस मॉडल कोपिलॉट+ क्षमताओं के साथ आते हैं। कंपनी उपयोगकर्ताओं को अपनी उत्पादकता को अधिकतम करने में उपयोगकर्ताओं की मदद करने के लिए AI- चालित उपकरण जैसे रिकॉल और Cocreator भी प्रदान करती है।

पूरे डेल प्लस लाइनअप में एक्सप्रेसचार्ज तकनीक की सुविधा है जो लैपटॉप को 60 मिनट में 80 प्रतिशत तक बढ़ा सकती है। कनेक्टिविटी विकल्पों में वाई-फाई 7, ब्लूटूथ, यूएसबी 3.2 जनरल 1 टाइप-ए पोर्ट, यूएसबी 3.2 जनरल 2 टाइप-सी पोर्ट, डिस्प्लेपोर्ट 2.1 के साथ थंडरबोल्ट 4, एक एचडीएमआई 2.1 पोर्ट और 3.5 मिमी हेडफोन जैक शामिल हैं।

Continue Reading

AI & Automation

Openai GPT-4.1 AI मॉडल का विस्तार करता है, जिसमें उन्नत कोडिंग क्षमताओं के साथ CHATGPT

Published

on

By

ओपनई CHATGPT के लिए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल की हाल ही में जारी GPT-4.1 श्रृंखला के विस्तार की घोषणा की। ये मॉडल अब तक थे अनन्य कंपनी के एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के लिए, लेकिन गुरुवार को, सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि वे चैटबॉट के भीतर भी उपलब्ध होंगे। विशेष रूप से, GPT-4.1 और GPT-4.1 मिनी मॉडल वर्तमान में CHATGPT के लिए रोल आउट किए जा रहे हैं। कंपनी का कहना है कि इन नए मॉडल में कोडिंग-संबंधित कार्यों में उच्च प्रवीणता है और यह O3 मॉडल का विकल्प हो सकता है।

Openai के GPT-4.1 AI मॉडल अब CHATGPT में आ रहे हैं

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईएआई के आधिकारिक हैंडल ने घोषणा की कि जीपीटी -4.1 एआई मॉडल अब सीधे CHATGPT में उपलब्ध होगा। कोडिंग कार्यों के लिए O3 मॉडल के विकल्प के रूप में इसे पिच करते हुए, कंपनी ने कहा कि विशेष मॉडल भी निम्नलिखित निर्देश में उत्कृष्टता प्राप्त करता है। यह “अधिक मॉडल” ड्रॉपडाउन मेनू में CHATGPT प्लस, प्रो और टीम उपयोगकर्ताओं के लिए उपलब्ध होगा।

इसके अतिरिक्त, एंटरप्राइज और ईडीयू ग्राहकों को आने वाले हफ्तों में मॉडल तक पहुंच मिलेगी। के मुक्त स्तर पर चटपट जल्द ही GPT-4.1 मिनी मॉडल तक पहुंच प्राप्त होगी, जो GPT-4O मिनी मॉडल की जगह होगी।

लॉन्च के समय, Openai ने कहा कि इन मॉडलों ने कोडिंग क्षमता में GPT-4O और GPT-4.5 AI दोनों मॉडल दोनों को बेहतर बनाया। आंतरिक परीक्षण के आधार पर, कंपनी ने दावा किया कि GPT-4.1 ने SWE-Bench सत्यापित बेंचमार्क पर 54.6 प्रतिशत स्कोर किया।

यह भी दावा किया जाता है कि अनुदेश के लिए मल्टीचैलेंज बेंचमार्क पर 38.3 प्रतिशत स्कोर किया है, और मल्टीमॉडल लॉन्ग संदर्भ समझ के लिए वीडियो-एमएमई बेंचमार्क पर 72 प्रतिशत। मॉडल की GPT-4.1 श्रृंखला में एक मिलियन टोकन तक की एक संदर्भ विंडो है।

जबकि GPT-4.1 इस श्रृंखला का प्रीमियम मॉडल बना हुआ है, GPT-4.1 मिनी को कई बेंचमार्क में GPT-4O को बेहतर बनाने का दावा किया गया है, जिसमें खुफिया मूल्यांकन भी शामिल है। Openai ने कहा कि मिनी मॉडल विलंबता को आधे से कम करता है और 4o की तुलना में 83 प्रतिशत कम खर्च होता है।

Continue Reading

AI & Automation

स्थिरता एआई और एआरएम रिलीज लाइटवेट टेक्स-टू-ऑडियो मॉडल तेजी से ऑन-डिवाइस पीढ़ी के लिए अनुकूलित

Published

on

By

स्थिरता एआई एआरएम के साथ साझेदारी में एक नया टेक्स्ट-टू-ऑडियो पीढ़ी आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल विकसित किया। बुधवार को घोषणा की गई, नए मॉडल को स्थिर ऑडियो ओपन स्मॉल करार दिया गया है, और यह कहा जाता है कि यह पाठ संकेतों का उपयोग करके छोटे ऑडियो नमूने उत्पन्न करने के लिए है। लंदन स्थित एआई फर्म ने कहा कि मॉडल हल्का है और पूरी तरह से एआरएम सीपीयू पर चलने के लिए अनुकूलित है। यह भी कहा जाता है कि यह एक तेज पीढ़ी का समय है, जिससे यह थोक उपयोग के मामलों के लिए उपयोगी है। ओपन-सोर्स ऑडियो मॉडल GitHub और Hugging Face से डाउनलोड करने के लिए उपलब्ध है।

स्थिरता एआई स्थिर ऑडियो खुला छोटा रिलीज करता है

एक न्यूज़ रूम में डाकएआई फर्म ने नए बड़े भाषा मॉडल को विस्तृत किया। यह स्थिर ऑडियो ओपन मॉडल का एक आसुत संस्करण है, जो था जारी किया जून 2024 में, और 47 सेकंड तक ऑडियो उत्पन्न कर सकते हैं। छोटे टेक्स्ट-टू-ऑडियो मॉडल को तेज पीढ़ी की गति और छोटे आकार पर ध्यान केंद्रित करने के साथ डिज़ाइन किया गया था।

स्थिर ऑडियो ओपन छोटा एक 341 मिलियन पैरामीटर मॉडल है जो ऑडियो के 11 सेकंड तक उत्पन्न कर सकता है। कंपनी का दावा है कि यह स्मार्टफोन पर स्थानीय रूप से चलने के दौरान आठ सेकंड से भी कम समय में एक ऑडियो नमूना उत्पन्न कर सकता है। दिलचस्प बात यह है कि स्टेबिलिटी एआई और एआरएम ने मोबाइल वर्ल्ड कांग्रेस (MWC) 2025 में जेनेरिक ऑडियो क्रिएशन के लिए अपने सहयोग की घोषणा की।

आर्किटेक्चर और ट्रेनिंग में आकर, स्थिर ऑडियो ओपन स्मॉल एक ट्रांसफॉर्मर आर्किटेक्चर पर आधारित एक अव्यक्त प्रसार मॉडल है। यह 4,86,492 ऑडियो रिकॉर्डिंग के डेटासेट पर प्रशिक्षित है। कंपनी ने कहा कि सभी ऑडियो फाइलें लाइसेंस प्राप्त हैं। पाठ कंडीशनिंग के लिए, एक सार्वजनिक रूप से उपलब्ध पूर्व-प्रशिक्षित T5 मॉडल का उपयोग किया गया था। एआई फर्म ने त्वरित पालन में सुधार करने और निष्कर्ष की गति को बढ़ाने के लिए प्रशिक्षण के बाद के चरण में प्रतिकूल संबंध-संकल्पना (एआरसी) एल्गोरिथ्म का उपयोग किया।

कंपनी के अनुसार, यह टेक्स्ट-टू-ऑडियो मॉडल ड्रम लूप, फोली, इंस्ट्रूमेंट रिफ़्स और एंबिएंट टेक्सचर बनाने के लिए अनुकूल है। इसके छोटे आकार के कारण, इसे एआरएम-पावर्ड स्मार्टफोन के साथ-साथ एज डिवाइस पर भी तैनात किया जा सकता है। मॉडल का उपयोग उन परिदृश्यों में भी किया जा सकता है जहां वास्तविक समय पीढ़ी और जवाबदेही पदार्थ।

स्थिर ऑडियो ओपन स्मॉल के मॉडल वेट को एआई फर्म के गले लगने वाले चेहरे पर डाउनलोड किया जा सकता है प्रविष्टिऔर कोड बेस GitHub पर पाया जा सकता है प्रविष्टि। AI मॉडल अनुमेय स्थिरता AI समुदाय लाइसेंस के तहत वाणिज्यिक और गैर-वाणिज्यिक उपयोग के लिए उपलब्ध है।

Continue Reading

AI & Automation

Apple के शोधकर्ता Matrix3D का परिचय देते हैं, एक एकीकृत AI मॉडल जो 2D फ़ोटो को 3D ऑब्जेक्ट में बदल सकता है

Published

on

By

सेब शोधकर्ताओं ने एक नया आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया जो कई 2 डी छवियों से 3 डी दृश्य उत्पन्न कर सकता है। बड़े भाषा मॉडल (LLM), डब किए गए Matrix3D, को कंपनी की मशीन लर्निंग टीम द्वारा नानजिंग विश्वविद्यालय और हांगकांग विश्वविद्यालय के विज्ञान और प्रौद्योगिकी विश्वविद्यालय (HKUST) के सहयोग से विकसित किया गया था। क्यूपर्टिनो-आधारित टेक दिग्गज ने एआई मॉडल को खुले समुदाय के लिए उपलब्ध कराया है, और इसे GitHub पर Apple की लिस्टिंग के माध्यम से डाउनलोड किया जा सकता है। Matrix3D के साथ, शोधकर्ताओं ने त्रुटियों के जोखिम को खत्म करने के लिए 3 डी पीढ़ी के पाइपलाइन को एकीकृत किया है।

Apple का Matrix3D मल्टी-टास्क फोटोग्राममेट्री का नवाचार करता है

में एक डाकटेक दिग्गज ने उस शोध को विस्तृत किया जो Matrix3D AI मॉडल के विकास में चला गया। जबकि कई 3 डी रेंडरिंग मॉडल पहले से मौजूद हैं, यह 3 डी व्यू बनाने के लिए पाइपलाइन को एकजुट करके मौजूदा स्थान को नवाचार करता है। कई मॉडल और घटकों के होने के बजाय, यहां, एक एकल एलएलएम कई फोटोग्राममेट्री सबटास्क करता है जैसे कि मुद्रा अनुमान, गहराई की भविष्यवाणी और उपन्यास दृश्य संश्लेषण।

विशेष रूप से, फोटोग्राममेट्री छवियों का विश्लेषण करके भौतिक वस्तुओं और वातावरण के बारे में सटीक माप और 3 डी जानकारी प्राप्त करने की तकनीक है। यह आमतौर पर विभिन्न कोणों से ली गई 2 डी छवियों से नक्शे, 3 डी मॉडल और माप बनाने के लिए उपयोग किया जाता है।

शोधकर्ताओं ने भी प्रकाशित किया है कागज़ ऑनलाइन प्रीप्रिंट जर्नल Arxiv पर नए मॉडल के बारे में। शोधों के अनुसार, Matrix3D एक मल्टीमॉडल डिफ्यूजन ट्रांसफार्मर (DIT) आर्किटेक्चर पर आधारित है। यह कई तौर -तरीकों जैसे कि छवि डेटा, कैमरा पैरामीटर और गहराई के नक्शे में डेटा को एकीकृत कर सकता है।

पेपर में, Apple के शोधकर्ताओं पर प्रकाश डाला गया कि मॉडल को एक मुखौटा सीखने की रणनीति का उपयोग करके प्रशिक्षित किया गया था, जहां छवि का एक हिस्सा बाधित होता है, और AI मॉडल को सही पिक्सेल खोजने के लिए प्रशिक्षित किया जाता है जो अंतराल में फिट होता है।

शोधकर्ताओं ने पाया कि एलएलएम विभिन्न कोणों से सिर्फ तीन छवियों के साथ एक संपूर्ण 3 डी ऑब्जेक्ट या दृश्य दृश्य उत्पन्न कर सकता है। जबकि मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटासेट का खुलासा नहीं किया गया था, मॉडल स्वयं कंपनी के GitHub पर एक अनुमेय Apple लाइसेंस के माध्यम से डाउनलोड, संशोधित करने और पुनर्वितरण के लिए उपलब्ध है प्रविष्टि

Continue Reading

AI & Automation

सैमसंग गैलेक्सी वॉच और गैलेक्सी बड्स 3 सीरीज़ एआई-पावर्ड जेमिनी इंटीग्रेशन जल्द ही प्राप्त करने के लिए

Published

on

By

SAMSUNG बुधवार को एकीकरण की घोषणा की मिथुनGoogle की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट, अपने वियरबल्स के लाइनअप में। सैमसंग गैलेक्सी वॉच और आकाशगंगा कलियाँ 3 श्रृंखला उपयोगकर्ता जल्द ही अनुस्मारक स्थापित करने, ग्रंथों को सारांशित करने, मौसम के अपडेट प्राप्त करने और अन्य गतिविधियों के लिए एआई सहायक का लाभ उठाने में सक्षम होंगे जो एआई बॉट ने पहले फोन पर अनुमति दी थी। इस कदम के साथ, कंपनी गैलेक्सी इकोसिस्टम में सभी उपकरणों में एआई सुविधाओं की उपस्थिति का विस्तार करती है।

सैमसंग गैलेक्सी वॉच, गैलेक्सी बड्स पर मिथुन

एक प्रेस नोट में, सैमसंग ने कहा कि गैलेक्सी वॉच पर मिथुन की शुरूआत गैलेक्सी पहनने योग्य लाइनअप में पहली बार एकीकरण को चिह्नित करती है। इसे सैमसंग के प्रमुख ट्रू वायरलेस स्टीरियो (TWS) ईयरबड्स – गैलेक्सी बड्स 3 सीरीज़ में भी एकीकृत किया जाएगा, जिसमें सक्रियण प्रक्रिया को “यहां तक ​​कि स्मूथ” के रूप में उद्धृत किया गया है।

गैलेक्सी वॉच पर, मिथुन नेचुरल वॉयस कमांड का उपयोग करके हाथों से मुक्त सहायता प्रदान की जाती है। उदाहरण के लिए, उपयोगकर्ता मिथुन से पूछ सकते हैं कि “मैं आज लॉकर 43 का उपयोग कर रहा हूं”, और एआई सहायक इसके लिए एक अनुस्मारक सेट करेगा। वे इसे त्वरित अवलोकन के लिए ईमेल को संक्षेप में प्रस्तुत करने के लिए भी कह सकते हैं। कंपनी का कहना है कि मिथुन प्रतिक्रिया देने और कार्रवाई करने के लिए ऐप्स में अनुरोधों को संभालता है।

सैमसंग कहते हैं, इस बीच, गैलेक्सी बड्स 3 सीरीज़ उपयोगकर्ताओं को मिथुन के साथ और भी अधिक सहज अनुभव हो सकता है। वे वॉयस कमांड या चुटकी का उपयोग कर सकते हैं और फोन के साथ बातचीत किए बिना, मौसम के अपडेट प्राप्त करने के लिए TWS Earbuds पर AI सहायक को आमंत्रित करने के लिए पकड़ सकते हैं।

विशेष रूप से, Google भी है लाना अधिक उपकरणों के लिए मिथुन। यह घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, Google I/O 2025 के लिए कंपनी का बिल्डअप जो अगले सप्ताह बंद हो जाता है। टेक दिग्गज के अनुसार, यह एंड्रॉइड टीवी के माध्यम से स्मार्ट टीवी पर, और एंड्रॉइड ऑटो के माध्यम से इन-कार इन्फोटेनमेंट सिस्टम के माध्यम से वियर ओएस के माध्यम से स्मार्टवॉच में आएगा। इसके अतिरिक्त, हेडसेट और स्मार्ट चश्मा द्वारा संचालित एंड्रॉइड एक्सआर ऑपरेटिंग सिस्टम एआई सहायक की क्षमताओं से भी लाभान्वित होगा।

जबकि उपलब्धता प्रश्न के तहत बनी हुई है, Google ने संकेत दिया कि मिथुन द्वारा संचालित सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।

Continue Reading

AI & Automation

Microsoft संगठन-व्यापी कटौती में लगभग तीन प्रतिशत कार्यबल को बंद करने के लिए

Published

on

By

Microsoft ने मंगलवार को कहा कि वह अपने कार्यबल के तीन प्रतिशत से भी कम या लगभग 6,000 कर्मचारियों को बंद कर रहा था, क्योंकि प्रौद्योगिकी दिग्गज आर्टिफिशियल इंटेलिजेंस पर अपने महत्वाकांक्षी दांव में अरबों डॉलर की फ़नलिंग करते हुए लागतों पर लगाम लगाते हैं।

कटौती सभी स्तरों और भौगोलिक क्षेत्रों में होगी और संभवतः सबसे बड़ी संभावना है माइक्रोसॉफ्ट 2023 में 10,000 कर्मचारियों को बंद कर दिया। कंपनी ने जनवरी में प्रदर्शन से संबंधित मुद्दों पर कम संख्या में कर्मचारियों को जाने दिया, लेकिन नए कटौती से संबंधित नहीं हैं, सीएनबीसी के अनुसार, जिसने पहली बार समाचार की सूचना दी थी।

बिग टेक एआई पर भारी खर्च कर रहा है क्योंकि वे नई तकनीक को एक प्रमुख विकास इंजन के रूप में देखते हैं, जबकि लाभ मार्जिन की सुरक्षा के लिए कहीं और लागत को कम करते हैं। गूगल पिछले एक साल में सैकड़ों कर्मचारियों को भी बंद कर दिया है, क्योंकि यह लागत को नियंत्रित करने और एआई को प्राथमिकता देने के लिए लगता है, मीडिया रिपोर्टों ने कहा है।

माइक्रोसॉफ्ट के प्रवक्ता ने मेल पर कहा, “हम एक गतिशील बाज़ार में सफलता के लिए कंपनी को सर्वोत्तम स्थिति के लिए आवश्यक संगठनात्मक परिवर्तनों को लागू करना जारी रखते हैं।”

कंपनी, जिसमें पिछले साल जून तक 2,28,000 श्रमिक थे, नियमित रूप से अपने मुख्य फोकस क्षेत्रों में स्टाफिंग को प्राथमिकता देने के लिए छंटनी का उपयोग करती है।

Microsoft ने अपने क्लाउड-कंप्यूटिंग व्यवसाय में मजबूत-से-अपेक्षित वृद्धि पोस्ट करने के हफ्तों बाद मंगलवार का कदम आता है नीला और नवीनतम तिमाही में ब्लोआउट परिणाम, एक अनिश्चित अर्थव्यवस्था में निवेशक को शांत करना।

लेकिन इसके एआई बुनियादी ढांचे को स्केल करने की लागत ने लाभप्रदता पर तौला है, माइक्रोसॉफ्ट क्लाउड मार्जिन के साथ मार्च तिमाही में एक साल पहले 72 प्रतिशत से 69 प्रतिशत तक पहुंच गया था।

Microsoft ने इस वित्तीय वर्ष में पूंजी खर्च करने में पूंजी में $ 80 बिलियन (लगभग 6,83,255 करोड़ रुपये) की शुरुआत की है, इसका उद्देश्य आर्टिफिशियल इंटेलिजेंस सेवाओं के लिए क्षमता को कम करने के लिए डेटा केंद्रों का विस्तार करना है।

डीए डेविडसन के विश्लेषक गिल लुरिया ने कहा कि छंटनी ने दिखाया कि माइक्रोसॉफ्ट अपने ऊंचे एआई निवेशों द्वारा बनाए गए मार्जिन दबाव को प्रबंधित कर रहा था।

“हम मानते हैं कि हर साल Microsoft मौजूदा स्तरों पर निवेश करता है, इसे अपने पूंजीगत व्यय के कारण उच्च मूल्यह्रास स्तरों के लिए बनाने के लिए कम से कम 10,000 तक हेडकाउंट को कम करने की आवश्यकता होगी,” उन्होंने कहा।

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Tiktok कहानियों में फ़ोटो से वीडियो बनाने के लिए नए AI अलाइव टूल का परिचय देता है

Published

on

By

टिकटोक एक नई आर्टिफिशियल इंटेलिजेंस (एआई) सुविधा पेश कर रही है जो उपयोगकर्ताओं को एक छवि को एक एनिमेटेड वीडियो में बदलने की अनुमति देगा। मंगलवार को, वर्टिकल वीडियो-आधारित सोशल मीडिया प्लेटफॉर्म ने एक नए एआई सुविधा की घोषणा की, जिसे एआई अलाइव कहा जाता है जो तस्वीरों से वीडियो बनाने के लिए जेनेरिक एआई तकनीक का उपयोग करता है। वर्तमान में, टूल का उपयोग केवल टिकटोक कहानियों में वीडियो उत्पन्न करने के लिए किया जा सकता है, न कि सीधे फ़ीड के लिए। इसके अतिरिक्त, कंपनी ने कहा कि यह उपयोगकर्ताओं द्वारा दुर्व्यवहार किए जा रहे फीचर के जोखिम को कम करने के लिए कई कदम उठा रहा है।

Tiktok ai अलाइव फीचर आपकी तस्वीरों को वीडियो में बदल सकता है

एक न्यूज़ रूम में डाक अपनी अमेरिकी वेबसाइट पर, टिकटोक ने नए एआई फीचर के रोलआउट की घोषणा की। यह किसी भी वीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म द्वारा पेश किया गया पहला एआई-संचालित इमेज-टू-वीडियो जनरेशन टूल है। इंस्टाग्राम, एक्स, और स्नैपचैट किसी भी एआई-संचालित वीडियो जनरेशन टूल की पेशकश नहीं करते हैं। जबकि YouTube शॉर्ट्स हाल ही में शुरू हुआ है परीक्षण एक टेक्स्ट-टू-वीडियो जनरेशन फीचर, इसे व्यापक रूप से रोल आउट नहीं किया गया है।

Tiktok AI अलाइव फीचर इनबॉक्स पेज या प्रोफाइल पेज के शीर्ष पर ब्लू प्लस आइकन (+) को टैप करके पाया जा सकता है। वहां, उपयोगकर्ताओं को पहले अपने स्टोरी एल्बम से एक ही छवि का चयन करना होगा। एआई अलाइव आइकन फोटो एडिट पेज पर दाईं ओर टूलबार पर स्थित है। इसे ऊपर से दूसरे स्थान पर रखा जाना चाहिए।

एआई अलाइव आइकन पर टैप करने से एक और विंडो खुलती है, जहां उपयोगकर्ता एक टेक्स्ट प्रॉम्प्ट जोड़ सकते हैं कि वे कैसे चाहते हैं कि छवि एनिमेटेड हो। यदि वे निश्चित नहीं हैं, तो वे एक ही पृष्ठ पर कई सुझाए गए पाठ संकेतों में से एक का भी उपयोग कर सकते हैं। एक बार हो जाने के बाद, वे जनरेट बटन को टैप कर सकते हैं और एक छोटा वीडियो बनाया जाता है। उपयोगकर्ता तब वीडियो पोस्ट कर सकते हैं, और लोग आपके लिए और फॉलो फ़ीड्स के साथ -साथ उपयोगकर्ता के प्रोफाइल पेज पर कहानी को वीडियो कर सकते हैं।

कंपनी ने कहा कि इसने अपलोड किए गए फोटो, टेक्स्ट प्रॉम्प्ट और एआई अलाइव वीडियो की समीक्षा करने के लिए मॉडरेशन तकनीक को लागू किया है, इससे पहले कि यह निर्माता को दिखाया जाए। एक अंतिम चेक तब होता है जब उपयोगकर्ता वीडियो को अपनी कहानी पर पोस्ट करता है। इसके अतिरिक्त, अन्य उपयोगकर्ता उन वीडियो की रिपोर्ट कर सकते हैं जो उन्हें लगता है कि प्लेटफ़ॉर्म के दिशानिर्देशों को तोड़ सकते हैं।

इसके अलावा, टिक्तोक भी एक दृश्यमान एआई-जनित लेबल जोड़ रहा है ताकि लोगों को यह पता चल सके कि यह एक सिंथेटिक वीडियो है। कंपनी ने कहा कि सामग्री सिद्धता और प्रामाणिकता (C2PA) मेटाडेटा के लिए गठबंधन, प्रमुख AI खिलाड़ियों के बीच एक मानक, हर AI- जनरेट किए गए वीडियो में भी जोड़ा जाता है, कंपनी ने कहा।


Continue Reading

Trending