Connect with us

AI & Automation

सैमसंग ने कथित तौर पर प्रोजेक्ट मूहान एंड्रॉइड एक्सआर हेडसेट के लिए प्रथम-पक्षीय नियंत्रकों को विकसित किया

Published

on

SAMSUNG कथित तौर पर नए मोशन कंट्रोलर्स को विकसित कर रहा है प्रोजेक्ट मूहानकंपनी का पहला एंड्रॉइड एक्सआर हेडसेट। Apple विजन प्रो की तरह, जो पहले से ही व्यावसायिक रूप से उपलब्ध है, सैमसंग का प्रोटोटाइप हाथ से आधारित इशारों का समर्थन करता है। हालांकि, दक्षिण कोरियाई टेक समूह को समर्पित नियंत्रकों पर काम करने के लिए भी कहा जाता है जो हेडसेट का उपयोग करते समय बेहतर सटीकता की पेशकश कर सकते हैं, उन उपयोगकर्ताओं के लिए जो गेम खेलना चाहते हैं या विशिष्ट ऐप का उपयोग करना चाहते हैं जिन्हें बाहरी नियंत्रक की आवश्यकता होती है। सैमसंग के प्रथम-पक्षीय नियंत्रक कथित तौर पर वैकल्पिक होंगे और अलग से बेचे जाएंगे।

प्रोजेक्ट मूहान के लिए समर्पित नियंत्रक बेहतर सटीकता प्रदान कर सकते हैं

एक सैमोमोबाइल के अनुसार प्रतिवेदनकंपनी अपने प्रोजेक्ट मूहान हेडसेट के लिए नए प्रथम-पक्षीय गति नियंत्रकों पर काम कर रही है। प्रकाशन में कहा गया है कि यह मॉडल नंबर ET-OI610 के साथ एक नियंत्रक को “संदर्भ” की खोज करता है, लेकिन इस बात का कोई उल्लेख नहीं है कि यह कोड, विपणन सामग्री या अन्य स्रोतों में पाया गया था या नहीं।

रिपोर्ट में यह भी कहा गया है कि प्रथम-पार्टी नियंत्रकों को प्रोजेक्ट मूहान के साथ शामिल नहीं किया जा सकता है। यदि दावा सही है, तो सैमसंग अपने एंड्रॉइड एक्सआर हेडसेट पर वैकल्पिक नियंत्रक समर्थन पेश कर सकता है। कंपनी ने वर्ष के अपने पहले गैलेक्सी अनपैक्ड इवेंट में प्रोटोटाइप को दिखाया, जब उसने स्मार्टफोन की सैमसंग गैलेक्सी S25 श्रृंखला शुरू की। यह हाल ही में संपन्न मोबाइल वर्ल्ड कांग्रेस (MWC 2025) में भी प्रदर्शित किया गया था।

प्रोजेक्ट MOOHAN XR हेडसेट कंपनी के अनुसार, मल्टीमॉडल आर्टिफिशियल इंटेलिजेंस (AI) क्षमताओं के लिए समर्थन प्रदान करेगा। गैलेक्सी अनपैक्ड इवेंट में दिखाए गए एक टीज़र से पता चलता है कि उपयोगकर्ता अपने हाथों, आंखों, और वॉयस कमांड का उपयोग करके हेडसेट को नियंत्रित करने में सक्षम होंगे। यह Google के नए Android XR ऑपरेटिंग सिस्टम पर चलेगा।

जब एप्पल विजन प्रो वर्तमान में मानक के लिए समर्थन प्रदान करता है तृतीय पक्ष नियंत्रकएक पहले प्रतिवेदन यह बताता है कि Apple इस साल के अंत में सोनी के PS VR2 मोशन कंट्रोलर्स के समर्थन के साथ विज़न प्रो को अपडेट करेगा। सोनी के मोशन कंट्रोलर्स के लिए समर्थन आगामी विज़नोस अपडेट के हिस्से के रूप में पहुंचने की उम्मीद है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


कथित वनप्लस एसीई 5 एस प्रमुख विनिर्देश लीक हुए; Mediatek Dimentess


Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

Google मिथुन उन्नत उपयोगकर्ता अब चैटबॉट को GitHub के साथ कनेक्ट कर सकते हैं

Published

on

By

गूगल अपने आर्टिफिशियल इंटेलिजेंस (एआई) चैटबोट, मिथुन में एक नई सुविधा जोड़ रहा है। बुधवार को घोषित, मिथुन अब GitHub रिपॉजिटरी से जुड़ सकता है और कई कोडिंग कार्य कर सकता है। इनमें फ़ंक्शंस उत्पन्न करना और संशोधित करना, कोड की व्याख्या करना, कोडबेस के बारे में प्रश्नों का उत्तर देना, डिबगिंग कोड, और बहुत कुछ शामिल हैं। वर्तमान में, यह सुविधा केवल प्लेटफ़ॉर्म के भुगतान किए गए ग्राहकों के लिए उपलब्ध है। विशेष रूप से, माउंटेन व्यू-आधारित टेक दिग्गज ने घोषणा की कि वह अब मिथुन को अधिक उपकरणों में विस्तारित करेगा, जिसमें स्मार्टवॉच, स्मार्ट टीवी, कारों में इन्फोटेनमेंट सिस्टम, और बहुत कुछ शामिल हैं।

मिथुन एडवांस्ड अब GitHub Repos तक पहुंच सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), मिथुन ऐप के आधिकारिक हैंडल ने नई सुविधा की घोषणा की। द पोस्ट में कहा गया है, “मिथुन एडवांस्ड अब GitHub के साथ जुड़ता है, जिससे यह अधिक शक्तिशाली कोडिंग सहायक बन जाता है।” मोबाइल ऐप या वेब क्लाइंट के नवीनतम संस्करण का उपयोग करने वालों को नई सुविधा तक पहुंचने में सक्षम होना चाहिए। विशेष रूप से, यह सुविधा केवल मिथुन उन्नत ग्राहकों के लिए उपलब्ध है।

जबकि सुविधा चैटबॉट की कोडिंग क्षमता को बढ़ाती नहीं है, यह इसके उपयोग के मामले को अधिक व्यक्तिगत बनाता है। उपयोगकर्ता अब एआई को अपने रिपॉजिटरी से जोड़ सकते हैं और फिर पूछ सकते हैं मिथुन उनके बारे में प्रश्न या कोडबेस को डीबग करने के लिए पूछें।

Google का कहना है कि यह नई क्षमता मिथुन को कोड और फ़ंक्शंस को उत्पन्न करने और संशोधित करने, कोड का विश्लेषण और व्याख्या करने, क्वेरी, डेबग, और बहुत कुछ करने की अनुमति देगी। दिखाए गए एक उदाहरण में, मिथुन कोड का विश्लेषण करने और इसे और अधिक कुशल बनाने के तरीके दिखाने में सक्षम था।

सुविधा का उपयोग करने के लिए, मिथुन उन्नत उपयोगकर्ता पाठ फ़ील्ड के बाईं ओर प्लस आइकन (+) पर टैप कर सकते हैं और “आयात कोड” विकल्प का चयन कर सकते हैं। एक बार हो जाने के बाद, वे एक और टेक्स्ट बॉक्स देखेंगे जहां वे GitHub URL को पेस्ट कर सकते हैं। ये लिंक सार्वजनिक या निजी प्रतिनिधि से संबंधित हो सकते हैं, एआई दोनों के साथ काम करता है। विशेष रूप से, भारत में मिथुन उन्नत सदस्यता की लागत रु। 1,950 प्रति माह।

इस हफ्ते की शुरुआत में, टेक दिग्गज ने मिथुन के अधिक एंड्रॉइड डिवाइसों के विस्तार की घोषणा की। Google ने कहा कि आने वाले महीनों में, मिथुन को स्मार्टवॉच, स्मार्ट टीवी, इन-कार इन्फोटेनमेंट सिस्टम और यहां तक ​​कि हेडसेट और स्मार्ट ग्लास में एकीकृत किया जाएगा।

Continue Reading

AI & Automation

Tiktok AI- संचालित वैकल्पिक पाठ और अन्य पहुंच सुविधाओं के लिए समर्थन जोड़ता है

Published

on

By

टिकटोक गुरुवार को तीन नई पहुंच-केंद्रित सुविधाओं की घोषणा की। ग्लोबल एक्सेसिबिलिटी अवेयरनेस डे के अवसर पर नई सुविधाओं की घोषणा की गई, जो मई में तीसरे गुरुवार को आती है (इस साल, यह 15 मई को है)। नई विशेषताओं में से एक वैकल्पिक पाठ (ALT पाठ) समर्थन के लिए एक अद्यतन है, जो अब स्वचालित वर्णनात्मक कैप्शन उत्पन्न करने के लिए कृत्रिम बुद्धिमत्ता (AI) का उपयोग करता है। अन्य एक्सेसिबिलिटी सुविधाओं में एक नया उच्च कंट्रास्ट मोड और बोल्ड टेक्स्ट के लिए समर्थन शामिल है। विशेष रूप से, इस सप्ताह की शुरुआत में, कंपनी पुर: एक नया इमेज-टू-वीडियो जनरेशन टूल।

Tiktok तीन नई एक्सेसिबिलिटी फीचर्स लाता है

एक न्यूज़ रूम में डाकवीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म ने तीन नई एक्सेसिबिलिटी फीचर्स को विस्तृत किया, जो उपयोगकर्ताओं के लिए पेश कर रहे थे। ये सुविधाएँ प्लेटफ़ॉर्म के मौजूदा एक्सेसिबिलिटी टूल्स में शामिल होंगी, जैसे कि वीडियो, डार्क मोड, टेक्स्ट-टू-स्पीच और थंबनेल एनीमेशन के लिए ऑटो-जनित कैप्शन।

पहली नई सुविधा एआई-जनित ALT पाठ है। Tiktok ने कई हफ्ते पहले फोटो पोस्ट के लिए ALT पाठ जोड़ा। उपयोगकर्ता मैन्युअल रूप से छवि का वर्णन करते हुए एक कैप्शन जोड़ सकते हैं, और इसे स्क्रीन पाठकों द्वारा ज़ोर से पढ़ा जा सकता है। अब, यह उन फ़ोटो के लिए वर्णनात्मक कैप्शन उत्पन्न करने के लिए AI का उपयोग करके सुविधा पर निर्माण कर रहा है जिनमें ALT पाठ नहीं है। कंपनी का कहना है कि यह उन लोगों के लिए प्रयोज्य में सुधार करेगा जो अंधे हैं, कम दृष्टि रखते हैं, या सामग्री को अलग तरह से प्रक्रिया करते हैं।

अगला मंच पर रंग विपरीत बढ़ाने का एक विकल्प है। Tiktok एक उच्च विपरीत मोड पेश कर रहा है जो पाठ, आइकन और उपयोगकर्ता इंटरफ़ेस तत्वों के अग्रभूमि रंग को बढ़ाता है। यह सुविधा में पाया जा सकता है सरल उपयोग भीतर विकल्प सेटिंगके रूप में चिह्नित रंग कंट्रास्ट बढ़ाएं। टिकटोक का कहना है कि यह मंच को कम दृष्टि वाले व्यक्तियों के लिए या कम विपरीत के प्रति संवेदनशील लोगों के लिए अधिक उपयोगकर्ता के अनुकूल बना देगा।

अंत में, प्लेटफ़ॉर्म उपकरणों में बोल्ड टेक्स्ट सेटिंग के लिए समर्थन भी जोड़ रहा है। यदि किसी डिवाइस ने टेक्स्ट सेटिंग को बोल्ड पर सेट किया है, तो वे अब सभी इन-ऐप टेक्स्ट देखेंगे, जिसमें नाम, टिप्पणियां, कैप्शन और संदेश भी शामिल हैं। यह उन उपयोगकर्ताओं के लिए पठनीयता बढ़ाएगा जो बोल्डर पाठ पसंद करते हैं या दृष्टि मुद्दे हैं। ये सभी नई सुविधाएँ अब नवीनतम अपडेट वाले सभी उपयोगकर्ताओं के लिए उपलब्ध हैं।


Continue Reading

AI & Automation

Google DeepMind Alphaevolve का अनावरण करता है, एक कोडिंग एजेंट जो AI मतिभ्रम को कम करने के लिए डिज़ाइन किया गया है

Published

on

By

Google DeepMind बुधवार को एक नए आर्टिफिशियल इंटेलिजेंस (एआई) कोडिंग एजेंट की घोषणा की जो एआई मॉडल की क्षमताओं को बढ़ा सकती है। डब्ड अल्फावोल्व, यह जटिल कंप्यूटिंग और गणितीय कार्यों में एल्गोरिदम को खोजने और अनुकूलित करने के लिए डिज़ाइन किया गया है। शक्तिशाली एआई प्रणाली माउंटेन व्यू-आधारित टेक दिग्गज के मिथुन मॉडल पर बनाई गई है, और यह बड़े भाषा मॉडल द्वारा उत्पन्न आउटपुट को स्वचालित मूल्यांकनकर्ताओं के साथ उत्पन्न करता है ताकि वास्तविकता में प्रतिक्रियाओं को जमीन पर रखा जा सके और मतिभ्रम के जोखिम को कम किया जा सके। इसके अलावा, सिस्टम को गणितीय समस्याओं को हल करने और अनुकूलित करने में क्षमता भी दिखाई गई है।

Google DeepMind अल्फावोलव कोडिंग एजेंट का परिचय देता है

में एक ब्लॉग भेजादीपमाइंड ने जिस नई तकनीक पर काम किया है, वह विस्तृत है। Alphaevolve एक AI मॉडल नहीं है, इसके बजाय, यह एजेंटिक क्षमताओं के साथ एक जटिल AI प्रणाली है। सिस्टम द्वारा किए गए प्राथमिक कार्यों में से एक एल्गोरिथ्म खोज और अनुकूलन है।

एआई मॉडल, एक मौलिक स्तर पर, कोड की एक श्रृंखला है। ये कोड आधार प्रक्रिया और संकलन जानकारी, इसे तोड़ते हैं, और आउटपुट उत्पन्न करने के लिए संभाव्य एल्गोरिदम का उपयोग करते हैं। हालांकि, चूंकि एआई सिस्टम अत्यधिक जटिल हैं, इसलिए उनके कोड आधार बड़े पैमाने पर हैं। यह बड़ा आकार अक्सर अनुकूलन और दक्षता-आधारित मुद्दों का कारण बनता है। अल्फावोलवे इसके साथ मदद कर सकता है, कंपनी ने कहा।

Alphaevolve काम कर रहे Google Alphaevolve

अल्फेवोल्व संरचना
फोटो क्रेडिट: Google

Alphaevolve स्वचालित मूल्यांकन मेट्रिक्स का उपयोग करता है, और इन मापदंडों का उपयोग करके, यह AI मॉडल द्वारा उत्पन्न किए गए प्रतिक्रियाओं को सत्यापित करता है, चलाता है और स्कोर करता है। गूगल कहा कि यह विधि प्रणाली को कई एआई मॉडल से प्रतिक्रियाओं का आकलन करने और मतिभ्रम के जोखिम को कम करने की अनुमति देती है। इसके अतिरिक्त, सिस्टम ऐसे कोड को भी ठीक और सुधार सकता है जो इस तरह के मतिभ्रम की अनुमति देता है।

टेक दिग्गज ने कहा कि अल्फेवोल्व ने Google के डेटा सेंटर, चिप डिज़ाइन और एआई प्रशिक्षण प्रक्रियाओं की दक्षता में सुधार किया है। दिलचस्प बात यह है कि यह अपने स्वयं के आधार एलएलएम के प्रशिक्षण में सुधार करने में भी सक्षम था। एक मामले में, इसने एक नई शेड्यूलिंग विधि की खोज की जो Google के वैश्विक गणना संसाधनों के लगभग 0.7 प्रतिशत को ठीक करती है – कंपनी के बड़े पैमाने पर बुनियादी ढांचे में लागू होने पर एक बड़ा लाभ।

चूंकि अल्फावोल्व कोड बेस और एल्गोरिदम के साथ काम करता है, इसलिए यह भी कहा जाता है कि गणितीय समस्या को हल करने के विभिन्न क्षेत्रों में उच्च क्षमता है, कंपनी ने कहा। कहा जाता है कि यह 4×4 कॉम्प्लेक्स मैट्रिसेस को गुणा करने के लिए एक तेज विधि की खोज की गई है, जो एक समाधान को हराकर 50 से अधिक वर्षों तक खड़ा था। 50 खुली गणितीय समस्याओं के परीक्षणों में, अल्फेवोलवे ने ज्यादातर मामलों में वर्तमान सर्वश्रेष्ठ समाधानों का मिलान किया, और यहां तक ​​कि लगभग 20 प्रतिशत समस्याओं में उन पर सुधार किया, पोस्ट ने कहा।

Continue Reading

AI & Automation

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 एआई पीसी के साथ इंटेल कोर अल्ट्रा सीपीयू के साथ भारत में लॉन्च किया गया

Published

on

By

गड्ढा कृत्रिम बुद्धिमत्ता की एक विस्तृत श्रृंखला लॉन्च की () भारत में गुरुवार को पीसी। लाइनअप में तीन मॉडल शामिल हैं-डेल 14 प्लस, डेल 16 प्लस, और डेल 14 2-इन -1, जिन्हें डेल प्लस पोर्टफोलियो के हिस्से के रूप में नई यूनिफाइड ब्रांडिंग के तहत पेश किया गया है। कंपनी के अनुसार, इसके नए एआई पीसी नवीनतम इंटेल कोर अल्ट्रा प्रोसेसर द्वारा संचालित हैं और कोपिलॉट+ एआई क्षमताओं को वितरित करने के लिए बनाए गए हैं। जबकि डेल 14 प्लस और डेल 16 प्लस में एक पारंपरिक लैपटॉप डिज़ाइन है, डेल 14 2-इन -1 एक बहुमुखी पेशकश है जो लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण कर सकता है।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 मूल्य भारत में

डेल 14 2-इन -1 मूल्य भारत में रुपये से शुरू होता है। 96,899। इस बीच, डेल 14 प्लस और डेल 16 प्लस मॉडल की कीमत रु। 1,15,799 और रु। आधार विन्यास के लिए क्रमशः 1,08,499। लैपटॉप डेल.कॉम, डेल एक्सक्लूसिव स्टोर्स, रिटेल पार्टनर्स जैसे क्रोमा, रिलायंस रिटेल और विजय सेल्स, और अन्य मल्टी-ब्रांड आउटलेट्स और प्रमुख ई-कॉमर्स प्लेटफॉर्म के माध्यम से खरीद के लिए उपलब्ध होगा।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 विनिर्देश

डेल 14 प्लस और 14 2-इन -1 मॉडल में क्रमशः 14-इंच 2.5k (2,560 x 1,600 पिक्सल) एंटी-ग्लेयर नॉन-टचस्क्रीन डिस्प्ले और 14-इंच पूर्ण एचडी+ (1,920 x 1,200 पिक्सल) टच स्क्रीन डिस्प्ले हैं। इस बीच, डेल 16 प्लस में 16 इंच का पूर्ण एचडी+ (1,920 x 1,200 पिक्सेल) स्क्रीन है। 2-इन -1 मॉडल 360-डिग्री काज के साथ आता है जो इसे लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण में मदद करता है।

सभी मॉडलों में 300nits पीक चमक तक है। उन्हें आठ कोर के साथ एक इंटेल कोर अल्ट्रा 7 256V प्रोसेसर और 4.8GHz की पीक घड़ी की गति के साथ कॉन्फ़िगर किया जा सकता है। वे एक समर्पित तंत्रिका प्रसंस्करण इकाई (NPU) के साथ भी आते हैं, जो अकेले 47 TERA संचालन प्रति सेकंड (TOPS) के शिखर प्रदर्शन को देने का दावा किया जाता है। डब एआई पीसीएस, नए डेल प्लस मॉडल कोपिलॉट+ क्षमताओं के साथ आते हैं। कंपनी उपयोगकर्ताओं को अपनी उत्पादकता को अधिकतम करने में उपयोगकर्ताओं की मदद करने के लिए AI- चालित उपकरण जैसे रिकॉल और Cocreator भी प्रदान करती है।

पूरे डेल प्लस लाइनअप में एक्सप्रेसचार्ज तकनीक की सुविधा है जो लैपटॉप को 60 मिनट में 80 प्रतिशत तक बढ़ा सकती है। कनेक्टिविटी विकल्पों में वाई-फाई 7, ब्लूटूथ, यूएसबी 3.2 जनरल 1 टाइप-ए पोर्ट, यूएसबी 3.2 जनरल 2 टाइप-सी पोर्ट, डिस्प्लेपोर्ट 2.1 के साथ थंडरबोल्ट 4, एक एचडीएमआई 2.1 पोर्ट और 3.5 मिमी हेडफोन जैक शामिल हैं।

Continue Reading

AI & Automation

Openai GPT-4.1 AI मॉडल का विस्तार करता है, जिसमें उन्नत कोडिंग क्षमताओं के साथ CHATGPT

Published

on

By

ओपनई CHATGPT के लिए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल की हाल ही में जारी GPT-4.1 श्रृंखला के विस्तार की घोषणा की। ये मॉडल अब तक थे अनन्य कंपनी के एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के लिए, लेकिन गुरुवार को, सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि वे चैटबॉट के भीतर भी उपलब्ध होंगे। विशेष रूप से, GPT-4.1 और GPT-4.1 मिनी मॉडल वर्तमान में CHATGPT के लिए रोल आउट किए जा रहे हैं। कंपनी का कहना है कि इन नए मॉडल में कोडिंग-संबंधित कार्यों में उच्च प्रवीणता है और यह O3 मॉडल का विकल्प हो सकता है।

Openai के GPT-4.1 AI मॉडल अब CHATGPT में आ रहे हैं

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईएआई के आधिकारिक हैंडल ने घोषणा की कि जीपीटी -4.1 एआई मॉडल अब सीधे CHATGPT में उपलब्ध होगा। कोडिंग कार्यों के लिए O3 मॉडल के विकल्प के रूप में इसे पिच करते हुए, कंपनी ने कहा कि विशेष मॉडल भी निम्नलिखित निर्देश में उत्कृष्टता प्राप्त करता है। यह “अधिक मॉडल” ड्रॉपडाउन मेनू में CHATGPT प्लस, प्रो और टीम उपयोगकर्ताओं के लिए उपलब्ध होगा।

इसके अतिरिक्त, एंटरप्राइज और ईडीयू ग्राहकों को आने वाले हफ्तों में मॉडल तक पहुंच मिलेगी। के मुक्त स्तर पर चटपट जल्द ही GPT-4.1 मिनी मॉडल तक पहुंच प्राप्त होगी, जो GPT-4O मिनी मॉडल की जगह होगी।

लॉन्च के समय, Openai ने कहा कि इन मॉडलों ने कोडिंग क्षमता में GPT-4O और GPT-4.5 AI दोनों मॉडल दोनों को बेहतर बनाया। आंतरिक परीक्षण के आधार पर, कंपनी ने दावा किया कि GPT-4.1 ने SWE-Bench सत्यापित बेंचमार्क पर 54.6 प्रतिशत स्कोर किया।

यह भी दावा किया जाता है कि अनुदेश के लिए मल्टीचैलेंज बेंचमार्क पर 38.3 प्रतिशत स्कोर किया है, और मल्टीमॉडल लॉन्ग संदर्भ समझ के लिए वीडियो-एमएमई बेंचमार्क पर 72 प्रतिशत। मॉडल की GPT-4.1 श्रृंखला में एक मिलियन टोकन तक की एक संदर्भ विंडो है।

जबकि GPT-4.1 इस श्रृंखला का प्रीमियम मॉडल बना हुआ है, GPT-4.1 मिनी को कई बेंचमार्क में GPT-4O को बेहतर बनाने का दावा किया गया है, जिसमें खुफिया मूल्यांकन भी शामिल है। Openai ने कहा कि मिनी मॉडल विलंबता को आधे से कम करता है और 4o की तुलना में 83 प्रतिशत कम खर्च होता है।

Continue Reading

AI & Automation

स्थिरता एआई और एआरएम रिलीज लाइटवेट टेक्स-टू-ऑडियो मॉडल तेजी से ऑन-डिवाइस पीढ़ी के लिए अनुकूलित

Published

on

By

स्थिरता एआई एआरएम के साथ साझेदारी में एक नया टेक्स्ट-टू-ऑडियो पीढ़ी आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल विकसित किया। बुधवार को घोषणा की गई, नए मॉडल को स्थिर ऑडियो ओपन स्मॉल करार दिया गया है, और यह कहा जाता है कि यह पाठ संकेतों का उपयोग करके छोटे ऑडियो नमूने उत्पन्न करने के लिए है। लंदन स्थित एआई फर्म ने कहा कि मॉडल हल्का है और पूरी तरह से एआरएम सीपीयू पर चलने के लिए अनुकूलित है। यह भी कहा जाता है कि यह एक तेज पीढ़ी का समय है, जिससे यह थोक उपयोग के मामलों के लिए उपयोगी है। ओपन-सोर्स ऑडियो मॉडल GitHub और Hugging Face से डाउनलोड करने के लिए उपलब्ध है।

स्थिरता एआई स्थिर ऑडियो खुला छोटा रिलीज करता है

एक न्यूज़ रूम में डाकएआई फर्म ने नए बड़े भाषा मॉडल को विस्तृत किया। यह स्थिर ऑडियो ओपन मॉडल का एक आसुत संस्करण है, जो था जारी किया जून 2024 में, और 47 सेकंड तक ऑडियो उत्पन्न कर सकते हैं। छोटे टेक्स्ट-टू-ऑडियो मॉडल को तेज पीढ़ी की गति और छोटे आकार पर ध्यान केंद्रित करने के साथ डिज़ाइन किया गया था।

स्थिर ऑडियो ओपन छोटा एक 341 मिलियन पैरामीटर मॉडल है जो ऑडियो के 11 सेकंड तक उत्पन्न कर सकता है। कंपनी का दावा है कि यह स्मार्टफोन पर स्थानीय रूप से चलने के दौरान आठ सेकंड से भी कम समय में एक ऑडियो नमूना उत्पन्न कर सकता है। दिलचस्प बात यह है कि स्टेबिलिटी एआई और एआरएम ने मोबाइल वर्ल्ड कांग्रेस (MWC) 2025 में जेनेरिक ऑडियो क्रिएशन के लिए अपने सहयोग की घोषणा की।

आर्किटेक्चर और ट्रेनिंग में आकर, स्थिर ऑडियो ओपन स्मॉल एक ट्रांसफॉर्मर आर्किटेक्चर पर आधारित एक अव्यक्त प्रसार मॉडल है। यह 4,86,492 ऑडियो रिकॉर्डिंग के डेटासेट पर प्रशिक्षित है। कंपनी ने कहा कि सभी ऑडियो फाइलें लाइसेंस प्राप्त हैं। पाठ कंडीशनिंग के लिए, एक सार्वजनिक रूप से उपलब्ध पूर्व-प्रशिक्षित T5 मॉडल का उपयोग किया गया था। एआई फर्म ने त्वरित पालन में सुधार करने और निष्कर्ष की गति को बढ़ाने के लिए प्रशिक्षण के बाद के चरण में प्रतिकूल संबंध-संकल्पना (एआरसी) एल्गोरिथ्म का उपयोग किया।

कंपनी के अनुसार, यह टेक्स्ट-टू-ऑडियो मॉडल ड्रम लूप, फोली, इंस्ट्रूमेंट रिफ़्स और एंबिएंट टेक्सचर बनाने के लिए अनुकूल है। इसके छोटे आकार के कारण, इसे एआरएम-पावर्ड स्मार्टफोन के साथ-साथ एज डिवाइस पर भी तैनात किया जा सकता है। मॉडल का उपयोग उन परिदृश्यों में भी किया जा सकता है जहां वास्तविक समय पीढ़ी और जवाबदेही पदार्थ।

स्थिर ऑडियो ओपन स्मॉल के मॉडल वेट को एआई फर्म के गले लगने वाले चेहरे पर डाउनलोड किया जा सकता है प्रविष्टिऔर कोड बेस GitHub पर पाया जा सकता है प्रविष्टि। AI मॉडल अनुमेय स्थिरता AI समुदाय लाइसेंस के तहत वाणिज्यिक और गैर-वाणिज्यिक उपयोग के लिए उपलब्ध है।

Continue Reading

AI & Automation

Apple के शोधकर्ता Matrix3D का परिचय देते हैं, एक एकीकृत AI मॉडल जो 2D फ़ोटो को 3D ऑब्जेक्ट में बदल सकता है

Published

on

By

सेब शोधकर्ताओं ने एक नया आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया जो कई 2 डी छवियों से 3 डी दृश्य उत्पन्न कर सकता है। बड़े भाषा मॉडल (LLM), डब किए गए Matrix3D, को कंपनी की मशीन लर्निंग टीम द्वारा नानजिंग विश्वविद्यालय और हांगकांग विश्वविद्यालय के विज्ञान और प्रौद्योगिकी विश्वविद्यालय (HKUST) के सहयोग से विकसित किया गया था। क्यूपर्टिनो-आधारित टेक दिग्गज ने एआई मॉडल को खुले समुदाय के लिए उपलब्ध कराया है, और इसे GitHub पर Apple की लिस्टिंग के माध्यम से डाउनलोड किया जा सकता है। Matrix3D के साथ, शोधकर्ताओं ने त्रुटियों के जोखिम को खत्म करने के लिए 3 डी पीढ़ी के पाइपलाइन को एकीकृत किया है।

Apple का Matrix3D मल्टी-टास्क फोटोग्राममेट्री का नवाचार करता है

में एक डाकटेक दिग्गज ने उस शोध को विस्तृत किया जो Matrix3D AI मॉडल के विकास में चला गया। जबकि कई 3 डी रेंडरिंग मॉडल पहले से मौजूद हैं, यह 3 डी व्यू बनाने के लिए पाइपलाइन को एकजुट करके मौजूदा स्थान को नवाचार करता है। कई मॉडल और घटकों के होने के बजाय, यहां, एक एकल एलएलएम कई फोटोग्राममेट्री सबटास्क करता है जैसे कि मुद्रा अनुमान, गहराई की भविष्यवाणी और उपन्यास दृश्य संश्लेषण।

विशेष रूप से, फोटोग्राममेट्री छवियों का विश्लेषण करके भौतिक वस्तुओं और वातावरण के बारे में सटीक माप और 3 डी जानकारी प्राप्त करने की तकनीक है। यह आमतौर पर विभिन्न कोणों से ली गई 2 डी छवियों से नक्शे, 3 डी मॉडल और माप बनाने के लिए उपयोग किया जाता है।

शोधकर्ताओं ने भी प्रकाशित किया है कागज़ ऑनलाइन प्रीप्रिंट जर्नल Arxiv पर नए मॉडल के बारे में। शोधों के अनुसार, Matrix3D एक मल्टीमॉडल डिफ्यूजन ट्रांसफार्मर (DIT) आर्किटेक्चर पर आधारित है। यह कई तौर -तरीकों जैसे कि छवि डेटा, कैमरा पैरामीटर और गहराई के नक्शे में डेटा को एकीकृत कर सकता है।

पेपर में, Apple के शोधकर्ताओं पर प्रकाश डाला गया कि मॉडल को एक मुखौटा सीखने की रणनीति का उपयोग करके प्रशिक्षित किया गया था, जहां छवि का एक हिस्सा बाधित होता है, और AI मॉडल को सही पिक्सेल खोजने के लिए प्रशिक्षित किया जाता है जो अंतराल में फिट होता है।

शोधकर्ताओं ने पाया कि एलएलएम विभिन्न कोणों से सिर्फ तीन छवियों के साथ एक संपूर्ण 3 डी ऑब्जेक्ट या दृश्य दृश्य उत्पन्न कर सकता है। जबकि मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटासेट का खुलासा नहीं किया गया था, मॉडल स्वयं कंपनी के GitHub पर एक अनुमेय Apple लाइसेंस के माध्यम से डाउनलोड, संशोधित करने और पुनर्वितरण के लिए उपलब्ध है प्रविष्टि

Continue Reading

AI & Automation

सैमसंग गैलेक्सी वॉच और गैलेक्सी बड्स 3 सीरीज़ एआई-पावर्ड जेमिनी इंटीग्रेशन जल्द ही प्राप्त करने के लिए

Published

on

By

SAMSUNG बुधवार को एकीकरण की घोषणा की मिथुनGoogle की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट, अपने वियरबल्स के लाइनअप में। सैमसंग गैलेक्सी वॉच और आकाशगंगा कलियाँ 3 श्रृंखला उपयोगकर्ता जल्द ही अनुस्मारक स्थापित करने, ग्रंथों को सारांशित करने, मौसम के अपडेट प्राप्त करने और अन्य गतिविधियों के लिए एआई सहायक का लाभ उठाने में सक्षम होंगे जो एआई बॉट ने पहले फोन पर अनुमति दी थी। इस कदम के साथ, कंपनी गैलेक्सी इकोसिस्टम में सभी उपकरणों में एआई सुविधाओं की उपस्थिति का विस्तार करती है।

सैमसंग गैलेक्सी वॉच, गैलेक्सी बड्स पर मिथुन

एक प्रेस नोट में, सैमसंग ने कहा कि गैलेक्सी वॉच पर मिथुन की शुरूआत गैलेक्सी पहनने योग्य लाइनअप में पहली बार एकीकरण को चिह्नित करती है। इसे सैमसंग के प्रमुख ट्रू वायरलेस स्टीरियो (TWS) ईयरबड्स – गैलेक्सी बड्स 3 सीरीज़ में भी एकीकृत किया जाएगा, जिसमें सक्रियण प्रक्रिया को “यहां तक ​​कि स्मूथ” के रूप में उद्धृत किया गया है।

गैलेक्सी वॉच पर, मिथुन नेचुरल वॉयस कमांड का उपयोग करके हाथों से मुक्त सहायता प्रदान की जाती है। उदाहरण के लिए, उपयोगकर्ता मिथुन से पूछ सकते हैं कि “मैं आज लॉकर 43 का उपयोग कर रहा हूं”, और एआई सहायक इसके लिए एक अनुस्मारक सेट करेगा। वे इसे त्वरित अवलोकन के लिए ईमेल को संक्षेप में प्रस्तुत करने के लिए भी कह सकते हैं। कंपनी का कहना है कि मिथुन प्रतिक्रिया देने और कार्रवाई करने के लिए ऐप्स में अनुरोधों को संभालता है।

सैमसंग कहते हैं, इस बीच, गैलेक्सी बड्स 3 सीरीज़ उपयोगकर्ताओं को मिथुन के साथ और भी अधिक सहज अनुभव हो सकता है। वे वॉयस कमांड या चुटकी का उपयोग कर सकते हैं और फोन के साथ बातचीत किए बिना, मौसम के अपडेट प्राप्त करने के लिए TWS Earbuds पर AI सहायक को आमंत्रित करने के लिए पकड़ सकते हैं।

विशेष रूप से, Google भी है लाना अधिक उपकरणों के लिए मिथुन। यह घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, Google I/O 2025 के लिए कंपनी का बिल्डअप जो अगले सप्ताह बंद हो जाता है। टेक दिग्गज के अनुसार, यह एंड्रॉइड टीवी के माध्यम से स्मार्ट टीवी पर, और एंड्रॉइड ऑटो के माध्यम से इन-कार इन्फोटेनमेंट सिस्टम के माध्यम से वियर ओएस के माध्यम से स्मार्टवॉच में आएगा। इसके अतिरिक्त, हेडसेट और स्मार्ट चश्मा द्वारा संचालित एंड्रॉइड एक्सआर ऑपरेटिंग सिस्टम एआई सहायक की क्षमताओं से भी लाभान्वित होगा।

जबकि उपलब्धता प्रश्न के तहत बनी हुई है, Google ने संकेत दिया कि मिथुन द्वारा संचालित सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।

Continue Reading

AI & Automation

Microsoft संगठन-व्यापी कटौती में लगभग तीन प्रतिशत कार्यबल को बंद करने के लिए

Published

on

By

Microsoft ने मंगलवार को कहा कि वह अपने कार्यबल के तीन प्रतिशत से भी कम या लगभग 6,000 कर्मचारियों को बंद कर रहा था, क्योंकि प्रौद्योगिकी दिग्गज आर्टिफिशियल इंटेलिजेंस पर अपने महत्वाकांक्षी दांव में अरबों डॉलर की फ़नलिंग करते हुए लागतों पर लगाम लगाते हैं।

कटौती सभी स्तरों और भौगोलिक क्षेत्रों में होगी और संभवतः सबसे बड़ी संभावना है माइक्रोसॉफ्ट 2023 में 10,000 कर्मचारियों को बंद कर दिया। कंपनी ने जनवरी में प्रदर्शन से संबंधित मुद्दों पर कम संख्या में कर्मचारियों को जाने दिया, लेकिन नए कटौती से संबंधित नहीं हैं, सीएनबीसी के अनुसार, जिसने पहली बार समाचार की सूचना दी थी।

बिग टेक एआई पर भारी खर्च कर रहा है क्योंकि वे नई तकनीक को एक प्रमुख विकास इंजन के रूप में देखते हैं, जबकि लाभ मार्जिन की सुरक्षा के लिए कहीं और लागत को कम करते हैं। गूगल पिछले एक साल में सैकड़ों कर्मचारियों को भी बंद कर दिया है, क्योंकि यह लागत को नियंत्रित करने और एआई को प्राथमिकता देने के लिए लगता है, मीडिया रिपोर्टों ने कहा है।

माइक्रोसॉफ्ट के प्रवक्ता ने मेल पर कहा, “हम एक गतिशील बाज़ार में सफलता के लिए कंपनी को सर्वोत्तम स्थिति के लिए आवश्यक संगठनात्मक परिवर्तनों को लागू करना जारी रखते हैं।”

कंपनी, जिसमें पिछले साल जून तक 2,28,000 श्रमिक थे, नियमित रूप से अपने मुख्य फोकस क्षेत्रों में स्टाफिंग को प्राथमिकता देने के लिए छंटनी का उपयोग करती है।

Microsoft ने अपने क्लाउड-कंप्यूटिंग व्यवसाय में मजबूत-से-अपेक्षित वृद्धि पोस्ट करने के हफ्तों बाद मंगलवार का कदम आता है नीला और नवीनतम तिमाही में ब्लोआउट परिणाम, एक अनिश्चित अर्थव्यवस्था में निवेशक को शांत करना।

लेकिन इसके एआई बुनियादी ढांचे को स्केल करने की लागत ने लाभप्रदता पर तौला है, माइक्रोसॉफ्ट क्लाउड मार्जिन के साथ मार्च तिमाही में एक साल पहले 72 प्रतिशत से 69 प्रतिशत तक पहुंच गया था।

Microsoft ने इस वित्तीय वर्ष में पूंजी खर्च करने में पूंजी में $ 80 बिलियन (लगभग 6,83,255 करोड़ रुपये) की शुरुआत की है, इसका उद्देश्य आर्टिफिशियल इंटेलिजेंस सेवाओं के लिए क्षमता को कम करने के लिए डेटा केंद्रों का विस्तार करना है।

डीए डेविडसन के विश्लेषक गिल लुरिया ने कहा कि छंटनी ने दिखाया कि माइक्रोसॉफ्ट अपने ऊंचे एआई निवेशों द्वारा बनाए गए मार्जिन दबाव को प्रबंधित कर रहा था।

“हम मानते हैं कि हर साल Microsoft मौजूदा स्तरों पर निवेश करता है, इसे अपने पूंजीगत व्यय के कारण उच्च मूल्यह्रास स्तरों के लिए बनाने के लिए कम से कम 10,000 तक हेडकाउंट को कम करने की आवश्यकता होगी,” उन्होंने कहा।

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Tiktok कहानियों में फ़ोटो से वीडियो बनाने के लिए नए AI अलाइव टूल का परिचय देता है

Published

on

By

टिकटोक एक नई आर्टिफिशियल इंटेलिजेंस (एआई) सुविधा पेश कर रही है जो उपयोगकर्ताओं को एक छवि को एक एनिमेटेड वीडियो में बदलने की अनुमति देगा। मंगलवार को, वर्टिकल वीडियो-आधारित सोशल मीडिया प्लेटफॉर्म ने एक नए एआई सुविधा की घोषणा की, जिसे एआई अलाइव कहा जाता है जो तस्वीरों से वीडियो बनाने के लिए जेनेरिक एआई तकनीक का उपयोग करता है। वर्तमान में, टूल का उपयोग केवल टिकटोक कहानियों में वीडियो उत्पन्न करने के लिए किया जा सकता है, न कि सीधे फ़ीड के लिए। इसके अतिरिक्त, कंपनी ने कहा कि यह उपयोगकर्ताओं द्वारा दुर्व्यवहार किए जा रहे फीचर के जोखिम को कम करने के लिए कई कदम उठा रहा है।

Tiktok ai अलाइव फीचर आपकी तस्वीरों को वीडियो में बदल सकता है

एक न्यूज़ रूम में डाक अपनी अमेरिकी वेबसाइट पर, टिकटोक ने नए एआई फीचर के रोलआउट की घोषणा की। यह किसी भी वीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म द्वारा पेश किया गया पहला एआई-संचालित इमेज-टू-वीडियो जनरेशन टूल है। इंस्टाग्राम, एक्स, और स्नैपचैट किसी भी एआई-संचालित वीडियो जनरेशन टूल की पेशकश नहीं करते हैं। जबकि YouTube शॉर्ट्स हाल ही में शुरू हुआ है परीक्षण एक टेक्स्ट-टू-वीडियो जनरेशन फीचर, इसे व्यापक रूप से रोल आउट नहीं किया गया है।

Tiktok AI अलाइव फीचर इनबॉक्स पेज या प्रोफाइल पेज के शीर्ष पर ब्लू प्लस आइकन (+) को टैप करके पाया जा सकता है। वहां, उपयोगकर्ताओं को पहले अपने स्टोरी एल्बम से एक ही छवि का चयन करना होगा। एआई अलाइव आइकन फोटो एडिट पेज पर दाईं ओर टूलबार पर स्थित है। इसे ऊपर से दूसरे स्थान पर रखा जाना चाहिए।

एआई अलाइव आइकन पर टैप करने से एक और विंडो खुलती है, जहां उपयोगकर्ता एक टेक्स्ट प्रॉम्प्ट जोड़ सकते हैं कि वे कैसे चाहते हैं कि छवि एनिमेटेड हो। यदि वे निश्चित नहीं हैं, तो वे एक ही पृष्ठ पर कई सुझाए गए पाठ संकेतों में से एक का भी उपयोग कर सकते हैं। एक बार हो जाने के बाद, वे जनरेट बटन को टैप कर सकते हैं और एक छोटा वीडियो बनाया जाता है। उपयोगकर्ता तब वीडियो पोस्ट कर सकते हैं, और लोग आपके लिए और फॉलो फ़ीड्स के साथ -साथ उपयोगकर्ता के प्रोफाइल पेज पर कहानी को वीडियो कर सकते हैं।

कंपनी ने कहा कि इसने अपलोड किए गए फोटो, टेक्स्ट प्रॉम्प्ट और एआई अलाइव वीडियो की समीक्षा करने के लिए मॉडरेशन तकनीक को लागू किया है, इससे पहले कि यह निर्माता को दिखाया जाए। एक अंतिम चेक तब होता है जब उपयोगकर्ता वीडियो को अपनी कहानी पर पोस्ट करता है। इसके अतिरिक्त, अन्य उपयोगकर्ता उन वीडियो की रिपोर्ट कर सकते हैं जो उन्हें लगता है कि प्लेटफ़ॉर्म के दिशानिर्देशों को तोड़ सकते हैं।

इसके अलावा, टिक्तोक भी एक दृश्यमान एआई-जनित लेबल जोड़ रहा है ताकि लोगों को यह पता चल सके कि यह एक सिंथेटिक वीडियो है। कंपनी ने कहा कि सामग्री सिद्धता और प्रामाणिकता (C2PA) मेटाडेटा के लिए गठबंधन, प्रमुख AI खिलाड़ियों के बीच एक मानक, हर AI- जनरेट किए गए वीडियो में भी जोड़ा जाता है, कंपनी ने कहा।


Continue Reading

Trending