Connect with us

AI & Automation

स्थिरता एआई और एआरएम रिलीज लाइटवेट टेक्स-टू-ऑडियो मॉडल तेजी से ऑन-डिवाइस पीढ़ी के लिए अनुकूलित

Published

on

स्थिरता एआई एआरएम के साथ साझेदारी में एक नया टेक्स्ट-टू-ऑडियो पीढ़ी आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल विकसित किया। बुधवार को घोषणा की गई, नए मॉडल को स्थिर ऑडियो ओपन स्मॉल करार दिया गया है, और यह कहा जाता है कि यह पाठ संकेतों का उपयोग करके छोटे ऑडियो नमूने उत्पन्न करने के लिए है। लंदन स्थित एआई फर्म ने कहा कि मॉडल हल्का है और पूरी तरह से एआरएम सीपीयू पर चलने के लिए अनुकूलित है। यह भी कहा जाता है कि यह एक तेज पीढ़ी का समय है, जिससे यह थोक उपयोग के मामलों के लिए उपयोगी है। ओपन-सोर्स ऑडियो मॉडल GitHub और Hugging Face से डाउनलोड करने के लिए उपलब्ध है।

स्थिरता एआई स्थिर ऑडियो खुला छोटा रिलीज करता है

एक न्यूज़ रूम में डाकएआई फर्म ने नए बड़े भाषा मॉडल को विस्तृत किया। यह स्थिर ऑडियो ओपन मॉडल का एक आसुत संस्करण है, जो था जारी किया जून 2024 में, और 47 सेकंड तक ऑडियो उत्पन्न कर सकते हैं। छोटे टेक्स्ट-टू-ऑडियो मॉडल को तेज पीढ़ी की गति और छोटे आकार पर ध्यान केंद्रित करने के साथ डिज़ाइन किया गया था।

स्थिर ऑडियो ओपन छोटा एक 341 मिलियन पैरामीटर मॉडल है जो ऑडियो के 11 सेकंड तक उत्पन्न कर सकता है। कंपनी का दावा है कि यह स्मार्टफोन पर स्थानीय रूप से चलने के दौरान आठ सेकंड से भी कम समय में एक ऑडियो नमूना उत्पन्न कर सकता है। दिलचस्प बात यह है कि स्टेबिलिटी एआई और एआरएम ने मोबाइल वर्ल्ड कांग्रेस (MWC) 2025 में जेनेरिक ऑडियो क्रिएशन के लिए अपने सहयोग की घोषणा की।

आर्किटेक्चर और ट्रेनिंग में आकर, स्थिर ऑडियो ओपन स्मॉल एक ट्रांसफॉर्मर आर्किटेक्चर पर आधारित एक अव्यक्त प्रसार मॉडल है। यह 4,86,492 ऑडियो रिकॉर्डिंग के डेटासेट पर प्रशिक्षित है। कंपनी ने कहा कि सभी ऑडियो फाइलें लाइसेंस प्राप्त हैं। पाठ कंडीशनिंग के लिए, एक सार्वजनिक रूप से उपलब्ध पूर्व-प्रशिक्षित T5 मॉडल का उपयोग किया गया था। एआई फर्म ने त्वरित पालन में सुधार करने और निष्कर्ष की गति को बढ़ाने के लिए प्रशिक्षण के बाद के चरण में प्रतिकूल संबंध-संकल्पना (एआरसी) एल्गोरिथ्म का उपयोग किया।

कंपनी के अनुसार, यह टेक्स्ट-टू-ऑडियो मॉडल ड्रम लूप, फोली, इंस्ट्रूमेंट रिफ़्स और एंबिएंट टेक्सचर बनाने के लिए अनुकूल है। इसके छोटे आकार के कारण, इसे एआरएम-पावर्ड स्मार्टफोन के साथ-साथ एज डिवाइस पर भी तैनात किया जा सकता है। मॉडल का उपयोग उन परिदृश्यों में भी किया जा सकता है जहां वास्तविक समय पीढ़ी और जवाबदेही पदार्थ।

स्थिर ऑडियो ओपन स्मॉल के मॉडल वेट को एआई फर्म के गले लगने वाले चेहरे पर डाउनलोड किया जा सकता है प्रविष्टिऔर कोड बेस GitHub पर पाया जा सकता है प्रविष्टि। AI मॉडल अनुमेय स्थिरता AI समुदाय लाइसेंस के तहत वाणिज्यिक और गैर-वाणिज्यिक उपयोग के लिए उपलब्ध है।

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

Google DeepMind Alphaevolve का अनावरण करता है, एक कोडिंग एजेंट जो AI मतिभ्रम को कम करने के लिए डिज़ाइन किया गया है

Published

on

By

Google DeepMind बुधवार को एक नए आर्टिफिशियल इंटेलिजेंस (एआई) कोडिंग एजेंट की घोषणा की जो एआई मॉडल की क्षमताओं को बढ़ा सकती है। डब्ड अल्फावोल्व, यह जटिल कंप्यूटिंग और गणितीय कार्यों में एल्गोरिदम को खोजने और अनुकूलित करने के लिए डिज़ाइन किया गया है। शक्तिशाली एआई प्रणाली माउंटेन व्यू-आधारित टेक दिग्गज के मिथुन मॉडल पर बनाई गई है, और यह बड़े भाषा मॉडल द्वारा उत्पन्न आउटपुट को स्वचालित मूल्यांकनकर्ताओं के साथ उत्पन्न करता है ताकि वास्तविकता में प्रतिक्रियाओं को जमीन पर रखा जा सके और मतिभ्रम के जोखिम को कम किया जा सके। इसके अलावा, सिस्टम को गणितीय समस्याओं को हल करने और अनुकूलित करने में क्षमता भी दिखाई गई है।

Google DeepMind अल्फावोलव कोडिंग एजेंट का परिचय देता है

में एक ब्लॉग भेजादीपमाइंड ने जिस नई तकनीक पर काम किया है, वह विस्तृत है। Alphaevolve एक AI मॉडल नहीं है, इसके बजाय, यह एजेंटिक क्षमताओं के साथ एक जटिल AI प्रणाली है। सिस्टम द्वारा किए गए प्राथमिक कार्यों में से एक एल्गोरिथ्म खोज और अनुकूलन है।

एआई मॉडल, एक मौलिक स्तर पर, कोड की एक श्रृंखला है। ये कोड आधार प्रक्रिया और संकलन जानकारी, इसे तोड़ते हैं, और आउटपुट उत्पन्न करने के लिए संभाव्य एल्गोरिदम का उपयोग करते हैं। हालांकि, चूंकि एआई सिस्टम अत्यधिक जटिल हैं, इसलिए उनके कोड आधार बड़े पैमाने पर हैं। यह बड़ा आकार अक्सर अनुकूलन और दक्षता-आधारित मुद्दों का कारण बनता है। अल्फावोलवे इसके साथ मदद कर सकता है, कंपनी ने कहा।

Alphaevolve काम कर रहे Google Alphaevolve

अल्फेवोल्व संरचना
फोटो क्रेडिट: Google

Alphaevolve स्वचालित मूल्यांकन मेट्रिक्स का उपयोग करता है, और इन मापदंडों का उपयोग करके, यह AI मॉडल द्वारा उत्पन्न किए गए प्रतिक्रियाओं को सत्यापित करता है, चलाता है और स्कोर करता है। गूगल कहा कि यह विधि प्रणाली को कई एआई मॉडल से प्रतिक्रियाओं का आकलन करने और मतिभ्रम के जोखिम को कम करने की अनुमति देती है। इसके अतिरिक्त, सिस्टम ऐसे कोड को भी ठीक और सुधार सकता है जो इस तरह के मतिभ्रम की अनुमति देता है।

टेक दिग्गज ने कहा कि अल्फेवोल्व ने Google के डेटा सेंटर, चिप डिज़ाइन और एआई प्रशिक्षण प्रक्रियाओं की दक्षता में सुधार किया है। दिलचस्प बात यह है कि यह अपने स्वयं के आधार एलएलएम के प्रशिक्षण में सुधार करने में भी सक्षम था। एक मामले में, इसने एक नई शेड्यूलिंग विधि की खोज की जो Google के वैश्विक गणना संसाधनों के लगभग 0.7 प्रतिशत को ठीक करती है – कंपनी के बड़े पैमाने पर बुनियादी ढांचे में लागू होने पर एक बड़ा लाभ।

चूंकि अल्फावोल्व कोड बेस और एल्गोरिदम के साथ काम करता है, इसलिए यह भी कहा जाता है कि गणितीय समस्या को हल करने के विभिन्न क्षेत्रों में उच्च क्षमता है, कंपनी ने कहा। कहा जाता है कि यह 4×4 कॉम्प्लेक्स मैट्रिसेस को गुणा करने के लिए एक तेज विधि की खोज की गई है, जो एक समाधान को हराकर 50 से अधिक वर्षों तक खड़ा था। 50 खुली गणितीय समस्याओं के परीक्षणों में, अल्फेवोलवे ने ज्यादातर मामलों में वर्तमान सर्वश्रेष्ठ समाधानों का मिलान किया, और यहां तक ​​कि लगभग 20 प्रतिशत समस्याओं में उन पर सुधार किया, पोस्ट ने कहा।

Continue Reading

AI & Automation

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 एआई पीसी के साथ इंटेल कोर अल्ट्रा सीपीयू के साथ भारत में लॉन्च किया गया

Published

on

By

गड्ढा कृत्रिम बुद्धिमत्ता की एक विस्तृत श्रृंखला लॉन्च की () भारत में गुरुवार को पीसी। लाइनअप में तीन मॉडल शामिल हैं-डेल 14 प्लस, डेल 16 प्लस, और डेल 14 2-इन -1, जिन्हें डेल प्लस पोर्टफोलियो के हिस्से के रूप में नई यूनिफाइड ब्रांडिंग के तहत पेश किया गया है। कंपनी के अनुसार, इसके नए एआई पीसी नवीनतम इंटेल कोर अल्ट्रा प्रोसेसर द्वारा संचालित हैं और कोपिलॉट+ एआई क्षमताओं को वितरित करने के लिए बनाए गए हैं। जबकि डेल 14 प्लस और डेल 16 प्लस में एक पारंपरिक लैपटॉप डिज़ाइन है, डेल 14 2-इन -1 एक बहुमुखी पेशकश है जो लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण कर सकता है।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 मूल्य भारत में

डेल 14 2-इन -1 मूल्य भारत में रुपये से शुरू होता है। 96,899। इस बीच, डेल 14 प्लस और डेल 16 प्लस मॉडल की कीमत रु। 1,15,799 और रु। आधार विन्यास के लिए क्रमशः 1,08,499। लैपटॉप डेल.कॉम, डेल एक्सक्लूसिव स्टोर्स, रिटेल पार्टनर्स जैसे क्रोमा, रिलायंस रिटेल और विजय सेल्स, और अन्य मल्टी-ब्रांड आउटलेट्स और प्रमुख ई-कॉमर्स प्लेटफॉर्म के माध्यम से खरीद के लिए उपलब्ध होगा।

डेल 14 प्लस, डेल 16 प्लस और डेल 14 2-इन -1 विनिर्देश

डेल 14 प्लस और 14 2-इन -1 मॉडल में क्रमशः 14-इंच 2.5k (2,560 x 1,600 पिक्सल) एंटी-ग्लेयर नॉन-टचस्क्रीन डिस्प्ले और 14-इंच पूर्ण एचडी+ (1,920 x 1,200 पिक्सल) टच स्क्रीन डिस्प्ले हैं। इस बीच, डेल 16 प्लस में 16 इंच का पूर्ण एचडी+ (1,920 x 1,200 पिक्सेल) स्क्रीन है। 2-इन -1 मॉडल 360-डिग्री काज के साथ आता है जो इसे लैपटॉप, टैबलेट, तम्बू और स्टैंड मोड के बीच संक्रमण में मदद करता है।

सभी मॉडलों में 300nits पीक चमक तक है। उन्हें आठ कोर के साथ एक इंटेल कोर अल्ट्रा 7 256V प्रोसेसर और 4.8GHz की पीक घड़ी की गति के साथ कॉन्फ़िगर किया जा सकता है। वे एक समर्पित तंत्रिका प्रसंस्करण इकाई (NPU) के साथ भी आते हैं, जो अकेले 47 TERA संचालन प्रति सेकंड (TOPS) के शिखर प्रदर्शन को देने का दावा किया जाता है। डब एआई पीसीएस, नए डेल प्लस मॉडल कोपिलॉट+ क्षमताओं के साथ आते हैं। कंपनी उपयोगकर्ताओं को अपनी उत्पादकता को अधिकतम करने में उपयोगकर्ताओं की मदद करने के लिए AI- चालित उपकरण जैसे रिकॉल और Cocreator भी प्रदान करती है।

पूरे डेल प्लस लाइनअप में एक्सप्रेसचार्ज तकनीक की सुविधा है जो लैपटॉप को 60 मिनट में 80 प्रतिशत तक बढ़ा सकती है। कनेक्टिविटी विकल्पों में वाई-फाई 7, ब्लूटूथ, यूएसबी 3.2 जनरल 1 टाइप-ए पोर्ट, यूएसबी 3.2 जनरल 2 टाइप-सी पोर्ट, डिस्प्लेपोर्ट 2.1 के साथ थंडरबोल्ट 4, एक एचडीएमआई 2.1 पोर्ट और 3.5 मिमी हेडफोन जैक शामिल हैं।

Continue Reading

AI & Automation

Openai GPT-4.1 AI मॉडल का विस्तार करता है, जिसमें उन्नत कोडिंग क्षमताओं के साथ CHATGPT

Published

on

By

ओपनई CHATGPT के लिए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल की हाल ही में जारी GPT-4.1 श्रृंखला के विस्तार की घोषणा की। ये मॉडल अब तक थे अनन्य कंपनी के एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के लिए, लेकिन गुरुवार को, सैन फ्रांसिस्को स्थित एआई फर्म ने कहा कि वे चैटबॉट के भीतर भी उपलब्ध होंगे। विशेष रूप से, GPT-4.1 और GPT-4.1 मिनी मॉडल वर्तमान में CHATGPT के लिए रोल आउट किए जा रहे हैं। कंपनी का कहना है कि इन नए मॉडल में कोडिंग-संबंधित कार्यों में उच्च प्रवीणता है और यह O3 मॉडल का विकल्प हो सकता है।

Openai के GPT-4.1 AI मॉडल अब CHATGPT में आ रहे हैं

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईएआई के आधिकारिक हैंडल ने घोषणा की कि जीपीटी -4.1 एआई मॉडल अब सीधे CHATGPT में उपलब्ध होगा। कोडिंग कार्यों के लिए O3 मॉडल के विकल्प के रूप में इसे पिच करते हुए, कंपनी ने कहा कि विशेष मॉडल भी निम्नलिखित निर्देश में उत्कृष्टता प्राप्त करता है। यह “अधिक मॉडल” ड्रॉपडाउन मेनू में CHATGPT प्लस, प्रो और टीम उपयोगकर्ताओं के लिए उपलब्ध होगा।

इसके अतिरिक्त, एंटरप्राइज और ईडीयू ग्राहकों को आने वाले हफ्तों में मॉडल तक पहुंच मिलेगी। के मुक्त स्तर पर चटपट जल्द ही GPT-4.1 मिनी मॉडल तक पहुंच प्राप्त होगी, जो GPT-4O मिनी मॉडल की जगह होगी।

लॉन्च के समय, Openai ने कहा कि इन मॉडलों ने कोडिंग क्षमता में GPT-4O और GPT-4.5 AI दोनों मॉडल दोनों को बेहतर बनाया। आंतरिक परीक्षण के आधार पर, कंपनी ने दावा किया कि GPT-4.1 ने SWE-Bench सत्यापित बेंचमार्क पर 54.6 प्रतिशत स्कोर किया।

यह भी दावा किया जाता है कि अनुदेश के लिए मल्टीचैलेंज बेंचमार्क पर 38.3 प्रतिशत स्कोर किया है, और मल्टीमॉडल लॉन्ग संदर्भ समझ के लिए वीडियो-एमएमई बेंचमार्क पर 72 प्रतिशत। मॉडल की GPT-4.1 श्रृंखला में एक मिलियन टोकन तक की एक संदर्भ विंडो है।

जबकि GPT-4.1 इस श्रृंखला का प्रीमियम मॉडल बना हुआ है, GPT-4.1 मिनी को कई बेंचमार्क में GPT-4O को बेहतर बनाने का दावा किया गया है, जिसमें खुफिया मूल्यांकन भी शामिल है। Openai ने कहा कि मिनी मॉडल विलंबता को आधे से कम करता है और 4o की तुलना में 83 प्रतिशत कम खर्च होता है।

Continue Reading

AI & Automation

Apple के शोधकर्ता Matrix3D का परिचय देते हैं, एक एकीकृत AI मॉडल जो 2D फ़ोटो को 3D ऑब्जेक्ट में बदल सकता है

Published

on

By

सेब शोधकर्ताओं ने एक नया आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया जो कई 2 डी छवियों से 3 डी दृश्य उत्पन्न कर सकता है। बड़े भाषा मॉडल (LLM), डब किए गए Matrix3D, को कंपनी की मशीन लर्निंग टीम द्वारा नानजिंग विश्वविद्यालय और हांगकांग विश्वविद्यालय के विज्ञान और प्रौद्योगिकी विश्वविद्यालय (HKUST) के सहयोग से विकसित किया गया था। क्यूपर्टिनो-आधारित टेक दिग्गज ने एआई मॉडल को खुले समुदाय के लिए उपलब्ध कराया है, और इसे GitHub पर Apple की लिस्टिंग के माध्यम से डाउनलोड किया जा सकता है। Matrix3D के साथ, शोधकर्ताओं ने त्रुटियों के जोखिम को खत्म करने के लिए 3 डी पीढ़ी के पाइपलाइन को एकीकृत किया है।

Apple का Matrix3D मल्टी-टास्क फोटोग्राममेट्री का नवाचार करता है

में एक डाकटेक दिग्गज ने उस शोध को विस्तृत किया जो Matrix3D AI मॉडल के विकास में चला गया। जबकि कई 3 डी रेंडरिंग मॉडल पहले से मौजूद हैं, यह 3 डी व्यू बनाने के लिए पाइपलाइन को एकजुट करके मौजूदा स्थान को नवाचार करता है। कई मॉडल और घटकों के होने के बजाय, यहां, एक एकल एलएलएम कई फोटोग्राममेट्री सबटास्क करता है जैसे कि मुद्रा अनुमान, गहराई की भविष्यवाणी और उपन्यास दृश्य संश्लेषण।

विशेष रूप से, फोटोग्राममेट्री छवियों का विश्लेषण करके भौतिक वस्तुओं और वातावरण के बारे में सटीक माप और 3 डी जानकारी प्राप्त करने की तकनीक है। यह आमतौर पर विभिन्न कोणों से ली गई 2 डी छवियों से नक्शे, 3 डी मॉडल और माप बनाने के लिए उपयोग किया जाता है।

शोधकर्ताओं ने भी प्रकाशित किया है कागज़ ऑनलाइन प्रीप्रिंट जर्नल Arxiv पर नए मॉडल के बारे में। शोधों के अनुसार, Matrix3D एक मल्टीमॉडल डिफ्यूजन ट्रांसफार्मर (DIT) आर्किटेक्चर पर आधारित है। यह कई तौर -तरीकों जैसे कि छवि डेटा, कैमरा पैरामीटर और गहराई के नक्शे में डेटा को एकीकृत कर सकता है।

पेपर में, Apple के शोधकर्ताओं पर प्रकाश डाला गया कि मॉडल को एक मुखौटा सीखने की रणनीति का उपयोग करके प्रशिक्षित किया गया था, जहां छवि का एक हिस्सा बाधित होता है, और AI मॉडल को सही पिक्सेल खोजने के लिए प्रशिक्षित किया जाता है जो अंतराल में फिट होता है।

शोधकर्ताओं ने पाया कि एलएलएम विभिन्न कोणों से सिर्फ तीन छवियों के साथ एक संपूर्ण 3 डी ऑब्जेक्ट या दृश्य दृश्य उत्पन्न कर सकता है। जबकि मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटासेट का खुलासा नहीं किया गया था, मॉडल स्वयं कंपनी के GitHub पर एक अनुमेय Apple लाइसेंस के माध्यम से डाउनलोड, संशोधित करने और पुनर्वितरण के लिए उपलब्ध है प्रविष्टि

Continue Reading

AI & Automation

सैमसंग गैलेक्सी वॉच और गैलेक्सी बड्स 3 सीरीज़ एआई-पावर्ड जेमिनी इंटीग्रेशन जल्द ही प्राप्त करने के लिए

Published

on

By

SAMSUNG बुधवार को एकीकरण की घोषणा की मिथुनGoogle की आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट, अपने वियरबल्स के लाइनअप में। सैमसंग गैलेक्सी वॉच और आकाशगंगा कलियाँ 3 श्रृंखला उपयोगकर्ता जल्द ही अनुस्मारक स्थापित करने, ग्रंथों को सारांशित करने, मौसम के अपडेट प्राप्त करने और अन्य गतिविधियों के लिए एआई सहायक का लाभ उठाने में सक्षम होंगे जो एआई बॉट ने पहले फोन पर अनुमति दी थी। इस कदम के साथ, कंपनी गैलेक्सी इकोसिस्टम में सभी उपकरणों में एआई सुविधाओं की उपस्थिति का विस्तार करती है।

सैमसंग गैलेक्सी वॉच, गैलेक्सी बड्स पर मिथुन

एक प्रेस नोट में, सैमसंग ने कहा कि गैलेक्सी वॉच पर मिथुन की शुरूआत गैलेक्सी पहनने योग्य लाइनअप में पहली बार एकीकरण को चिह्नित करती है। इसे सैमसंग के प्रमुख ट्रू वायरलेस स्टीरियो (TWS) ईयरबड्स – गैलेक्सी बड्स 3 सीरीज़ में भी एकीकृत किया जाएगा, जिसमें सक्रियण प्रक्रिया को “यहां तक ​​कि स्मूथ” के रूप में उद्धृत किया गया है।

गैलेक्सी वॉच पर, मिथुन नेचुरल वॉयस कमांड का उपयोग करके हाथों से मुक्त सहायता प्रदान की जाती है। उदाहरण के लिए, उपयोगकर्ता मिथुन से पूछ सकते हैं कि “मैं आज लॉकर 43 का उपयोग कर रहा हूं”, और एआई सहायक इसके लिए एक अनुस्मारक सेट करेगा। वे इसे त्वरित अवलोकन के लिए ईमेल को संक्षेप में प्रस्तुत करने के लिए भी कह सकते हैं। कंपनी का कहना है कि मिथुन प्रतिक्रिया देने और कार्रवाई करने के लिए ऐप्स में अनुरोधों को संभालता है।

सैमसंग कहते हैं, इस बीच, गैलेक्सी बड्स 3 सीरीज़ उपयोगकर्ताओं को मिथुन के साथ और भी अधिक सहज अनुभव हो सकता है। वे वॉयस कमांड या चुटकी का उपयोग कर सकते हैं और फोन के साथ बातचीत किए बिना, मौसम के अपडेट प्राप्त करने के लिए TWS Earbuds पर AI सहायक को आमंत्रित करने के लिए पकड़ सकते हैं।

विशेष रूप से, Google भी है लाना अधिक उपकरणों के लिए मिथुन। यह घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, Google I/O 2025 के लिए कंपनी का बिल्डअप जो अगले सप्ताह बंद हो जाता है। टेक दिग्गज के अनुसार, यह एंड्रॉइड टीवी के माध्यम से स्मार्ट टीवी पर, और एंड्रॉइड ऑटो के माध्यम से इन-कार इन्फोटेनमेंट सिस्टम के माध्यम से वियर ओएस के माध्यम से स्मार्टवॉच में आएगा। इसके अतिरिक्त, हेडसेट और स्मार्ट चश्मा द्वारा संचालित एंड्रॉइड एक्सआर ऑपरेटिंग सिस्टम एआई सहायक की क्षमताओं से भी लाभान्वित होगा।

जबकि उपलब्धता प्रश्न के तहत बनी हुई है, Google ने संकेत दिया कि मिथुन द्वारा संचालित सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।

Continue Reading

AI & Automation

Microsoft संगठन-व्यापी कटौती में लगभग तीन प्रतिशत कार्यबल को बंद करने के लिए

Published

on

By

Microsoft ने मंगलवार को कहा कि वह अपने कार्यबल के तीन प्रतिशत से भी कम या लगभग 6,000 कर्मचारियों को बंद कर रहा था, क्योंकि प्रौद्योगिकी दिग्गज आर्टिफिशियल इंटेलिजेंस पर अपने महत्वाकांक्षी दांव में अरबों डॉलर की फ़नलिंग करते हुए लागतों पर लगाम लगाते हैं।

कटौती सभी स्तरों और भौगोलिक क्षेत्रों में होगी और संभवतः सबसे बड़ी संभावना है माइक्रोसॉफ्ट 2023 में 10,000 कर्मचारियों को बंद कर दिया। कंपनी ने जनवरी में प्रदर्शन से संबंधित मुद्दों पर कम संख्या में कर्मचारियों को जाने दिया, लेकिन नए कटौती से संबंधित नहीं हैं, सीएनबीसी के अनुसार, जिसने पहली बार समाचार की सूचना दी थी।

बिग टेक एआई पर भारी खर्च कर रहा है क्योंकि वे नई तकनीक को एक प्रमुख विकास इंजन के रूप में देखते हैं, जबकि लाभ मार्जिन की सुरक्षा के लिए कहीं और लागत को कम करते हैं। गूगल पिछले एक साल में सैकड़ों कर्मचारियों को भी बंद कर दिया है, क्योंकि यह लागत को नियंत्रित करने और एआई को प्राथमिकता देने के लिए लगता है, मीडिया रिपोर्टों ने कहा है।

माइक्रोसॉफ्ट के प्रवक्ता ने मेल पर कहा, “हम एक गतिशील बाज़ार में सफलता के लिए कंपनी को सर्वोत्तम स्थिति के लिए आवश्यक संगठनात्मक परिवर्तनों को लागू करना जारी रखते हैं।”

कंपनी, जिसमें पिछले साल जून तक 2,28,000 श्रमिक थे, नियमित रूप से अपने मुख्य फोकस क्षेत्रों में स्टाफिंग को प्राथमिकता देने के लिए छंटनी का उपयोग करती है।

Microsoft ने अपने क्लाउड-कंप्यूटिंग व्यवसाय में मजबूत-से-अपेक्षित वृद्धि पोस्ट करने के हफ्तों बाद मंगलवार का कदम आता है नीला और नवीनतम तिमाही में ब्लोआउट परिणाम, एक अनिश्चित अर्थव्यवस्था में निवेशक को शांत करना।

लेकिन इसके एआई बुनियादी ढांचे को स्केल करने की लागत ने लाभप्रदता पर तौला है, माइक्रोसॉफ्ट क्लाउड मार्जिन के साथ मार्च तिमाही में एक साल पहले 72 प्रतिशत से 69 प्रतिशत तक पहुंच गया था।

Microsoft ने इस वित्तीय वर्ष में पूंजी खर्च करने में पूंजी में $ 80 बिलियन (लगभग 6,83,255 करोड़ रुपये) की शुरुआत की है, इसका उद्देश्य आर्टिफिशियल इंटेलिजेंस सेवाओं के लिए क्षमता को कम करने के लिए डेटा केंद्रों का विस्तार करना है।

डीए डेविडसन के विश्लेषक गिल लुरिया ने कहा कि छंटनी ने दिखाया कि माइक्रोसॉफ्ट अपने ऊंचे एआई निवेशों द्वारा बनाए गए मार्जिन दबाव को प्रबंधित कर रहा था।

“हम मानते हैं कि हर साल Microsoft मौजूदा स्तरों पर निवेश करता है, इसे अपने पूंजीगत व्यय के कारण उच्च मूल्यह्रास स्तरों के लिए बनाने के लिए कम से कम 10,000 तक हेडकाउंट को कम करने की आवश्यकता होगी,” उन्होंने कहा।

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

AI & Automation

Tiktok कहानियों में फ़ोटो से वीडियो बनाने के लिए नए AI अलाइव टूल का परिचय देता है

Published

on

By

टिकटोक एक नई आर्टिफिशियल इंटेलिजेंस (एआई) सुविधा पेश कर रही है जो उपयोगकर्ताओं को एक छवि को एक एनिमेटेड वीडियो में बदलने की अनुमति देगा। मंगलवार को, वर्टिकल वीडियो-आधारित सोशल मीडिया प्लेटफॉर्म ने एक नए एआई सुविधा की घोषणा की, जिसे एआई अलाइव कहा जाता है जो तस्वीरों से वीडियो बनाने के लिए जेनेरिक एआई तकनीक का उपयोग करता है। वर्तमान में, टूल का उपयोग केवल टिकटोक कहानियों में वीडियो उत्पन्न करने के लिए किया जा सकता है, न कि सीधे फ़ीड के लिए। इसके अतिरिक्त, कंपनी ने कहा कि यह उपयोगकर्ताओं द्वारा दुर्व्यवहार किए जा रहे फीचर के जोखिम को कम करने के लिए कई कदम उठा रहा है।

Tiktok ai अलाइव फीचर आपकी तस्वीरों को वीडियो में बदल सकता है

एक न्यूज़ रूम में डाक अपनी अमेरिकी वेबसाइट पर, टिकटोक ने नए एआई फीचर के रोलआउट की घोषणा की। यह किसी भी वीडियो-केंद्रित सोशल मीडिया प्लेटफॉर्म द्वारा पेश किया गया पहला एआई-संचालित इमेज-टू-वीडियो जनरेशन टूल है। इंस्टाग्राम, एक्स, और स्नैपचैट किसी भी एआई-संचालित वीडियो जनरेशन टूल की पेशकश नहीं करते हैं। जबकि YouTube शॉर्ट्स हाल ही में शुरू हुआ है परीक्षण एक टेक्स्ट-टू-वीडियो जनरेशन फीचर, इसे व्यापक रूप से रोल आउट नहीं किया गया है।

Tiktok AI अलाइव फीचर इनबॉक्स पेज या प्रोफाइल पेज के शीर्ष पर ब्लू प्लस आइकन (+) को टैप करके पाया जा सकता है। वहां, उपयोगकर्ताओं को पहले अपने स्टोरी एल्बम से एक ही छवि का चयन करना होगा। एआई अलाइव आइकन फोटो एडिट पेज पर दाईं ओर टूलबार पर स्थित है। इसे ऊपर से दूसरे स्थान पर रखा जाना चाहिए।

एआई अलाइव आइकन पर टैप करने से एक और विंडो खुलती है, जहां उपयोगकर्ता एक टेक्स्ट प्रॉम्प्ट जोड़ सकते हैं कि वे कैसे चाहते हैं कि छवि एनिमेटेड हो। यदि वे निश्चित नहीं हैं, तो वे एक ही पृष्ठ पर कई सुझाए गए पाठ संकेतों में से एक का भी उपयोग कर सकते हैं। एक बार हो जाने के बाद, वे जनरेट बटन को टैप कर सकते हैं और एक छोटा वीडियो बनाया जाता है। उपयोगकर्ता तब वीडियो पोस्ट कर सकते हैं, और लोग आपके लिए और फॉलो फ़ीड्स के साथ -साथ उपयोगकर्ता के प्रोफाइल पेज पर कहानी को वीडियो कर सकते हैं।

कंपनी ने कहा कि इसने अपलोड किए गए फोटो, टेक्स्ट प्रॉम्प्ट और एआई अलाइव वीडियो की समीक्षा करने के लिए मॉडरेशन तकनीक को लागू किया है, इससे पहले कि यह निर्माता को दिखाया जाए। एक अंतिम चेक तब होता है जब उपयोगकर्ता वीडियो को अपनी कहानी पर पोस्ट करता है। इसके अतिरिक्त, अन्य उपयोगकर्ता उन वीडियो की रिपोर्ट कर सकते हैं जो उन्हें लगता है कि प्लेटफ़ॉर्म के दिशानिर्देशों को तोड़ सकते हैं।

इसके अलावा, टिक्तोक भी एक दृश्यमान एआई-जनित लेबल जोड़ रहा है ताकि लोगों को यह पता चल सके कि यह एक सिंथेटिक वीडियो है। कंपनी ने कहा कि सामग्री सिद्धता और प्रामाणिकता (C2PA) मेटाडेटा के लिए गठबंधन, प्रमुख AI खिलाड़ियों के बीच एक मानक, हर AI- जनरेट किए गए वीडियो में भी जोड़ा जाता है, कंपनी ने कहा।


Continue Reading

AI & Automation

Google ने कहा कि खोज पर ‘AI मोड’ बटन का परीक्षण करें, ‘मैं भाग्यशाली महसूस कर रहा हूं’

Published

on

By

गूगल कहा जाता है कि खोज होम पेज पर “एआई मोड” बटन के प्लेसमेंट का परीक्षण किया जाए। कई नेटिज़ेंस ने पेज पर विभिन्न स्थानों में एक एआई मोड बटन जोड़ा पाया, और इसके बारे में सोशल मीडिया पर पोस्ट किया। इन स्क्रीनशॉट के आधार पर, माउंटेन व्यू-आधारित टेक दिग्गज सुविधा के प्लेसमेंट के साथ प्रयोग कर रहा है जब यह अंततः एक व्यापक उपयोगकर्ता आधार पर रोल करता है। कुछ छवियों में, आर्टिफिशियल इंटेलिजेंस (एआई) मोड बटन भी लंबे समय से “आई एम फीलिंग लकी” बटन को बदलने के लिए पाया जाता है।

क्या Google AI मोड को जोड़ने के लिए “मैं भाग्यशाली महसूस कर रहा हूं” बटन को हटा देगा?

पहला धब्बेदार कगार से, कई एक्स (पूर्व में ट्विटर के रूप में जाना जाता था) उपयोगकर्ताओं ने Google खोज के होम पेज पर एक नया AI मोड बटन देखने के बारे में पोस्ट किया था। कुछ उपयोगकर्ता ध्यान दिया लेंस आइकन के बगल में पाठ फ़ील्ड के भीतर बटन, जबकि अन्य मिला एआई मोड बटन ने “आई एम फीलिंग लकी” बटन को बदल दिया।

अन्य विविधताओं में एक इंद्रधनुष की रूपरेखा शामिल है एआई विधा बटन और एक गोली के आकार का बटन पाठ को हाइलाइट करना। यह संभवतः खोज दिग्गज द्वारा आयोजित एक परीक्षण है जो यह देखने के लिए है कि उपयोगकर्ताओं को नई सुविधा के लिए अनुकूल बनाने के लिए कौन सा प्लेसमेंट सबसे अच्छा काम करता है। हालांकि, यह पुष्टि नहीं की जा सकती थी कि क्या उपयोगकर्ता जो बटन देख रहे थे, वे सभी अमेरिका में या बाहर स्थित थे।

खोज इंजन की स्थापना के बाद से “आई एम एम फील लकी” बटन Google सर्च के होम पेज का हिस्सा रहा है। जब उपयोगकर्ता एक क्वेरी जोड़ते हैं, तो यह उन्हें सीधे शीर्ष खोज परिणाम पर ले जाता है, मानक परिणाम पृष्ठ को दरकिनार कर देता है। जब कोई कीवर्ड नहीं जोड़ा जाता है, तो यह उपयोगकर्ताओं को डूडल्स पेज पर ले जाता है।

इस महीने की शुरुआत में, Google विस्तार अमेरिका के सभी उपयोगकर्ताओं के लिए AI मोड जो Google Labs में फीचर की सदस्यता लेते हैं, वेटलिस्ट प्रक्रिया को हटा देते हैं। हालाँकि, इस सुविधा का विस्तार देश के बाहर के उपयोगकर्ताओं के लिए किया जाना बाकी है। विशेष रूप से, एआई मोड पहले था अनावरण किया मार्च में कंपनी द्वारा एआई ओवरव्यू के अधिक व्यापक संस्करण के रूप में जो जटिल प्रश्नों का उत्तर दे सकता है और विषय में एक गहरे गोता के लिए प्रासंगिक परिणाम दिखा सकता है।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


लाखों आईओएस और एंड्रॉइड डिवाइसों को प्रभावित करने वाली कई कमजोरियों की सर्टिफिकेट चेतावनी


Continue Reading

AI & Automation

Google स्मार्टवॉच, एंड्रॉइड ऑटो और स्मार्ट टीवी के लिए मिथुन एआई का विस्तार कर रहा है

Published

on

By

गूगल मंगलवार को अधिक एंड्रॉइड उपकरणों के लिए मिथुन के विस्तार की घोषणा की। घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, कंपनी का बिल्डअप अगले सप्ताह Google I/O 2025 के लिए। माउंटेन व्यू-आधारित टेक दिग्गज ने कहा कि इसके इन-हाउस आर्टिफिशियल इंटेलिजेंस (एआई) चैटबॉट को स्मार्टवॉच (वियर वियर ओएस), स्मार्ट टीवी (एंड्रॉइड टीवी के माध्यम से), इन-कार इन्फोटेनमेंट सिस्टम (एंड्रॉइड ऑटो के माध्यम से), और यहां तक ​​कि हेडसेट और स्मार्ट ग्लास (एंड्रॉइड एक्सआर के माध्यम से) में सुसज्जित किया जाएगा। कंपनी ने संकेत दिया कि ये सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।

Google अधिक उपकरणों के लिए मिथुन का विस्तार करने की योजना बना रहा है

एक प्रेस विज्ञप्ति में, टेक दिग्गज ने नए उपकरणों को विस्तृत किया है जो आने वाले दिनों में मिथुन क्षमताओं को प्राप्त करेंगे और एआई उनकी प्रयोज्य को कैसे बढ़ा सकते हैं। Google ने कहा कि आने वाले महीनों में, मिथुन पहनने वाले ओएस-संचालित स्मार्टवॉच में एकीकृत किया जाएगा। यह एक AI सहायक के रूप में कार्य करेगा, और उपयोगकर्ता इसे हाथ से मुक्त करने के साथ सक्रिय और बातचीत कर सकते हैं।

Google ने कहा कि उपयोगकर्ता स्मार्टवॉच में मिथुन को सामान्य प्रश्न पूछने, अनुस्मारक और अलार्म सेट करने, ईमेल से जानकारी लेने के लिए (मिथुन के बाद उपयोगकर्ता के ऐप से जुड़े होने के बाद) का लाभ उठा सकते हैं, और बहुत कुछ।

Android Auto और Google In-In के साथ कारें जल्द ही मिथुन का समर्थन करेगी, और उपयोगकर्ता AI के साथ हाथों से मुक्त प्राकृतिक भाषा वार्तालाप कर सकेंगे। Google सहायक के विपरीत, उपयोगकर्ताओं को सही बटन पर टैप करने या सही संकेत कहने के बारे में चिंता नहीं करनी होगी।

कारों में मिथुन सबसे अच्छा मार्ग पा सकता है जबकि उपयोगकर्ताओं की आवश्यकताओं को पूरा किया जाता है। उदाहरण के लिए, एक उपयोगकर्ता मिथुन को पोस्ट ऑफिस के रास्ते में एक पार्क के पास एक चार्जिंग स्टेशन खोजने के लिए कह सकता है, और एआई को विशिष्ट मार्ग मिलेगा ताकि उपयोगकर्ता चार्ज कर सकता है जबकि कार चार्ज कर रही है। इसके अतिरिक्त, मिथुन संदेशों को भी संक्षेप में प्रस्तुत कर सकता है, किसी अन्य भाषा में उत्तरों का अनुवाद कर सकता है, दिन की शीर्ष समाचार खोज सकता है, और बहुत कुछ।

Google इस साल के अंत में Google टीवी चलाने वाले स्मार्ट टीवी पर मिथुन एआई क्षमताओं को भी लाएगा। कंपनी का कहना है कि एकीकरण उपयोगकर्ताओं को सामग्री सुझावों का अधिक सहज रूप से अनुरोध करने की अनुमति देगा। उपयोगकर्ता फिल्म के लिए पूछने और सिफारिशें दिखाने और अनुरूप प्रतिक्रियाएं प्राप्त करने में सक्षम होंगे।

टेक दिग्गज भी साथ साझेदारी कर रहा है SAMSUNG मिथुन को अपने आगामी मिश्रित-वास्तविकता हेडसेट में एकीकृत करने के लिए। मिथुन एंड्रॉइड एक्सआर से लैस होगा, और उपयोगकर्ताओं को उनके प्रश्नों का उत्तर देने और उनकी समस्याओं को हल करने में मदद करेगा, जबकि वे विस्तारित वास्तविकता में खुद को डुबोते हैं।

Continue Reading

AI & Automation

Ai-voiced ऑडियोबुक बनाने के लिए प्रकाशकों के साथ साझेदारी करने के लिए श्रव्य

Published

on

By

Amazon.com का श्रव्य यूएस-आधारित पुस्तक प्रकाशकों के साथ काम कर रहा है ताकि प्रिंट और ई-बुक्स को कृत्रिम बुद्धिमत्ता-आवाज वाले ऑडियोबुक में परिवर्तित किया जा सके, जो विशेष रूप से गैर-अंग्रेजी बोलने वाले बाजारों में अपनी सूची का विस्तार करने में मदद करता है।

“हर पुस्तक ऑडियो में सुनने के योग्य है,” बॉब कारिगन के मुख्य कार्यकारी अधिकारी बॉब कारिगन सुनाई देने योग्यएक साक्षात्कार में कहा। श्रव्य के अनुसार, ऑडियोबुक प्रकाशन में सबसे तेजी से बढ़ते प्रारूप हैं, लेकिन मौजूदा प्रिंट के केवल दो प्रतिशत से पांच प्रतिशत और ई-पुस्तकें ऑडियो रूप में मौजूद है, उन्होंने कहा। “हमारा लक्ष्य उस अंतर को बंद करना है।”

प्रकाशक अंग्रेजी, स्पेनिश, फ्रेंच और इतालवी में 100 से अधिक एआई-जनित आवाज़ों से चुन सकते हैं, जिसमें कई उच्चारण और बोली विकल्प शामिल हैं। शीर्षक या तो विशेष रूप से श्रव्य के लिए, अधिक अनुकूल रॉयल्टी दर के साथ, या इसके मंच के बाहर वितरण के लिए बनाया जा सकता है।

जल्द ही, श्रव्य भी एक अनुवाद सुविधा प्रदान करेगा जो मूल के अलावा पाठ और ऑडियो को कई भाषाओं में बदल सकता है।

“अधिक भाषाओं में अधिक लोगों के लिए अधिक कहानी कहने के लिए एआई का उपयोग करने का अवसर वास्तव में एक रोमांचक है,” कैरिगन ने कहा।

श्रव्य सदस्यता, जिसकी लागत $ 14.95 (लगभग 1,275 रुपये) ऑडियोबुक और पॉडकास्ट के लिए एक महीने में है, एक सर्वकालिक उच्च स्तर पर है, कारिगन ने पिछले साल के अंत में कहा था। यह हाल ही में ब्राजील सहित कुछ नए क्षेत्रों में लॉन्च किया गया है, और नए सब्सक्रिप्शन टियर और रॉयल्टी मॉडल के साथ प्रयोग कर रहा है, इसके खिलाफ बढ़त बनाए हुए है Spotify प्रौद्योगिकी SAजिसने हाल ही में ऑडियोबुक को अपने संगीत-स्ट्रीमिंग और पॉडकास्टिंग ऐप में सुनकर शामिल किया।

कंपनी आम तौर पर प्रकाशकों को AI-voised Audiobooks अपलोड करने की अनुमति नहीं देती है जो तीसरे पक्ष के उपकरणों का उपयोग करके बनाए गए थे, यह सुझाव देते हुए कि उन्हें अपने महत्वपूर्ण दर्शकों में टैप करने के लिए श्रव्य तकनीक के साथ काम करना होगा।

ऑडिबल अमेरिका में स्व-प्रकाशित लेखकों को अपनी ई-बुक्स को ऑडियोबुक में बदलने के लिए इन वर्चुअल आवाज़ों को नियोजित करने दे रहा है। 60,000 से अधिक इस तरह के शीर्षकों को पिछले साल इस समय के आसपास 40,000 से अधिक श्रव्य पर इन आवाज़ों द्वारा सुनाई गई है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

Trending