Connect with us

AI & Automation

Ai-voiced ऑडियोबुक बनाने के लिए प्रकाशकों के साथ साझेदारी करने के लिए श्रव्य

Published

on

Amazon.com का श्रव्य यूएस-आधारित पुस्तक प्रकाशकों के साथ काम कर रहा है ताकि प्रिंट और ई-बुक्स को कृत्रिम बुद्धिमत्ता-आवाज वाले ऑडियोबुक में परिवर्तित किया जा सके, जो विशेष रूप से गैर-अंग्रेजी बोलने वाले बाजारों में अपनी सूची का विस्तार करने में मदद करता है।

“हर पुस्तक ऑडियो में सुनने के योग्य है,” बॉब कारिगन के मुख्य कार्यकारी अधिकारी बॉब कारिगन सुनाई देने योग्यएक साक्षात्कार में कहा। श्रव्य के अनुसार, ऑडियोबुक प्रकाशन में सबसे तेजी से बढ़ते प्रारूप हैं, लेकिन मौजूदा प्रिंट के केवल दो प्रतिशत से पांच प्रतिशत और ई-पुस्तकें ऑडियो रूप में मौजूद है, उन्होंने कहा। “हमारा लक्ष्य उस अंतर को बंद करना है।”

प्रकाशक अंग्रेजी, स्पेनिश, फ्रेंच और इतालवी में 100 से अधिक एआई-जनित आवाज़ों से चुन सकते हैं, जिसमें कई उच्चारण और बोली विकल्प शामिल हैं। शीर्षक या तो विशेष रूप से श्रव्य के लिए, अधिक अनुकूल रॉयल्टी दर के साथ, या इसके मंच के बाहर वितरण के लिए बनाया जा सकता है।

जल्द ही, श्रव्य भी एक अनुवाद सुविधा प्रदान करेगा जो मूल के अलावा पाठ और ऑडियो को कई भाषाओं में बदल सकता है।

“अधिक भाषाओं में अधिक लोगों के लिए अधिक कहानी कहने के लिए एआई का उपयोग करने का अवसर वास्तव में एक रोमांचक है,” कैरिगन ने कहा।

श्रव्य सदस्यता, जिसकी लागत $ 14.95 (लगभग 1,275 रुपये) ऑडियोबुक और पॉडकास्ट के लिए एक महीने में है, एक सर्वकालिक उच्च स्तर पर है, कारिगन ने पिछले साल के अंत में कहा था। यह हाल ही में ब्राजील सहित कुछ नए क्षेत्रों में लॉन्च किया गया है, और नए सब्सक्रिप्शन टियर और रॉयल्टी मॉडल के साथ प्रयोग कर रहा है, इसके खिलाफ बढ़त बनाए हुए है Spotify प्रौद्योगिकी SAजिसने हाल ही में ऑडियोबुक को अपने संगीत-स्ट्रीमिंग और पॉडकास्टिंग ऐप में सुनकर शामिल किया।

कंपनी आम तौर पर प्रकाशकों को AI-voised Audiobooks अपलोड करने की अनुमति नहीं देती है जो तीसरे पक्ष के उपकरणों का उपयोग करके बनाए गए थे, यह सुझाव देते हुए कि उन्हें अपने महत्वपूर्ण दर्शकों में टैप करने के लिए श्रव्य तकनीक के साथ काम करना होगा।

ऑडिबल अमेरिका में स्व-प्रकाशित लेखकों को अपनी ई-बुक्स को ऑडियोबुक में बदलने के लिए इन वर्चुअल आवाज़ों को नियोजित करने दे रहा है। 60,000 से अधिक इस तरह के शीर्षकों को पिछले साल इस समय के आसपास 40,000 से अधिक श्रव्य पर इन आवाज़ों द्वारा सुनाई गई है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading
Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

AI & Automation

Google स्मार्टवॉच, एंड्रॉइड ऑटो और स्मार्ट टीवी के लिए मिथुन एआई का विस्तार कर रहा है

Published

on

By

गूगल मंगलवार को अधिक एंड्रॉइड उपकरणों के लिए मिथुन के विस्तार की घोषणा की। घोषणा एंड्रॉइड शो का हिस्सा थी: I/O संस्करण, कंपनी का बिल्डअप अगले सप्ताह Google I/O 2025 के लिए। माउंटेन व्यू-आधारित टेक दिग्गज ने कहा कि इसके इन-हाउस आर्टिफिशियल इंटेलिजेंस (एआई) चैटबॉट को स्मार्टवॉच (वियर वियर ओएस), स्मार्ट टीवी (एंड्रॉइड टीवी के माध्यम से), इन-कार इन्फोटेनमेंट सिस्टम (एंड्रॉइड ऑटो के माध्यम से), और यहां तक ​​कि हेडसेट और स्मार्ट ग्लास (एंड्रॉइड एक्सआर के माध्यम से) में सुसज्जित किया जाएगा। कंपनी ने संकेत दिया कि ये सुविधाएँ सभी उपयोगकर्ताओं के लिए उपलब्ध होंगी।

Google अधिक उपकरणों के लिए मिथुन का विस्तार करने की योजना बना रहा है

एक प्रेस विज्ञप्ति में, टेक दिग्गज ने नए उपकरणों को विस्तृत किया है जो आने वाले दिनों में मिथुन क्षमताओं को प्राप्त करेंगे और एआई उनकी प्रयोज्य को कैसे बढ़ा सकते हैं। Google ने कहा कि आने वाले महीनों में, मिथुन पहनने वाले ओएस-संचालित स्मार्टवॉच में एकीकृत किया जाएगा। यह एक AI सहायक के रूप में कार्य करेगा, और उपयोगकर्ता इसे हाथ से मुक्त करने के साथ सक्रिय और बातचीत कर सकते हैं।

Google ने कहा कि उपयोगकर्ता स्मार्टवॉच में मिथुन को सामान्य प्रश्न पूछने, अनुस्मारक और अलार्म सेट करने, ईमेल से जानकारी लेने के लिए (मिथुन के बाद उपयोगकर्ता के ऐप से जुड़े होने के बाद) का लाभ उठा सकते हैं, और बहुत कुछ।

Android Auto और Google In-In के साथ कारें जल्द ही मिथुन का समर्थन करेगी, और उपयोगकर्ता AI के साथ हाथों से मुक्त प्राकृतिक भाषा वार्तालाप कर सकेंगे। Google सहायक के विपरीत, उपयोगकर्ताओं को सही बटन पर टैप करने या सही संकेत कहने के बारे में चिंता नहीं करनी होगी।

कारों में मिथुन सबसे अच्छा मार्ग पा सकता है जबकि उपयोगकर्ताओं की आवश्यकताओं को पूरा किया जाता है। उदाहरण के लिए, एक उपयोगकर्ता मिथुन को पोस्ट ऑफिस के रास्ते में एक पार्क के पास एक चार्जिंग स्टेशन खोजने के लिए कह सकता है, और एआई को विशिष्ट मार्ग मिलेगा ताकि उपयोगकर्ता चार्ज कर सकता है जबकि कार चार्ज कर रही है। इसके अतिरिक्त, मिथुन संदेशों को भी संक्षेप में प्रस्तुत कर सकता है, किसी अन्य भाषा में उत्तरों का अनुवाद कर सकता है, दिन की शीर्ष समाचार खोज सकता है, और बहुत कुछ।

Google इस साल के अंत में Google टीवी चलाने वाले स्मार्ट टीवी पर मिथुन एआई क्षमताओं को भी लाएगा। कंपनी का कहना है कि एकीकरण उपयोगकर्ताओं को सामग्री सुझावों का अधिक सहज रूप से अनुरोध करने की अनुमति देगा। उपयोगकर्ता फिल्म के लिए पूछने और सिफारिशें दिखाने और अनुरूप प्रतिक्रियाएं प्राप्त करने में सक्षम होंगे।

टेक दिग्गज भी साथ साझेदारी कर रहा है SAMSUNG मिथुन को अपने आगामी मिश्रित-वास्तविकता हेडसेट में एकीकृत करने के लिए। मिथुन एंड्रॉइड एक्सआर से लैस होगा, और उपयोगकर्ताओं को उनके प्रश्नों का उत्तर देने और उनकी समस्याओं को हल करने में मदद करेगा, जबकि वे विस्तारित वास्तविकता में खुद को डुबोते हैं।

Continue Reading

AI & Automation

सैमसंग कथित तौर पर एआई-संचालित के लिए ‘सुनो’ फ़ंक्शन विकसित कर रहा है जो अब एक UI 8 में संक्षिप्त है

Published

on

By

Android 15- आधारित एक UI 7 के सफल रोलआउट के बाद, SAMSUNG कहा जाता है कि पहले से ही अगले पुनरावृत्ति को विकसित किया जा रहा है, एक यूआई 8 डब किया गया है। एक रिपोर्ट के अनुसार, कंपनी गैलेक्सी एआई-संचालित नाउ संक्षिप्त सुविधा के लिए अतिरिक्त कार्यक्षमता पेश करेगी। ऐसी ही एक सुविधा से उपयोगकर्ताओं को अपने दैनिक संक्षिप्त का ऑडियो संस्करण मिलेगा। इस तरह की सुविधा को फोन की स्क्रीन पर नज़र रखने और संक्षेप संक्षिप्त संक्षिप्त पढ़ने की आवश्यकता को खत्म करने के लिए कहा जाता है।

एक UI 8 में संक्षिप्त सुनें

एंड्रॉइड प्राधिकारी रिपोर्टों “ब्रीफ ब्रीफ” डब किए गए फीचर के उस सबूत को लीक में खोदने के बाद खोजा गया था एक ui 8 फर्मवेयर। यह कहा जाता है कि उपयोगकर्ताओं को खेलने/रोकने, या ऑडियो को एक समर्पित टॉगल के माध्यम से रोकने के लिए एक विकल्प लाने के लिए, इस कार्यक्षमता को संदर्भित करने वाले फर्मवेयर में कोड के स्निपेट के साथ। वे भी चुनने में सक्षम हो सकते हैं गूगल और सैमसंग के अपने टेक्स्ट-टू-स्पीच इंजन जो संक्षिप्त के ऑडियो संस्करण को वितरित करेंगे।

एक UI 7 के साथ पेश किया गया गैलेक्सी S25 श्रृंखला, अब संक्षिप्त रूप से सैमसंग के गैलेक्सी एआई सुइट को स्वास्थ्य और कल्याण मेट्रिक्स, इवेंट रिमाइंडर, ट्रैवल अपडेट, ट्रैफ़िक की स्थिति और समाचार, सुबह, दोपहर या शाम सहित सुझाई गई सामग्री के साथ एक व्यक्तिगत ब्रीफिंग देने के लिए। यह इस जानकारी को कार्ड-स्टाइल इंटरफ़ेस में प्रस्तुत करता है। जब एक गैलेक्सी वॉच या गैलेक्सी रिंग के साथ जोड़ा जाता है, तो अब संक्षिप्त स्वास्थ्य और गतिविधि मैट्रिक्स भी प्रदर्शित कर सकता है।

सुविधा अनिवार्य रूप से उपयोगकर्ता के डिवाइस उपयोग और दिन भर में गतिविधियों के साक्षात्कार प्रदान करती है।

हालांकि, चूंकि एक यूआई 8 के शुरुआती निर्माण के कोड में देरी करने के बाद सुविधा की खोज की गई थी, इसलिए इसकी सार्वजनिक रिलीज अपुष्ट है। जबकि सैमसंग और ओईएम ओएस के बीटा संस्करणों में कई विशेषताओं का परीक्षण करते हैं, उनमें से सभी इसे सार्वजनिक रिलीज के लिए नहीं बनाते हैं। इस प्रकार, खबर को एक चुटकी नमक के साथ लिया जाना चाहिए।

संक्षिप्त सुनने के अलावा, सैमसंग भी है कहा अब बार के लिए नई सुविधाओं पर काम करने के लिए – लॉक स्क्रीन पर अब संक्षिप्त सुविधा का एक विस्तार। पिछली रिपोर्टों से संकेत मिलता है कि इसे अतिरिक्त कार्यक्षमता जैसे कि फोन कॉल और डो डिस्टर्ब विकल्प नहीं मिल सकते हैं।

Continue Reading

AI & Automation

सम्मान 400 श्रृंखला एक एआई-संचालित इमेज-टू-वीडियो जनरेटर की सुविधा के लिए, कथित तौर पर Google द्वारा संचालित है

Published

on

By

सम्मान 400 श्रृंखला 22 मई को वैश्विक स्तर पर लॉन्च की जाने वाली है। लॉन्च से पहले, चीनी उपभोक्ता टेक ब्रांड ने आगामी स्मार्टफोन श्रृंखला की एक नई आर्टिफिशियल इंटेलिजेंस (एआई) सुविधा को छेड़ा है। इसे एक नया एआई-संचालित इमेज-टू-वीडियो टूल मिलेगा जो एक स्थिर छवि को चेतन कर सकता है। जबकि नई सुविधा के बारे में बहुत कुछ नहीं जाना जाता है, रिपोर्ट्स का दावा है कि यह एक ही छवि के साथ पांच-सेकंड-लंबे वीडियो तक उत्पन्न कर सकता है। यह AI सुविधा Google द्वारा संचालित कहा जाता है।

सम्मान 400 श्रृंखला एक एआई वीडियो जनरेटर ला सकती है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ऑनर के आधिकारिक वैश्विक खाते ने ऑनर 400 सीरीज़ स्मार्टफोन के लिए एक नया “एआई इमेज टू वीडियो” फीचर को छेड़ा। यह AI टूल पूरी श्रृंखला के लिए उपलब्ध होगा। एआई टूल का वर्णन करते हुए, हुआवेई उप-ब्रांड ने कहा कि यह “आसानी से आपकी छवियों को लुभावना वीडियो में बदल सकता है।”

पोस्ट ने एआई टूल की क्षमता को दिखाते हुए फीचर का एक वीडियो भी साझा किया। ऑनर ने इस समय इस सुविधा के बारे में बहुत कुछ नहीं बताया। हालांकि, एक हुआवेई सेंट्रल के अनुसार प्रतिवेदनएआई इमेज-टू-वीडियो फीचर द्वारा संचालित किया जाएगा Google’s वीओ 2 मॉडल, जो इस साल की शुरुआत में जारी किया गया था।

अनिवार्य रूप से यह एक लाइव फोटो सुविधा है जो एक वीडियो को चेतन कर सकती है, लेकिन यह रचनात्मक वीडियो उत्पन्न करने के लिए उस छवि को एक संदर्भ के रूप में वास्तव में उपयोग नहीं करता है। रिपोर्ट के अनुसार, उपकरण एकल स्थिर छवि से पांच-सेकंड-लंबे वीडियो उत्पन्न करेगा।

इसके अतिरिक्त, प्रकाशन ने उजागर किया कि टूल पोर्ट्रेट और लैंडस्केप दोनों छवियों से वीडियो उत्पन्न कर सकता है, और आउटपुट उत्पन्न करने में कुछ मिनट लगते हैं। टूल को कथित तौर पर फोन गैलरी ऐप से एक्सेस किया जा सकता है। हालांकि, एक नकारात्मक पक्ष यह है कि एआई को यह बताने के लिए टेक्स्ट प्रॉम्प्ट जोड़ने का कोई विकल्प नहीं है कि उपयोगकर्ता क्या चाहता है कि वीडियो को दिखे।

छवि-टू-वीडियो टूल कथित तौर पर पहले दो महीनों के लिए मुफ्त में 400 स्मार्टफोन उपयोगकर्ताओं को सम्मानित करने के लिए उपलब्ध होगा। इस अवधि के दौरान, उपयोगकर्ताओं को प्रति दिन 10 वीडियो पीढ़ियों को प्राप्त करने के लिए कहा जाता है। उसके बाद, वीडियो उत्पन्न करने के लिए सदस्यता की आवश्यकता होती है। जबकि विवरण स्पष्ट नहीं हैं, सुविधा को Google एक AI प्रीमियम सदस्यता की आवश्यकता हो सकती है।

Continue Reading

AI & Automation

मेटा एआई एकीकरण के साथ रे-बैन मेटा ग्लासेस भारत में लॉन्च किया गया: मूल्य, विनिर्देश

Published

on

By

रे-बैन मेटा चश्मा सोमवार को भारत में लॉन्च किया गया। Essilorluxottica के सहयोग से विकसित, स्मार्ट चश्मा 12-मेगापिक्सल अल्ट्रा-वाइड कैमरा, ओपन-ईयर स्पीकर और माइक्रोफोन से लैस है, जो उपयोगकर्ताओं को स्नैपशॉट/वीडियो पर कब्जा करने में सक्षम बनाते हैं, संगीत सुनते हैं, और बातचीत करते हैं-सभी चलते हैं। के एकीकरण के साथ मेटा एआईकंपनी की आर्टिफिशियल इंटेलिजेंस (एआई) सहायक, उपयोगकर्ता हाथों से मुक्त संगीत पहचान, लाइव अनुवाद कर सकते हैं, और आवाज-आधारित संकेतों के माध्यम से अपने परिवेश के बारे में प्रतिक्रियाएं ले सकते हैं।

भारत में रे-बैन मेटा चश्मा की कीमत रुपये से शुरू होती है। चमकदार ब्लैक कोलोरवे में स्काईलर और वेफ़र डिजाइन के लिए 29,900। वे रुपये की कीमत वाले वेफ़र मैट ब्लैक विकल्प में भी उपलब्ध हैं। 32,100। इस बीच, स्काईलर चाक ग्रे और वेफर मैट ब्लैक डिज़ाइन्स की कीमत रु। 35,700।

स्मार्ट चश्मा आज प्री-ऑर्डर किया जा सकता है और उनकी बिक्री 19 मई से शुरू होगी रे-बैन.कॉम और पूरे भारत में प्रमुख ऑप्टिकल और सनग्लास स्टोर।

रे-बैन मेटा ग्लास एक 12-मेगापिक्सेल कैमरे से लैस और फ्रेम के दोनों ओर दो गोलाकार आकार के कटआउट के भीतर एक एलईडी लाइट से लैस है। वीडियो रिकॉर्डिंग लाइव होने पर एलईडी लाइट एक रिकॉर्डिंग संकेतक के रूप में भी दोगुनी हो जाती है। कैमरे का उपयोग करते हुए, स्मार्ट चश्मा 3,024 x 4,032 पिक्सेल रिज़ॉल्यूशन पर फोटो खींच सकता है और 60 सेकंड तक 1080p वीडियो रिकॉर्ड कर सकता है, जिसे तब फेसबुक और इंस्टाग्राम जैसे मेटा ऐप्स में साझा किया जा सकता है। वैकल्पिक रूप से, उपयोगकर्ता मेटा व्यू ऐप का लाभ उठा सकते हैं ताकि उन्हें अन्य प्लेटफार्मों पर भी साझा किया जा सके।रे बैन मेटा स्मार्ट ग्लास रिव्यू 3

कैमरे और पांच-एमआईसी सिस्टम का लाभ उठाते हुए, यह उपयोगकर्ताओं को पहले व्यक्ति के परिप्रेक्ष्य में लाइवस्ट्रीम करने की अनुमति देता है फेसबुक और Instagramजो कुछ भी वे वास्तविक समय में चश्मे के साथ देख रहे हैं, उसे दिखाते हैं। वे क्वालकॉम के स्नैपड्रैगन एआर 1 जेन 1 प्लेटफॉर्म एसओसी द्वारा संचालित हैं और इनबिल्ट स्टोरेज के 32 जीबी को पैक करते हैं। मेटा के अनुसार, स्मार्ट चश्मा एक ही चार्ज पर चार घंटे की बैटरी जीवन की पेशकश करते हैं, और चार्जिंग केस के साथ अतिरिक्त 32 घंटे। वे एक IPX4 रेटिंग के साथ आते हैं।

एआई सुविधाएँ

कंपनी के मालिकाना मेटा एआई सहायक का लाभ उठाते हुए, रे-बैन मेटा ग्लास एआई पर भारी बैंक। उपयोगकर्ता विभिन्न हाथों से मुक्त कार्यों को टॉगल करने के लिए एक सरल “हे मेटा एआई” वॉयस प्रॉम्प्ट कह सकते हैं।

उदाहरण के लिए, उपयोगकर्ता पूछ सकते हैं, “हे मेटा, यह गीत क्या है?” और रे-बैन मेटा ग्लास शाज़म का उपयोग करके गीत की पहचान करेंगे। इस सुविधा को उन स्थितियों में काम में आने के लिए कहा जाता है जब एक महान ट्रैक खेल रहा होता है, जैसे कि स्टोर या कैफे में, उपयोगकर्ताओं को ट्रैक या कलाकार का नाम जानने में मदद करता है और याद नहीं करता है। इस बीच, यह अंग्रेजी और या तो स्पेनिश, फ्रेंच, या इतालवी भाषाओं के बीच एक साधारण “हे मेटा, स्टार्ट लाइव ट्रांसलेशन” कमांड के बीच वास्तविक समय भाषण अनुवाद क्षमताएं भी प्रदान करता है। अनुवादित ऑडियो ओपन-ईयर स्पीकर के माध्यम से खेला जाता है, जबकि इसका एक ट्रांसक्रिप्शन प्राप्त करने का विकल्प भी है।

मेटा अपने स्मार्ट ग्लास को एक लाइव एआई सुविधा से भी सुसज्जित किया है जो इसे 12-मेगापिक्सल कैमरे का उपयोग करके वास्तविक समय में वीडियो फ़ीड की निगरानी करने की अनुमति देता है। उपयोगकर्ता “हे मेटा” कमांड के बिना मेटा एआई को आमंत्रित कर सकते हैं, अपने परिवेश के बारे में प्रश्न पूछ सकते हैं, और यहां तक ​​कि अनुवर्ती प्रश्न भी पूछ सकते हैं। एक अन्य सुविधा आपके चश्मे पर ऐप से डीएमएस, फ़ोटो, ऑडियो कॉल और वीडियो कॉल भेजने और प्राप्त करने की क्षमता है। आप बस कह सकते हैं, “हे मेटा, इंस्टाग्राम पर लिसा को एक संदेश भेजें”, और स्मार्ट चश्मा कंपनी के अनुसार, इंस्टाग्राम पर एक डीएम भेजेगा।

रे-बैन मेटा चश्मा उपयोगकर्ता स्मार्ट चश्मे पर संगीत की तरह संगीत खेल सकते हैं जैसे कि ऐप्स के माध्यम से Spotifyअमेज़ॅन संगीत, और ऐप्पल म्यूजिक। यह एक गीत, प्लेलिस्ट, एल्बम, स्टेशन, या यहां तक ​​कि कलाकार को खेलने के लिए पहनने योग्य आवाज-से-खोज कार्यक्षमता का लाभ उठाता है। आप उन पटरियों के बारे में भी पूछ सकते हैं जो आप सुन रहे हैं।

Continue Reading

AI & Automation

पूर्ति केंद्रों के लिए अमेज़ॅन के नए वल्कन रोबोट में ‘स्पर्श की भावना’ है

Published

on

By

वीरांगना पिछले हफ्ते एक नया गोदाम-केंद्रित रोबोट पेश किया, जो ध्यान से वस्तुओं की एक विस्तृत श्रृंखला में हेरफेर कर सकता है। डब्ड वल्कन, रोबोट के नए वर्ग में फोर्स फीडबैक सेंसर हैं जो इसे किसी ऑब्जेक्ट को चुनते समय या कार्ट को धक्का देते समय लागू होने वाले बल की मात्रा को समझने की अनुमति देते हैं। इन रोबोटों का उपयोग वैश्विक स्तर पर टेक दिग्गज के पूर्ति केंद्रों में किया जाएगा और मानव श्रमिकों की सहायता के लिए डिज़ाइन किया गया है। अमेज़ॅन ने कहा कि इन रोबोटों ने गोदामों में मानव नौकरियों की सैकड़ों नई श्रेणियां बनाई हैं।

अमेज़ॅन के वल्कन रोबोट मानव निपुणता के करीब आते हैं

एक न्यूज़ रूम में डाकसिएटल स्थित टेक दिग्गज ने वल्कन को पेश किया और अपनी क्षमताओं पर प्रकाश डाला। नए रोबोट अमेज़ॅन के पूर्ति केंद्रों को स्वचालित करने में एक महत्वपूर्ण समस्या को हल करते हैं – रोबोट सुन्न और गूंगा हैं। “अतीत में, जब औद्योगिक रोबोटों का अप्रत्याशित संपर्क होता है, तो वे या तो उस संपर्क के माध्यम से आपातकालीन रोकते हैं या स्मैश करते हैं। वे अक्सर यह भी नहीं जानते हैं कि उन्होंने कुछ मारा है क्योंकि वे इसे समझ नहीं सकते हैं,” आरोन पेरेंस, निदेशक, एप्लाइड साइंस, अमेज़ॅन ने कहा।

कंपनी ने इस बात पर प्रकाश डाला कि वल्कन, जो रोबोटिक्स, इंजीनियरिंग और फिजिकल एआई में अग्रिमों का उपयोग करके बनाया गया है, समर्पित बल फीडबैक सेंसर के साथ आता है। इसका हाथ एक कैमरे और एक सक्शन कप के साथ भी लगाया गया है। संपूर्ण असेंबली सेंसर-आधारित ऑब्जेक्ट डिटेक्शन के साथ-साथ कंप्यूटर विजन दोनों का उपयोग करती है ताकि वह लागू हो सके।

वल्कन रोबोट अमेज़न अमेज़ॅन वल्कन रोबोट

वल्कन रोबोट के शासक के आकार का हाथ कैमरा और सक्शन कप के साथ

अपने पूर्ति केंद्रों में अमेज़ॅन की इन्वेंट्री स्टोरेज शिपिंग और स्टोइंग को आसान बनाने के लिए एक विशिष्ट व्यवस्था का अनुसरण करती है। इन्वेंटरी को कपड़े से ढके हुए फली में संग्रहीत किया जाता है जो डिब्बों में विभाजित होते हैं। प्रत्येक डिब्बे में 10 अलग -अलग आइटम हैं। अधिकांश रोबोट वस्तुओं के इस मिश्रण से वस्तुओं को चुनने के लिए संघर्ष करते हैं, लेकिन वल्कन को भीड़ भरे स्थान के माध्यम से नेविगेट करने में सक्षम होने के लिए कहा जाता है कि वे आवश्यक वस्तु को ध्यान से चुनें।

अमेज़ॅन ने कहा कि वल्कन अपने पूर्ति केंद्रों पर कंपनी के सभी आइटमों के लगभग 75 प्रतिशत सामानों को चुन सकते हैं और अपने फ्रंट-लाइन कर्मचारियों की तुलना में गति के साथ, अमेज़ॅन ने कहा। वर्तमान में, वल्कन रोबोटों को स्पोकेन, वाशिंगटन और हैम्बर्ग, जर्मनी में उनके पूर्ति केंद्रों में परीक्षण किया जा रहा है।

अमेज़ॅन ने कहा कि वर्तमान में, इसने 7,50,000 से अधिक रोबोट को अपने पूर्ति केंद्रों में तैनात किया है। कंपनी को यह भी ध्यान देने की जल्दी थी कि इस बड़ी संख्या में रोबोटों ने नौकरियों की नई श्रेणियां भी बनाई हैं, जैसे कि रोबोटिक्स फ्लोर मॉनिटर और ऑन-साइट विश्वसनीयता रखरखाव इंजीनियर। टेक दिग्गज अपने मानव श्रमिकों को रोबोटिक्स में जाने और एक ऐसे उद्योग में एक जगह खोजने के लिए प्रशिक्षण कार्यक्रम भी दे रहा है जो जल्दी से स्वचालन मार्ग ले रहा है।

Continue Reading

AI & Automation

Microsoft रचनात्मक परियोजनाओं के लिए एक सहयोगी स्थान की पेशकश करने के लिए, सभी उपयोगकर्ताओं को कोपिलॉट पेज का विस्तार करता है

Published

on

By

माइक्रोसॉफ्ट विश्व स्तर पर सभी उपयोगकर्ताओं के लिए कोपिलॉट पृष्ठों का विस्तार कर रहा है। पिछले हफ्ते घोषित, नया आर्टिफिशियल इंटेलिजेंस स्पेस एक मल्टीप्लेयर सहयोगी स्थान है जहां चैटबॉट और इंसान सामग्री और दस्तावेजों को संपादित करने और बनाने के लिए एक साथ काम कर सकते हैं। कॉपिलॉट पेजों को पहली बार सितंबर 2024 में एंटरप्राइजेज के लिए Microsoft 365 Copilot के हिस्से के रूप में पेश किया गया था। रेडमंड-आधारित टेक दिग्गज अब विश्व स्तर पर प्लेटफ़ॉर्म के सभी हस्ताक्षरित उपयोगकर्ताओं के लिए इसका विस्तार कर रहा है। यह दोनों मोबाइल ऐप्स के साथ -साथ डेस्कटॉप पर भी उपलब्ध है।

Microsoft पृष्ठ अब सभी उपयोगकर्ताओं के लिए उपलब्ध हैं

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), माइक्रोसॉफ्ट कोपिलॉट के आधिकारिक हैंडल ने चैटबॉट के लिए नई सुविधा की घोषणा की। पृष्ठ कोई नई सुविधा नहीं है। Openai और Google दोनों ने एक फीचर डब किए गए कैनवास को रोल आउट किया है जो पृष्ठों के समान ही काम करता है। हालांकि, कुछ सूक्ष्म अंतर हैं।

गैजेट 360 स्टाफ सदस्य कोपिलॉट पेज तक पहुंचने में सक्षम थे। CHATGPT या GEMINI के विपरीत, जहां उपयोगकर्ता प्रॉम्प्ट भेजने से पहले ही कैनवास का चयन कर सकते हैं, कोपिलॉट पेजों को उपयोगकर्ताओं को पहले एक प्रॉम्प्ट लिखने और एक प्रतिक्रिया प्राप्त करने की आवश्यकता होती है, और फिर सहयोगी स्थान को सक्रिय करें। पृष्ठ अपने प्रतिद्वंद्वियों की तुलना में एक बड़ी विविधता के स्वरूपण विकल्प प्रदान करते हैं, और आपको इंडेंट बढ़ाने, पाठ का रंग बदलने और एक बंधुआ हेडलाइन या कॉलआउट जोड़ने के लिए विकल्प मिलेंगे।

कोपिलॉट पेज कोपिलॉट पेज

कोपिलॉट पेज
फोटो क्रेडिट: Microsoft

पृष्ठ भी नेत्रहीन रूप से बेहतर दिख रहे हैं, और विभिन्न विकल्पों को खोजना आसान है। हालांकि, इस समृद्ध इंटरफ़ेस के कारण, पेज कैनवास की तुलना में लोड करने के लिए भी धीमे हैं चटपट और मिथुन। कई अवसरों पर, हमें एक पृष्ठ खोलने के लिए 30 सेकंड से ऊपर इंतजार करना पड़ा (यह एक पृष्ठ से दूसरे पृष्ठ पर नेविगेट करते समय अधिक लगातार था)।

कोपिलॉट पेज भी एक तालिका, एक चेकलिस्ट या बुलेट पॉइंट जोड़ने के विकल्प के साथ आते हैं। चूंकि यह एक सहयोगी स्थान है, इसलिए उपयोगकर्ता एक वाक्य, एक पैराग्राफ, या यहां तक ​​कि एक शब्द को उजागर कर सकता है और चैटबॉट को इसे परिष्कृत करने के लिए कह सकता है। उपयोगकर्ता पूछ सकते हैं सह पायलट पाठ को विस्तृत करने के लिए, इसे छोटा करें, इसके स्वर को बदलें, इसे समझने के लिए सरल करें, और इसी तरह। इसी तरह, उपयोगकर्ता अन्य उपयोगकर्ताओं के साथ पृष्ठ भी साझा कर सकते हैं और परियोजनाओं पर उनके साथ सहयोग कर सकते हैं।

Continue Reading

AI & Automation

TrueCaller सत्यापित व्यवसायों से संदेशों को फ़िल्टर करने के लिए AI- संचालित संदेश आईडी का परिचय देता है

Published

on

By

Truecaller सोमवार को एक नई सुविधा जारी की, जिसका उद्देश्य उपयोगकर्ताओं को स्पैम ग्रंथों से भरे एक इनबॉक्स में प्रामाणिक संदेशों को फ़िल्टर करने में सहायता करना है। डब किए गए संदेश आईडी, यह कृत्रिम बुद्धिमत्ता का लाभ उठाता है () एसएमएस इनबॉक्स को स्कैन करने के लिए और जैसे संदेशों की पहचान करें, लेकिन सत्यापित व्यवसायों से, ओटीपी, डिलीवरी अपडेट, टिकट बुकिंग की स्थिति, और बहुत कुछ तक सीमित नहीं हैं। TrueCaller के अनुसार, इन संदेशों को इनबॉक्स में हरे रंग की चेक मार्क के साथ प्रदर्शित किया जाता है।

TrueCaller पर संदेश आईडी

Truecaller का कहना है कि उसने भारत और 30 अन्य देशों में संदेश आईडी पेश की है। यह सुविधा एआई और बड़ी भाषा मॉडल का लाभ उठाती है (लल्म्स) महत्वपूर्ण व्यावसायिक संदेशों की पहचान करने के लिए एसएमएस इनबॉक्स के ऑन-डिवाइस स्कैनिंग को पूरा करने के लिए। कंपनी इस बात पर जोर देती है कि ऑन-डिवाइस प्रोसेसिंग के कारण उपयोगकर्ता डेटा सुरक्षित रहता है।

TrueCaller पर संदेश ID प्रीमियम ग्राहकों तक सीमित नहीं है, लेकिन सभी के लिए उपलब्ध है। इसे अंग्रेजी, हिंदी, स्वाहिली और स्पेनिश सहित कई वैश्विक और भारतीय भाषाओं के समर्थन के साथ पेश किया गया है।

कंपनी के अनुसार, इसे महत्वपूर्ण अलर्ट की वास्तविक समय सूचनाएं प्रदान करने के लिए “पढ़ें एसएमएस” और “अन्य ऐप्स पर प्रदर्शन” अनुमतियों की आवश्यकता होती है। घोटाले या स्पूफेड लोगों से कानूनी संदेशों को अलग करने के लिए, TrueCaller ने ग्रीन संदेश आईडी पेश की है। ये यह पुष्टि करने के लिए एक चेक मार्क के साथ दिखाई देते हैं कि प्राप्त संदेश एक वैध और सत्यापित व्यवसाय से है। इसमें बैंक अलर्ट, ओटीपी, डिलीवरी अपडेट, फ्लाइट इटिनरी और भुगतान अनुस्मारक के संदेश शामिल हैं।

उपरोक्त के अलावा, TrueCaller अन्य महत्वपूर्ण संदेशों का भी पता लगा सकता है और उजागर कर सकता है, भले ही वे पारंपरिक एसएमएस श्रेणी के बाहर आते हैं। संदेश आईडी भी एआई का लाभ उठाने वाले संदेशों में प्रमुख विवरणों को संक्षेप में प्रस्तुत करते हैं और जो महत्वपूर्ण है उसे उजागर करते हैं, जिससे उपयोगकर्ता त्वरित कार्रवाई करने में सक्षम होता है। यह मूल पाठ के ऊपर दिखाई देता है और “एआई उत्पन्न सारांश” टैग को वहन करता है।

TrueCaller पर AI- संचालित संदेश आईडी की शुरूआत हाल ही में बनाई गई है जोड़ना के लिए एपीआई समर्थन iPhone यह वास्तविक समय के कॉलर पहचान और Apple उपकरणों पर स्पैम टेलीफोन कॉल के स्वचालित अवरोध जैसी सुविधाओं को सक्षम करता है। यह अपने एंड्रॉइड समकक्ष के साथ ऐप के iOS संस्करण को बराबर लाता है, जिसने अब वर्षों से उपरोक्त सुविधाओं की पेशकश की है।

Continue Reading

AI & Automation

CHATGPT की गहरी शोध सुविधा अब GitHub रिपॉजिटरी के साथ जुड़ सकती है

Published

on

By

चटपट एक नई सुविधा मिल रही है जो उपयोगकर्ताओं को अपने GitHub रिपॉजिटरी को Chatbot के साथ जोड़ने में सक्षम करेगा। पिछले सप्ताह घोषित, नई सुविधा डीप रिसर्च एजेंट का हिस्सा है। Openai ने कहा कि नई सुविधा आर्टिफिशियल इंटेलिजेंस (AI) चैटबॉट को उपयोगकर्ता और अन्य लोगों के रिपॉजिटरी के आधार पर व्यापक रिपोर्ट तैयार करने की अनुमति देगी। वर्तमान में, सैन फ्रांसिस्को स्थित एआई फर्म प्लेटफ़ॉर्म के केवल भुगतान किए गए ग्राहकों के लिए सुविधा को रोल कर रही है। विशेष रूप से, एक नए बनाए गए या संपादित रिपॉजिटरी को डीप रिसर्च गिथब कनेक्टर में दिखाना शुरू होने से पहले पांच मिनट तक का समय लग सकता है।

GitHub कनेक्टर अब CHATGPT में गहरे शोध का हिस्सा है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), ओपनईई डेवलपर्स के आधिकारिक हैंडल ने नई सुविधा के रोलआउट की घोषणा की। GitHub के साथ CHATGPT का गहरा शोध टीम उपयोगकर्ताओं के लिए विश्व स्तर पर उपलब्ध है। ईईए, स्विट्जरलैंड और यूके में उन लोगों को छोड़कर सभी प्लस और प्रो सब्सक्राइबर्स को भी सुविधा मिलेगी।

खाते ने फीचर का एक वीडियो डेमो भी साझा किया। उसके आधार पर, पात्र उपयोगकर्ताओं को पहले गहन अनुसंधान को एक क्वेरी से पूछना होगा। तब वे एक नया देखेंगे GitHub कनेक्शन बटन, टैपिंग जो चैटबॉट को उपयोगकर्ता के साथ-साथ किसी भी अन्य तृतीय-पक्ष सार्वजनिक रिपॉजिटरी तक पहुंच प्रदान करेगा।

“एक प्रश्न पूछें और डीप रिसर्च एजेंट रेपो के सोर्स कोड और पीआर को पढ़ेगा और खोजेगा, उद्धरणों के साथ एक विस्तृत रिपोर्ट लौटाएगा,” ओपनई ने कहा।

अपने समर्थन पृष्ठों में, एआई फर्म ने इस बात पर प्रकाश डाला कि यह फीचर वर्तमान में बीटा में है, और गिथब के नियम और शर्तें लागू होंगी। जब डीप रिसर्च GitHub से जुड़ता है, तो यह CHATGPT को रिपॉजिटरी से लाइव डेटा खींचने देता है, जिसमें कोड, README फाइलें और अन्य दस्तावेज शामिल हैं। CHATBOT सामग्री के बारे में अंतर्दृष्टि प्रदान करने के लिए डेटा का विश्लेषण भी कर सकता है।

विशेष रूप से, ओपनई इस बात पर प्रकाश डाला गया है कि यदि CHATGPT PLUS और PRO उपयोगकर्ताओं ने “हर किसी के लिए मॉडल को बेहतर बनाए रखा है” तो कंपनी ने अपने मॉडल को प्रशिक्षित करने के लिए GitHub डेटा का उपयोग किया है। हालाँकि, यदि सेटिंग बंद हो जाती है, तो डेटा संग्रहीत नहीं किया जाएगा। एआई फर्म ने कहा कि वह टीम, एंटरप्राइज, ईडीयू और इसके एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) सहित अपने व्यावसायिक प्रसादों से डेटा संग्रहीत नहीं करता है।


Continue Reading

AI & Automation

शोधकर्ता लेगोगप्ट एआई मॉडल का अनावरण करते हैं जो लेगो संरचनाओं के शारीरिक रूप से स्थिर डिजाइन का निर्माण कर सकते हैं

Published

on

By

Legogpt, एक नया कृत्रिम होशियारी (एआई) मॉडल जो तीन-आयामी (3 डी) लेगो संरचना डिजाइन उत्पन्न कर सकता है, हाल ही में शोधकर्ताओं द्वारा अनावरण किया गया था। नया एआई मॉडल यह निर्धारित करने के लिए एक ओपन-सोर्स प्रोजेक्ट है कि क्या एआई मॉडल संरचनाएं उत्पन्न कर सकते हैं जो वास्तविक दुनिया के भौतिकी के अनुरूप हैं और लगातार स्थिर हैं। शोधकर्ताओं ने इस बात का विवरण साझा किया है कि मॉडल कैसे बनाया गया था, साथ ही डेटासेट को सार्वजनिक डोमेन में उपलब्ध कराया है। संरचनाओं की स्थिरता की पुष्टि करने के लिए एआई-जनित लेगो संरचनाओं का भी मनुष्यों और रोबोट द्वारा परीक्षण किया गया था।

Legogpt AI मॉडल को llama-3.2-instruct पर बनाया गया था

में एक डाककार्नेगी मेलन विश्वविद्यालय के शोधकर्ताओं ने लेगोट एआई मॉडल को विस्तृत किया। बड़ी भाषा मॉडल (एलएलएम) एक पाठ प्रॉम्प्ट से लेगो संरचना उत्पन्न कर सकता है, यह सुनिश्चित करता है कि यह शारीरिक रूप से स्थिर और निर्माण योग्य है। ओपन-सोर्स मॉडल उपलब्ध है डाउनलोड करना और एक अनुमेय MIT लाइसेंस के साथ GitHub पर उपयोग करें।

उपयोगकर्ता मॉडल को “स्ट्रीमलाइन लम्बी पोत” या “आर्मरेस्ट के साथ बैकलेस बेंच” डिजाइन करने के लिए संकेत दे सकते हैं, और यह एक ऐसा डिज़ाइन उत्पन्न कर सकता है जो न केवल विवरण से मेल खाता है, बल्कि संरचना को ढहने के बिना भी सीधा रखा जा सकता है।

यह दो घटकों के कारण संभव है जो लेगोगप्ट बनाते हैं – बेस एआई मॉडल और एक स्थिरता विश्लेषण प्रणाली। बेस मॉडल के लिए, शोधकर्ताओं ने एक बिलियन मापदंडों के साथ LLAMA-3.2-Instruct के एक ठीक-ठीक संस्करण का उपयोग किया। यह एक गणितीय अनुकूलन सॉल्वर, गुरोबी के साथ जोड़ा गया था, जो प्रत्येक उत्पन्न संरचना के लिए स्थिरता विश्लेषण चलाता है।

परिष्कृत वास्तुकला के निर्माण के साथ, शोधकर्ताओं ने लेगो संरचनाओं पर मॉडल को प्रशिक्षित करने के लिए एक डेटासेट भी बनाया। डब किए गए StableText2Lego, यह एक डेटासेट है जिसमें 28,000 से अधिक अद्वितीय 3 डी ऑब्जेक्ट्स की 47,000 से अधिक लेगो संरचनाएं हैं। प्रत्येक संरचना विस्तृत कैप्शन, डिज़ाइन कोड और मॉडल के साथ होती है।

यह सत्यापित करने के लिए कि उत्पन्न संरचनाएं वास्तव में स्थिर हैं, शोधकर्ताओं ने उन्हें एक दोहरी रोबोट विधानसभा के साथ भी परीक्षण किया। विधानसभा को डिजाइन को फिर से बनाने और परीक्षण करने का काम सौंपा गया था कि क्या वे सीधा खड़े हो सकते हैं। कुछ डिजाइनों को भी मनुष्यों द्वारा स्थिरता पर प्रभाव देखने के लिए फिर से बनाया गया था यदि कम dextrous हाथ शामिल थे। शोध पत्र का दावा है कि सभी संरचनाओं के 99.8 प्रतिशत ने स्थिरता परीक्षण पारित किया।

नवीनतम के लिए तकनीकी समाचार और समीक्षागैजेट्स 360 पर फॉलो करें एक्स, फेसबुक, WhatsApp, धागे और Google समाचार। गैजेट्स और टेक पर नवीनतम वीडियो के लिए, हमारी सदस्यता लें YouTube चैनल। यदि आप शीर्ष प्रभावकों के बारे में सब कुछ जानना चाहते हैं, तो हमारे इन-हाउस का अनुसरण करें कौन है पर Instagram और YouTube


Moto G86 पावर 5G डिज़ाइन, रंग विकल्प, प्रमुख विनिर्देशों की सतह ऑनलाइन



Virtua फाइटर 5 REVO ने PS5, Xbox Series S/X और Nintendo स्विच 2 के लिए घोषणा की


Continue Reading

AI & Automation

Openai नए फंडिंग, फ्यूचर IPO के लिए Microsoft के साथ बातचीत करता है: रिपोर्ट

Published

on

By

Openai और Microsoft एक वार्ता में अपने मल्टीबिलियन-डॉलर की साझेदारी की शर्तों को फिर से लिख रहे हैं, जो कि CHATGPT निर्माता को भविष्य के IPO को लॉन्च करने की अनुमति देने के लिए डिज़ाइन की गई है, जबकि सॉफ्टवेयर दिग्गज की अत्याधुनिक एआई मॉडल तक पहुंच की रक्षा करते हुए, फाइनेंशियल टाइम्स ने रविवार को बताया।

एक महत्वपूर्ण मुद्दा यह है कि इक्विटी कितनी इक्विटी में है ओपनई का नए लाभ का व्यवसाय माइक्रोसॉफ्ट रिपोर्ट में कहा गया है कि 13 बिलियन डॉलर से अधिक (लगभग 1,10,089 करोड़ रुपये) से अधिक के बदले में यह कंपनी में निवेश किया है। इसने कहा कि Microsoft 2030 कटऑफ से परे विकसित नई तकनीक तक पहुंच के बदले अपनी कुछ इक्विटी हिस्सेदारी को छोड़ने की पेशकश कर रहा है।

रिपोर्ट में कहा गया है कि वे एक व्यापक अनुबंध की शर्तों को भी संशोधित कर रहे हैं, जब Microsoft ने शुरू में 2019 में Openai में $ 1 बिलियन (लगभग 8,468 करोड़ रुपये) का निवेश किया था।

Microsoft ने रिपोर्ट पर टिप्पणी करने से इनकार कर दिया। Openai ने टिप्पणी के लिए रायटर के अनुरोधों का तुरंत जवाब नहीं दिया।

Openai ने निवेशकों को बताया है कि यह अपने सबसे बड़े बैकर के साथ राजस्व का एक छोटा सा अंश साझा करेगा क्योंकि यह पुनर्गठन के साथ आगे बढ़ता है, पिछले सप्ताह की जानकारी दी गई थी।

जनवरी में, Microsoft ने Oracle और जापान के सॉफ्टबैंक समूह के साथ एक संयुक्त उद्यम में प्रवेश करने के बाद Openai के साथ एक सौदे की कुछ शर्तों को बदल दिया, जो अमेरिका में नए AI डेटा केंद्रों के $ 500 बिलियन (लगभग 42,31,440 करोड़ रुपये) तक का निर्माण करता है।

© 2025 ब्लूमबर्ग एलपी

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)

Continue Reading

Trending