
डेस्क: टेक दिग्गज माइक्रोसॉफ्ट ने आर्टिफिशियल इंटेलिजेंस की दुनिया में बड़ा कदम उठाते हुए तीन नए AI मॉडल लॉन्च किए हैं. इन मॉडल में MAI-Transcribe-1, MAI-Voice-1 और MAI-Image-2 शामिल हैं. ये मॉडल इमेज बनाने, आवाज जनरेट करने और स्पीच को टेक्स्ट में बदलने जैसे काम बेहद तेजी से कर सकते हैं. कंपनी का दावा है कि ये मॉडल गूगल और ओपनएआई जैसे प्रतिस्पर्धियों से भी बेहतर परफॉर्मेंस देते हैं. खास बात यह है कि इन्हें तेज और किफायती इस्तेमाल के लिए डिजाइन किया गया है.
Microsoft का MAI-Transcribe-1 मॉडल स्पीच को टेक्स्ट में बदलने के लिए डिजाइन किया गया है और कंपनी का दावा है कि यह 25 प्रमुख भाषाओं में बेहद सटीक रिजल्ट देता है. माइक्रोसॉफ्ट के इंटरनल टेस्टिंग के अनुसार, यह FLEURS बेंचमार्क पर Gemini 3.1 फ्लैश और GPT ट्रांसक्राइब जैसे मॉडल्स से भी कम एरर रेट देता है. इसका मतलब है कि यूजर को ज्यादा सटीक और भरोसेमंद ट्रांसक्रिप्शन मिलेगा. कंपनी ने इसे प्राइस और परफॉर्मेंस के मामले में भी बेहतर बताया है, जिससे यह डेवलपर्स और बिजनेस के लिए आकर्षक विकल्प बन सकता है.
MAI-Voice-1 मॉडल को इस तरह डिजाइन किया गया है कि यह नेचुरल और रियलिस्टिक आवाज जनरेट कर सके. Microsoft के अनुसार, इसमें इमोशन, एक्सप्रेशन और वॉइस की स्थिरता को खास तौर पर बेहतर किया गया है. यह मॉडल लंबे कंटेंट में भी एक जैसी आवाज बनाए रख सकता है, जो पहले एक बड़ी चुनौती थी. खास बात यह है कि यूजर सिर्फ कुछ सेकंड की ऑडियो देकर अपनी कस्टम वॉइस बना सकता है. यह टेक्नोलॉजी Copilot Audio Expressions और Copilot Podcasts में भी इस्तेमाल होगी, जिससे कंटेंट क्रिएशन और भी आसान और प्रोफेशनल बन जाएगा.
MAI-Image-2 मॉडल इमेज जनरेशन को एक नए स्तर पर ले जाता है. माइक्रोसॉफ्ट के अनुसार, इसमें बेहतर लाइटिंग, सटीक टेक्सचर और साफ टेक्स्ट के साथ ज्यादा रियलिस्टिक इमेज तैयार की जा सकती हैं. इस मॉडल को फोटोग्राफर्स और डिजाइनर्स के साथ मिलकर तैयार किया गया है, ताकि यह प्रोफेशनल जरूरतों को पूरा कर सके. WPP जैसी बड़ी कंपनी ने इसे अपनाना शुरू भी कर दिया है. यह मॉडल Copilot, Bing और PowerPoint जैसे प्लेटफॉर्म्स में रोलआउट किया जा रहा है, जिससे यूजर्स को सीधे अपने रोजमर्रा के काम में इसका फायदा मिलेगा.
©2026 Agnibaan , All Rights Reserved