1 जून 2026 रोजी लाँच केलेले MiniMax M3 AI मॉडेल, कृत्रिम बुद्धिमत्ता लँडस्केपमध्ये भूकंपीय बदल दर्शवते. हा सखोल संशोधन अहवाल OpenAI च्या GPT-5.5 आणि Google च्या Gemini 3.1 Pro सारख्या बंद-स्रोत टायटन्सला आव्हान देण्यासाठी डिझाइन केलेल्या मॉडेलचे आर्किटेक्चरल प्रगती, अनुभवजन्य बेंचमार्क आणि व्यापक उद्योग परिणामांचे खंडित करतो.
MiniMax ने M3 हे त्याचे फ्लॅगशिप आर्टिफिशियल इंटेलिजन्स मॉडेल म्हणून सादर केले, विशेषत: स्वायत्त कोडिंग एजंट्स आणि स्वयंचलित एंटरप्राइझ वर्कफ्लोमध्ये विस्ताराला लक्ष्य केले. ही घोषणा कंपनीसाठी अत्यंत धोरणात्मक टप्प्यावर आली आहे: MiniMax ने अधिकृतपणे शांघायच्या टेक-हेवी STAR मार्केटवर इनिशियल पब्लिक ऑफरिंग (IPO) साठी तयारी सुरू केल्यानंतर, हाँगकाँगमध्ये नियोजित दुहेरी सूचीसह हे पहिले मोठे उत्पादन आहे.
M3 चे मार्केट पोझिशनिंग आश्चर्यकारकपणे आक्रमक आहे. ओपन-वेट रिलीझ प्लॅन अंतर्गत मोठ्या संदर्भ विंडोसह फ्रंटियर-लेव्हल कोडिंग कार्यप्रदर्शन आणि मूळ मल्टीमोडॅलिटी एकत्र करून, MiniMax थेट सिलिकॉन व्हॅलीच्या बंद AI लॅबच्या प्रबळ आर्थिक मॉडेलला आव्हान देत आहे.
M3 मॉडेलचे आर्किटेक्चरल हायलाइट म्हणजे MiniMax Sparse Attention (MSA). पारंपारिक ट्रान्सफॉर्मर मॉडेल “पूर्ण लक्ष” वापरतात, जेथे प्रत्येक टोकन (शब्द किंवा पिक्सेल तुकडा) इतर प्रत्येक टोकनशी तुलना केली जाते. हे चतुर्भुज कंप्यूट एक्स्प्लोजन ($O(N^2)$) बनवते जे मोठ्या कॉन्टेक्स्ट विंडोला झपाट्याने महाग आणि हळू बनवते.
MSA की-व्हॅल्यू (KV) ब्लॉक निवड वापरून प्री-फिल्टरिंग स्टेज सादर करून गणितीय प्रतिमान बदलते. संपूर्ण क्रम स्कॅन करण्याऐवजी, प्रत्येक टोकन केवळ अत्यंत संबंधित, निवडलेल्या उपसंचासाठी उपस्थित असतो.
या आर्किटेक्चरल बदलामुळे आश्चर्यकारक कार्यक्षमता नफा मिळतो, विशेषत: मॉडेलच्या कमाल क्षमतेवर:
टेक क्षेत्रातील तरंगांना कारणीभूत असणारा मथळा दावा म्हणजे M3 ची SWE-Bench Pro वरील कामगिरी, एक बेंचमार्क चाचणी रिअल-वर्ल्ड, लाँग-हॉरिझन सॉफ्टवेअर अभियांत्रिकी समस्या. या मूल्यमापनांमध्ये, M3 ने OpenAI च्या GPT-5.5 आणि Google च्या Gemini 3.1 Pro ला मागे टाकत 59.0% गुण मिळवले. M3 ने SWE-Bench Pro वर विजयाचा दावा केला आहे आणि टर्मिनल-बेंच 2.1 (एजंटिक कमांड-लाइन टास्क) वर 66.0% ने जोरदार मजल मारली आहे, तर ते सर्व बुद्धिमत्ता श्रेणींमध्ये क्लीन स्वीप दर्शवत नाही:
मागील मॉडेल्सच्या विपरीत जे मजकूर आणि व्हिजन सिस्टमला प्रशिक्षणानंतर एकत्र करतात, M3 मूळतः मल्टीमोडल आहे. यात “चरण 0” वरून मजकूर, प्रतिमा आणि व्हिडिओवर इंटरलीव्ह प्रशिक्षण घेण्यात आले, त्याच अर्थपूर्ण जागेत वेगवेगळ्या डेटा पद्धतींचे सखोलपणे विलीनीकरण.
हे मूळ संगणक वापरण्यास सक्षम करते, AI ला भौतिक डेस्कटॉपशी संवाद साधण्याची परवानगी देते. तैनाती चाचण्यांमध्ये, M3 ने स्थानिक ERP क्लायंट ऍप्लिकेशन उघडले आणि बॅच इनव्हॉइस नोंदी स्वायत्तपणे हाताळल्या.
शिवाय, MiniMax ने M3 चे एजंटिक स्टॅमिना दोन ताण चाचण्यांद्वारे प्रदर्शित केले:
MiniMax ने लाँचला अत्यंत विस्कळीत किंमत मॉडेलसह जोडले आहे. मानक दरांवर, M3 API $0.60 प्रति दशलक्ष इनपुट टोकन आणि $2.40 प्रति दशलक्ष आउटपुट टोकन सूचीबद्ध आहे. 1 जून लाँच करण्यासाठी, MiniMax ने पहिल्या आठवड्यात ($0.30 इनपुट / $1.20 आउटपुट) यामध्ये 50% ने घट केली.
यामुळे GPT-5.5 किंवा क्लॉड ओपस सारख्या बंद सीमावर्ती दिग्गजांना चालवण्याची किंमत अंदाजे 1/15 व्या ते 1/25 व्या वर M3 ठेवते. महत्त्वाची गोष्ट म्हणजे, MiniMax लाँच झाल्यापासून 10 दिवसांच्या आत HuggingFace आणि GitHub वर ओपन वेट्स रिलीझ करण्यासाठी वचनबद्ध आहे, ज्यामुळे एंटरप्राइझ संघांना त्यांच्या खाजगी पायाभूत सुविधांवर संपूर्णपणे फ्रंटियर-क्लास कोडिंग मॉडेल होस्ट करण्याचा एक व्यवहार्य मार्ग मिळेल.