एक नवीन कंपनी, खोल कोगीटोउघडपणे उपलब्ध एआय मॉडेल्सच्या कुटूंबासह स्टील्थमधून उदयास आले आहे जे “तर्क” आणि नॉन-रेझनिंग मोडमध्ये बदलले जाऊ शकते.
ओपनईच्या ओ 1 सारख्या युक्तिवादाच्या मॉडेल्सने गणित आणि भौतिकशास्त्र यासारख्या डोमेनमध्ये उत्कृष्ट वचन दिले आहे, चरण-चरण चरण-चरणात जटिल समस्यांद्वारे कार्य करून स्वत: ला प्रभावीपणे तपासणी करण्याच्या त्यांच्या क्षमतेबद्दल धन्यवाद. हे तर्क एका किंमतीवर येते, तथापि: उच्च संगणन आणि विलंब. म्हणूनच मानववंश सारख्या लॅब “हायब्रीड” मॉडेल आर्किटेक्चरचा पाठपुरावा करीत आहेत जे मानक, नॉन-रेझनिंग घटकांसह तर्क घटक एकत्रित करतात. अधिक आव्हानात्मक प्रश्नांचा विचार करून अतिरिक्त वेळ घालवताना हायब्रीड मॉडेल्स द्रुतपणे सोप्या प्रश्नांची उत्तरे देऊ शकतात.
कोगीटो 1 म्हणतात, खोल कोगीटोची सर्व मॉडेल्स हायब्रीड मॉडेल आहेत. कोगीटो असा दावा करतात की ते मेटा आणि चिनी एआय स्टार्टअप दीपसीकच्या मॉडेल्ससह समान आकाराच्या सर्वोत्कृष्ट ओपन मॉडेल्सला मागे टाकतात.
“प्रत्येक मॉडेल उत्तर देण्यापूर्वी थेट (…) किंवा स्वत: ची प्रतिबिंबित करू शकते (तर्क मॉडेल्स सारखे),” ब्लॉग पोस्टमध्ये स्पष्ट केले? “(सर्व) अंदाजे 75 दिवसांत एका लहान संघाने विकसित केले होते.”
कोगीटो 1 मॉडेल 3 अब्ज पॅरामीटर्स ते 70 अब्ज पॅरामीटर्स पर्यंत आहेत आणि कोगीटो म्हणतात की येत्या आठवड्यात आणि महिन्यांत 671 अब्ज पॅरामीटर्समधील मॉडेल्स त्यांच्यात सामील होतील. पॅरामीटर्स अंदाजे मॉडेलच्या समस्येचे निराकरण करण्याच्या कौशल्यांशी संबंधित आहेत, अधिक पॅरामीटर्स सामान्यत: चांगले असतात.
कोगीटो 1 स्क्रॅचपासून विकसित केले गेले नाही, स्पष्ट करण्यासाठी. स्वत: ची निर्मिती करण्यासाठी मेटाच्या ओपन लामा आणि अलिबाबाच्या क्वेन मॉडेलच्या शीर्षस्थानी डीप कोगीटो. कंपनीचे म्हणणे आहे की बेस मॉडेल्सच्या कामगिरीला चालना देण्यासाठी आणि टॉगल करण्यायोग्य तर्क सक्षम करण्यासाठी कादंबरी प्रशिक्षण पध्दती लागू केली.
कोगीटोच्या अंतर्गत बेंचमार्किंगच्या निकालांनुसार, सर्वात मोठे कोगीटो 1 मॉडेल, कोगीटो 70 बी, काही गणित आणि भाषेच्या मूल्यांकनांवर डीपसीकच्या आर 1 युक्तिवादाचे मॉडेल आहे. कोगीटो 70 बी युक्तिवाद अक्षम केलेल्या मेटाने नुकत्याच प्रसिद्ध झालेल्या लामा 4 स्काऊट मॉडेलला लाइव्हबेंचवरील सर्वसाधारणपणे एआय चाचणी घेतली.
प्रत्येक कोगीटो 1 मॉडेल क्लाउड प्रदात्यांवरील फटाके एआय आणि एकत्र एआय वर एपीआयद्वारे डाउनलोड किंवा वापरण्यासाठी उपलब्ध आहे.
“सध्या, आम्ही अद्याप (आमच्या) स्केलिंग वक्रच्या सुरुवातीच्या टप्प्यात आहोत, पारंपारिक मोठ्या भाषा मॉडेल पोस्ट/सतत प्रशिक्षणासाठी राखीव मोजलेल्या संगणनाचा फक्त एक अंश वापरला आहे,” कोगीटो यांनी आपल्या ब्लॉग पोस्टमध्ये लिहिले. “पुढे जाणे, आम्ही स्वत: ची सुधारणा करण्यासाठी पूरक प्रशिक्षणानंतरच्या पध्दतींचा शोध घेत आहोत.”
कॅलिफोर्निया स्टेटसह फाइलिंगनुसारसॅन फ्रान्सिस्को-आधारित दीप कोगीटोची स्थापना जून 2024 मध्ये झाली. कंपनीची लिंक्डइन पृष्ठ ड्रिशन अरोरा आणि ध्रुव मल्होत्रा या दोन सह-संस्थापकांची यादी आहे. मल्होत्रा यापूर्वी Google एआय लॅब डीपमिंड येथे उत्पादन व्यवस्थापक होते, जिथे त्याने जनरेटिव्ह सर्च तंत्रज्ञानावर काम केले. अरोरा गूगलवर वरिष्ठ सॉफ्टवेअर अभियंता होता.
डीप कोगीटो, ज्यांच्या पाठीराख्यांमध्ये दक्षिण पार्क कॉमन्सचा समावेश आहे, पिचबुकनुसारमहत्वाकांक्षीपणे “सामान्य सुपरइंटेलिजेंस” तयार करण्याचे उद्दीष्ट आहे. कंपनीच्या संस्थापकांना एआय म्हणजे हा वाक्यांश समजतो जो बहुतेक मानवांपेक्षा अधिक चांगली कामे करू शकतो आणि “आम्ही अद्याप कल्पना करू शकणार नाही अशा संपूर्ण नवीन क्षमतांचा उलगडा करू शकतो.”