AiToolGo का लोगो

ओपन-सोर्स भाषा मॉडल और चीनी LLMs की व्यापक सूची

गहन चर्चा
तकनीकी
 0
 0
 1
यह लेख विभिन्न ओपन-सोर्स भाषा मॉडल का एक व्यापक भंडार है, विशेष रूप से स्वास्थ्य सेवा, वित्त और शिक्षा जैसे कई डोमेन में चीनी मॉडल पर ध्यान केंद्रित करता है। इसमें विस्तृत विवरण, संसाधनों के लिंक और इन मॉडलों के विकास और अनुप्रयोग में अंतर्दृष्टि शामिल है।
  • मुख्य बिंदु
  • अनूठी अंतर्दृष्टि
  • व्यावहारिक अनुप्रयोग
  • प्रमुख विषय
  • प्रमुख अंतर्दृष्टि
  • लर्निंग परिणाम
  • मुख्य बिंदु

    • 1
      विभिन्न ओपन-सोर्स भाषा मॉडल का व्यापक कवरेज, विशेष रूप से चीनी में।
    • 2
      स्वास्थ्य सेवा और वित्त जैसे विशिष्ट डोमेन के लिए तैयार किए गए मॉडलों का विस्तृत विवरण।
    • 3
      आगे की खोज के लिए अतिरिक्त संसाधनों और रिपॉजिटरी के लिंक।
  • अनूठी अंतर्दृष्टि

    • 1
      विशिष्ट क्षेत्रों में प्रदर्शन को बढ़ाने में डोमेन-विशिष्ट मॉडल के महत्व पर प्रकाश डालता है।
    • 2
      इन मॉडलों के विकास में सहयोगात्मक प्रयासों पर चर्चा करता है, सामुदायिक योगदान को प्रदर्शित करता है।
  • व्यावहारिक अनुप्रयोग

    • यह लेख डेवलपर्स और शोधकर्ताओं के लिए मूल्यवान संसाधन प्रदान करता है जो विशिष्ट अनुप्रयोगों, विशेष रूप से चीनी भाषा के संदर्भ में ओपन-सोर्स भाषा मॉडल का लाभ उठाना चाहते हैं।
  • प्रमुख विषय

    • 1
      ओपन-सोर्स भाषा मॉडल
    • 2
      डोमेन-विशिष्ट अनुप्रयोग
    • 3
      चीनी NLP प्रगति
  • प्रमुख अंतर्दृष्टि

    • 1
      विभिन्न ओपन-सोर्स भाषा मॉडल के लिए एक केंद्रीकृत संसाधन।
    • 2
      चीनी भाषा मॉडल और विभिन्न क्षेत्रों में उनके अनुप्रयोगों पर ध्यान केंद्रित।
    • 3
      मॉडल विकास में सामुदायिक भागीदारी को प्रोत्साहित करना।
  • लर्निंग परिणाम

    • 1
      ओपन-सोर्स भाषा मॉडल के परिदृश्य को समझना, विशेष रूप से चीनी में।
    • 2
      स्वास्थ्य सेवा और वित्त जैसे विभिन्न अनुप्रयोगों के लिए उपयुक्त विशिष्ट मॉडलों की पहचान करना।
    • 3
      इन मॉडलों की आगे की खोज और कार्यान्वयन के लिए संसाधनों तक पहुंच।
उदाहरण
ट्यूटोरियल
कोड नमूने
दृश्य
मूल सिद्धांत
उन्नत सामग्री
व्यावहारिक सुझाव
सर्वोत्तम प्रथाएँ

ओपन-सोर्स लैंग्वेज मॉडल पॉकेट का परिचय

ओपन-सोर्स लैंग्वेज मॉडल पॉकेट ओपन-सोर्स भाषा मॉडल की एक क्यूरेटेड सूची है, जिसमें विशेष रूप से चीनी-अनुकूल या मुख्य रूप से चीनी टीमों द्वारा विकसित मॉडल पर जोर दिया गया है। यह संसाधन विभिन्न अनुप्रयोगों और डोमेन को कवर करते हुए, उपलब्ध मॉडलों का एक व्यापक अवलोकन प्रदान करने का लक्ष्य रखता है। यह शोधकर्ताओं, डेवलपर्स और उत्साही लोगों के लिए विभिन्न परियोजनाओं के लिए ओपन-सोर्स भाषा मॉडल का पता लगाने और उपयोग करने के लिए एक मूल्यवान उपकरण के रूप में कार्य करता है। AI और भाषा मॉडल के तेजी से विकसित हो रहे परिदृश्य को दर्शाने के लिए इस पॉकेट गाइड को लगातार अपडेट किया जाता है।

सामान्य उद्देश्य चीनी ओपन-सोर्स भाषा मॉडल

यह अनुभाग सामान्य-उद्देश्य वाले भाषा मॉडल को उजागर करता है जो या तो चीनी-अनुकूल हैं या चीनी टीमों द्वारा विकसित किए गए हैं। ये मॉडल विभिन्न प्रकार के कार्यों को संभालने के लिए डिज़ाइन किए गए हैं और सामान्य अनुप्रयोगों के लिए उपयुक्त हैं। उदाहरणों में Baichuan, Chinese LLaMA & Alpaca, Tongyi Qianwen Qwen, और कई अन्य शामिल हैं। ये मॉडल अक्सर चीनी और अंग्रेजी दोनों भाषाओं का समर्थन करते हैं और व्यापक क्षमताओं को प्राप्त करने के लिए बड़े डेटासेट पर प्रशिक्षित होते हैं। सूची में ChatGLM, Skywork, और Yi-6B/34B जैसे मॉडल भी शामिल हैं, जो चीनी ओपन-सोर्स समुदाय में विविधता और नवाचार को दर्शाते हैं। Qwen1.5 और DeepSeek LLM जैसे मॉडल अत्याधुनिक का प्रतिनिधित्व करते हैं, जो विभिन्न प्राकृतिक भाषा प्रसंस्करण कार्यों के लिए उन्नत प्रदर्शन और क्षमताएं प्रदान करते हैं।

स्वास्थ्य सेवा और चिकित्सा चीनी LLMs

यह अनुभाग विशेष रूप से स्वास्थ्य सेवा और चिकित्सा अनुप्रयोगों के लिए डिज़ाइन किए गए भाषा मॉडल पर केंद्रित है। ये मॉडल चिकित्सा ज्ञान और डेटा पर प्रशिक्षित होते हैं ताकि चिकित्सा डोमेन में सटीक और विश्वसनीय जानकारी प्रदान की जा सके। उदाहरणों में BenCao, HuaTuo, BianQue, और Mingyi (MING) शामिल हैं। ये मॉडल चिकित्सा प्रश्न उत्तर, निदान सहायता और चिकित्सा पाठ निर्माण जैसे कार्य करने में सक्षम हैं। इस अनुभाग में DoctorGLM और ChatMed जैसे मॉडल भी शामिल हैं, जिन्हें विशेष चिकित्सा परामर्श के लिए डिज़ाइन किया गया है। Llama-3-8B-UltraMedical और ProLLM जैसे मॉडलों का समावेश इस महत्वपूर्ण क्षेत्र में चल रही प्रगति को रेखांकित करता है।

वित्त और आर्थिक चीनी LLMs

यह अनुभाग वित्त और आर्थिक अनुप्रयोगों के लिए तैयार किए गए भाषा मॉडल को सूचीबद्ध करता है। ये मॉडल वित्तीय डेटा पर प्रशिक्षित होते हैं और वित्तीय भाषा और अवधारणाओं को समझने और संसाधित करने के लिए डिज़ाइन किए गए हैं। उदाहरणों में PIXIU FinMA, XuanYuan, और FinGLM शामिल हैं। इन मॉडलों का उपयोग वित्तीय विश्लेषण, जोखिम मूल्यांकन और आर्थिक पूर्वानुमान जैसे कार्यों के लिए किया जा सकता है। Deepmoney और Cornucopia-LLaMA-Fin-Chinese जैसे मॉडलों का विकास वित्तीय क्षेत्र में LLMs को लागू करने में बढ़ती रुचि को दर्शाता है।

कानूनी चीनी LLMs

यह अनुभाग कानूनी अनुप्रयोगों के लिए डिज़ाइन किए गए भाषा मॉडल को प्रदर्शित करता है। ये मॉडल कानूनी ग्रंथों पर प्रशिक्षित होते हैं और कानूनी भाषा को समझने और संसाधित करने में सक्षम होते हैं। उदाहरणों में HanFei, Zhihai Luwen, और ChatLaw शामिल हैं। ये मॉडल कानूनी अनुसंधान, अनुबंध विश्लेषण और कानूनी दस्तावेज़ निर्माण जैसे कार्यों में सहायता कर सकते हैं। LaWGPT और Lawyer LLaMA जैसे मॉडलों का समावेश कानूनी क्षेत्र में विशेष LLMs के महत्व को रेखांकित करता है।

शिक्षा और गणित चीनी LLMs

यह अनुभाग शिक्षा और गणित पर केंद्रित भाषा मॉडल को उजागर करता है। ये मॉडल सीखने और समस्या-समाधान में सहायता के लिए शैक्षिक सामग्री और गणितीय डेटा पर प्रशिक्षित होते हैं। उदाहरणों में TaoLi, EduChat, और InternLM-Math शामिल हैं। इन मॉडलों का उपयोग ट्यूशन, होमवर्क सहायता और गणितीय तर्क जैसे कार्यों के लिए किया जा सकता है। DeepSeekMath और Qwen2-Math जैसे मॉडलों का विकास AI-संचालित शैक्षिक उपकरणों की बढ़ती मांग को दर्शाता है।

कोड और प्रोग्रामिंग चीनी LLMs

यह अनुभाग कोड और प्रोग्रामिंग-संबंधित कार्यों के लिए डिज़ाइन किए गए भाषा मॉडल को सूचीबद्ध करता है। ये मॉडल कोड रिपॉजिटरी और प्रोग्रामिंग दस्तावेज़ीकरण पर प्रशिक्षित होते हैं ताकि कोड निर्माण, डिबगिंग और सॉफ्टवेयर विकास में सहायता मिल सके। उदाहरणों में CodeShell, DeepSeek Coder, और Magicoder शामिल हैं। इन मॉडलों का उपयोग कोड पूर्णता, बग पहचान और कोड अनुवाद जैसे कार्यों के लिए किया जा सकता है। CodeQwen1.5 और CodeGemma जैसे मॉडल AI-सहायता प्राप्त कोडिंग में प्रगति को दर्शाते हैं।

अन्य उल्लेखनीय ओपन-सोर्स मॉडल

इस अनुभाग में विभिन्न अन्य ओपन-सोर्स मॉडल शामिल हैं जो उनके विशिष्ट अनुप्रयोगों या अनूठी विशेषताओं के लिए उल्लेखनीय हैं। ये मॉडल परिवहन (TransGPT), स्व-मीडिया (MediaGPT), और प्राचीन चीनी भाषा (Erya) सहित डोमेन की एक विस्तृत श्रृंखला को कवर करते हैं। इस अनुभाग में चीन के बाहर विकसित मॉडल भी शामिल हैं, जैसे Cerebras, MPT-7B, और Dolly 1&2, जो ओपन-सोर्स भाषा मॉडल परिदृश्य का एक व्यापक दृष्टिकोण प्रदान करते हैं। Mistral 7B और Llama 3 जैसे मॉडल इस क्षेत्र में महत्वपूर्ण योगदान का प्रतिनिधित्व करते हैं।

प्रशिक्षण और अनुमान संसाधन

यह अनुभाग भाषा मॉडल के प्रशिक्षण और अनुमान के लिए संसाधन और उपकरण प्रदान करता है। इसमें Alpaca-LoRA, ColossalAI, और DeepSpeed-Chat जैसे फ्रेमवर्क और तकनीकें शामिल हैं। ये संसाधन डेवलपर्स को कुशलतापूर्वक भाषा मॉडल को फाइन-ट्यून और डिप्लॉय करने में मदद करते हैं। यह अनुभाग DPO (Direct Preference Optimization) और QLoRA जैसी विधियों को भी कवर करता है, जिनका उपयोग मॉडल के प्रदर्शन को बेहतर बनाने और कम्प्यूटेशनल लागत को कम करने के लिए किया जाता है। अनुकूलित अनुमान के लिए llama.cpp और vLLM जैसे टूल भी सूचीबद्ध हैं।

मूल्यांकन बेंचमार्क

यह अनुभाग भाषा मॉडल के प्रदर्शन का आकलन करने के लिए उपयोग किए जाने वाले मूल्यांकन बेंचमार्क को सूचीबद्ध करता है। ये बेंचमार्क विभिन्न कार्यों पर मॉडल का मूल्यांकन करने के लिए मानकीकृत मेट्रिक्स प्रदान करते हैं। उदाहरणों में FlagEval, C-Eval, और HaluEval शामिल हैं। ये बेंचमार्क शोधकर्ताओं और डेवलपर्स को विभिन्न मॉडलों की तुलना करने और क्षेत्र में प्रगति को ट्रैक करने में मदद करते हैं। इस अनुभाग में CMB (Comprehensive Medical Benchmark in Chinese) और Fin-Eva जैसे बेंचमार्क भी शामिल हैं, जिन्हें विशिष्ट डोमेन के लिए डिज़ाइन किया गया है।

 मूल लिंक: https://github.com/createmomo/Open-Source-Language-Model-Pocket

टिप्पणी(0)

user's avatar

      समान लर्निंग

      संबंधित टूल्स