Model Type |
| |||||||||||||||||||||||||||||||||||||
Use Cases |
| |||||||||||||||||||||||||||||||||||||
Additional Notes |
| |||||||||||||||||||||||||||||||||||||
Supported Languages |
| |||||||||||||||||||||||||||||||||||||
Training Details |
| |||||||||||||||||||||||||||||||||||||
Input Output |
| |||||||||||||||||||||||||||||||||||||
Release Notes |
|
LLM Name | Llama2 13B Chinese Chat |
Repository 🤗 | https://huggingface.co/shareAI/llama2-13b-Chinese-chat |
Model Size | 13b |
Required VRAM | 0 GB |
Updated | 2025-08-16 |
Maintainer | shareAI |
Model Files | |
Supported Languages | zh |
Model Architecture | AutoModel |
Is Biased | none |
Tokenizer Class | LlamaTokenizer |
Beginning of Sentence Token | <s> |
End of Sentence Token | </s> |
Unk Token | <unk> |
PEFT Type | LORA |
LoRA Model | Yes |
PEFT Target Modules | gate_proj|q_proj|up_proj|k_proj|o_proj|v_proj|down_proj |
LoRA Alpha | 16 |
LoRA Dropout | 0.05 |
R Param | 64 |
Best Alternatives |
Context / RAM |
Downloads |
Likes |
---|---|---|---|
...p 13B DPO Lora Hh Rlhf Ja V1.1 | 0K / 0.8 GB | 0 | 1 |
Nous Hermes Llama2 Llamafile | 0K / GB | 259 | 2 |
BimoGPT Llama2 13B | 0K / 0.6 GB | 0 | 7 |
PhysicsLlama 13B | 0K / 0 GB | 0 | 1 |
...fast Codellama 13B Instruct Hf | 0K / 13 GB | 1 | 1 |
...lama 2 13B Alpaca Spanish LoRA | 0K / 1.7 GB | 0 | 2 |
Medalpaca Lora 13B 8bit | 0K / 0.1 GB | 0 | 1 |
MythoMax L2 13B GGUF | 0K / 5.4 GB | 124181 | 173 |
Llama 3 13B Instruct V0.1 GGUF | 0K / 5.1 GB | 1224 | 5 |
Hermes 2 Pro Llama 3 13B GGUF | 0K / 4.6 GB | 51 | 0 |
🆘 Have you tried this model? Rate its performance. This feedback would greatly assist ML community in identifying the most suitable model for their needs. Your contribution really does make a difference! 🌟