What are the hardware requirements for Translategemma Tok?

Translategemma Tok requires approximately 0.2 GB of VRAM. Quantized variants may run on less VRAM; see the Quantized Models section on this page.

Who developed Translategemma Tok and how large is it?

Translategemma Tok is developed by zhoucantd, a model with 4b parameters. The model is published as open weights on Hugging Face and indexed on LLM Explorer with full benchmark history.

Where can I download or evaluate Translategemma Tok?

Translategemma Tok is hosted on Hugging Face and linked from this page. LLM Explorer also lists quantized variants and similar alternatives if available.

Translategemma Tok by zhoucantd — VRAM 0.2GB

Name: Translategemma Tok
Author: zhoucantd

Translategemma Tok is an open-source language model by zhoucantd. Features: 4b LLM, VRAM: 0.2GB, LLM Explorer Score: 0.24.

Arxiv:1910.09700 Base model:adapter:google/tran... Base model:google/translategem... Conversational Llama-factory Lora Peft Region:us Safetensors

Model Card on HF 🤗: https://huggingface.co/zhoucantd/translategemma-tok

Translategemma Tok Benchmarks

LLME Score: 0.24259

^nn.n% — How the model compares to the reference models: Anthropic Sonnet 3.5 ("so35"), GPT-4o ("gpt4o") or GPT-4 ("gpt4").

What is the LLM Explorer Rank (Score)

Translategemma Tok (zhoucantd/translategemma-tok)

🌟 Advertise your project 🚀

Translategemma Tok Parameters and Internals

LLM Name	Translategemma Tok
Repository 🤗	https://huggingface.co/zhoucantd/translategemma-tok
Base Model(s)	google/translategemma-4b-it google/translategemma-4b-it
Model Size	4b
Required VRAM	0.2 GB
Updated	2026-05-09
Maintainer	zhoucantd
Model Files	0.2 GB 0.0 GB
Model Architecture	AutoModel
Is Biased	none
Tokenizer Class	GemmaTokenizer
Padding Token	<pad>
PEFT Type	LORA
LoRA Model	Yes
PEFT Target Modules	29.self_attn.k_proj\|down_proj\|30.self_attn.v_proj\|27.self_attn.k_proj\|language_model.layers.14.self_attn.v_proj\|language_model.layers.24.self_attn.k_proj\|language_model.layers.7.self_attn.k_proj\|language_model.layers.22.self_attn.k_proj\|language_model.layers.14.self_attn.q_proj\|28.self_attn.v_proj\|30.self_attn.k_proj\|31.self_attn.v_proj\|language_model.layers.3.self_attn.k_proj\|32.self_attn.v_proj\|28.self_attn.k_proj\|language_model.layers.1.self_attn.v_proj\|29.self_attn.v_proj\|language_model.layers.26.self_attn.q_proj\|language_model.layers.10.self_attn.q_proj\|29.self_attn.q_proj\|language_model.layers.24.self_attn.v_proj\|language_model.layers.16.self_attn.k_proj\|language_model.layers.15.self_attn.k_proj\|language_model.layers.6.self_attn.q_proj\|28.self_attn.q_proj\|language_model.layers.12.self_attn.q_proj\|language_model.layers.25.self_attn.q_proj\|30.self_attn.q_proj\|language_model.layers.17.self_attn.v_proj\|language_model.layers.25.self_attn.v_proj\|language_model.layers.19.self_attn.v_proj\|language_model.layers.4.self_attn.k_proj\|27.self_attn.q_proj\|language_model.layers.3.self_attn.q_proj\|language_model.layers.1.self_attn.q_proj\|language_model.layers.23.self_attn.v_proj\|33.self_attn.k_proj\|language_model.layers.19.self_attn.q_proj\|language_model.layers.5.self_attn.q_proj\|language_model.layers.0.self_attn.k_proj\|language_model.layers.26.self_attn.k_proj\|27.self_attn.v_proj\|language_model.layers.13.self_attn.k_proj\|language_model.layers.11.self_attn.k_proj\|language_model.layers.24.self_attn.q_proj\|language_model.layers.20.self_attn.k_proj\|32.self_attn.k_proj\|31.self_attn.k_proj\|language_model.layers.12.self_attn.v_proj\|language_model.layers.9.self_attn.k_proj\|gate_proj\|language_model.layers.12.self_attn.k_proj\|language_model.layers.2.self_attn.q_proj\|language_model.layers.6.self_attn.v_proj\|language_model.layers.23.self_attn.k_proj\|language_model.layers.21.self_attn.k_proj\|language_model.layers.15.self_attn.q_proj\|language_model.layers.7.self_attn.v_proj\|language_model.layers.15.self_attn.v_proj\|language_model.layers.20.self_attn.v_proj\|language_model.layers.9.self_attn.v_proj\|language_model.layers.0.self_attn.q_proj\|language_model.layers.2.self_attn.k_proj\|language_model.layers.0.self_attn.v_proj\|33.self_attn.v_proj\|language_model.layers.18.self_attn.q_proj\|language_model.layers.21.self_attn.q_proj\|language_model.layers.13.self_attn.q_proj\|language_model.layers.10.self_attn.k_proj\|33.self_attn.q_proj\|language_model.layers.1.self_attn.k_proj\|language_model.layers.20.self_attn.q_proj\|language_model.layers.16.self_attn.q_proj\|language_model.layers.18.self_attn.k_proj\|language_model.layers.21.self_attn.v_proj\|language_model.layers.3.self_attn.v_proj\|language_model.layers.13.self_attn.v_proj\|language_model.layers.17.self_attn.q_proj\|language_model.layers.7.self_attn.q_proj\|language_model.layers.10.self_attn.v_proj\|language_model.layers.23.self_attn.q_proj\|language_model.layers.9.self_attn.q_proj\|language_model.layers.18.self_attn.v_proj\|o_proj\|language_model.layers.8.self_attn.q_proj\|language_model.layers.14.self_attn.k_proj\|language_model.layers.2.self_attn.v_proj\|language_model.layers.8.self_attn.v_proj\|language_model.layers.22.self_attn.q_proj\|32.self_attn.q_proj\|language_model.layers.19.self_attn.k_proj\|31.self_attn.q_proj\|language_model.layers.6.self_attn.k_proj\|language_model.layers.4.self_attn.q_proj\|language_model.layers.17.self_attn.k_proj\|language_model.layers.22.self_attn.v_proj\|language_model.layers.11.self_attn.v_proj\|language_model.layers.5.self_attn.v_proj\|language_model.layers.25.self_attn.k_proj\|up_proj\|language_model.layers.16.self_attn.v_proj\|language_model.layers.4.self_attn.v_proj\|language_model.layers.5.self_attn.k_proj\|language_model.layers.11.self_attn.q_proj\|language_model.layers.26.self_attn.v_proj\|language_model.layers.8.self_attn.k_proj
LoRA Alpha	64
LoRA Dropout	0
R Param	32

Best Alternatives to Translategemma Tok

Best Alternatives	Context / RAM	Downloads	Likes
... 3n 4B It Distill Smollm2 360M	0K / 0 GB	55	0
Qwen3 4B Chunky	0K / 0.3 GB	19	0
Gemma3 Konkani	0K / 0 GB	119	5
Gemma3 Konkani 4B	0K / 0 GB	119	5
AYA Mistral7B Instruct TR 4B	0K / 0.3 GB	0	6
...istill Haiku Sftv4 Nofilter V1	0K / 0.5 GB	15	0
II Search 4B GGUF	0K / 1.7 GB	790	5
...upyter Agent Qwen3 4B AIO GGUF	0K / 1.7 GB	328	4
Basically Human 4B F32 GGUF	0K / 1.7 GB	250	2
Qwen3 4B Abliterated F32 GGUFs	0K / 1.7 GB	206	2

Note: green Score (e.g. "73.2") means that the model is better than zhoucantd/translategemma-tok.

Rank the Translategemma Tok Capabilities

🆘 Have you tried this model? Rate its performance. This feedback would greatly assist ML community in identifying the most suitable model for their needs. Your contribution really does make a difference! 🌟

Instruction Following and Task Automation
Factuality and Completeness of Knowledge
Censorship and Alignment
Data Analysis and Insight Generation
Text Generation
Text Summarization and Feature Extraction
Code Generation
Multi-Language Support and Translation

What open-source LLMs or SLMs are you in search of? 53834 in total.

Email us: info@extractum.io. Our Privacy Policy | Terms and Conditions | Suggest an improvement.

Our Social Media →

Original data from HuggingFace, OpenCompass and various public git repos.

Check out Ag3ntum — our secure, self-hosted AI agent for server management.

Release v20260328a

Support LLM Explorer

Translategemma Tok by zhoucantd

» All LLMs » zhoucantd » Translategemma Tok URL Share it on

Translategemma Tok Benchmarks

Translategemma Tok Parameters and Internals

Best Alternatives to Translategemma Tok

Rank the Translategemma Tok Capabilities

What open-source LLMs or SLMs are you in search of? 53834 in total.