AutoMixRouter (training + inference)¶

AutoMixRouter targets cost-aware routing between small and large models. Training is parameter search (not gradient descent).

Configs¶

If you are unsure, run llmrouter list-routers.

Train:

llmrouter train --router automix --config configs/model_config_train/automix.yaml

Route-only inference:

llmrouter infer --router automixrouter --config configs/model_config_test/automix.yaml --query "Explain transformers." --route-only

Full inference:

llmrouter infer --router automixrouter --config configs/model_config_test/automix.yaml --query "Explain transformers."

hparam.routing_method: choose the routing method (for example, POMDP vs threshold-based).
hparam.small_model_cost / hparam.large_model_cost: encode your cost assumptions.