-LAN- d3f5b1cbb6 refactor: use tiktoken for token calculation (#12416) 1 tahun lalu
..
__base d3f5b1cbb6 refactor: use tiktoken for token calculation (#12416) 1 tahun lalu
anthropic 2681bafb76 fix: handle document fetching from URL in Anthropic LLM model, solving base64 decoding error (#11858) 1 tahun lalu
azure_ai_studio 51db59622c chore(lint): cleanup repeated cause exception in logging.exception replaced by helpful message (#10425) 1 tahun lalu
azure_openai c98d91e44d fix: o1 model error, use max_completion_tokens instead of max_tokens. (#12037) 1 tahun lalu
baichuan daccb10d8c fix: volcengine_maas and baichuan message error (#11625) 1 tahun lalu
bedrock 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
chatglm 40fb4d16ef chore: refurbish Python code by applying refurb linter rules (#8296) 1 tahun lalu
cohere 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
deepseek 79801f5c30 fix: deepseek reports an error when using Response Format #11677 (#11678) 1 tahun lalu
fireworks 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
fishaudio 448a19bf54 fix: fish audio wrong validate credentials interface (#11019) 1 tahun lalu
gitee_ai 6df17a334c fix: Update the API call address for the text_embedding model (#12342) 1 tahun lalu
google 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
gpustack 2bb521b135 Support TTS and Speech2Text for Model Provider GPUStack (#12381) 1 tahun lalu
groq d7c0bc8c23 feat: Add response format support for openai compat models (#12240) 1 tahun lalu
huggingface_hub 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
huggingface_tei 6a0ff3686c fix: fix typo (#12034) 1 tahun lalu
hunyuan baeddd4d15 feat:Add support for stop parameter in hunyuan model #12313 (#12315) 1 tahun lalu
jina 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
leptonai 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) 1 tahun lalu
localai 1e829ceaf3 chore: format get_customizable_model_schema return value (#9335) 1 tahun lalu
minimax 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
mistralai 42d986b96d [Pixtral] Add new model ; add vision (#11231) 1 tahun lalu
mixedbread b90ad587c2 refactor: move the embedding to the rag module and abstract the rerank runner for extension (#9423) 1 tahun lalu
moonshot 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) 1 tahun lalu
nomic 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
novita 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) 1 tahun lalu
nvidia b90ad587c2 refactor: move the embedding to the rag module and abstract the rerank runner for extension (#9423) 1 tahun lalu
nvidia_nim 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) 1 tahun lalu
oci 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
ollama 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
openai d7c0bc8c23 feat: Add response format support for openai compat models (#12240) 1 tahun lalu
openai_api_compatible 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) 1 tahun lalu
openllm 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
openrouter 4d6b45427c Support streaming output for OpenAI o1-preview and o1-mini (#10890) 1 tahun lalu
perfxcloud 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
replicate 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
sagemaker 147d578922 [Fix] revert sagemaker llm to support model hub (#12378) 1 tahun lalu
siliconflow dc650c5368 Fixes #12414: Add cheaper model and long context model for Qwen2.5-72B-Instruct from siliconflow (#12415) 1 tahun lalu
spark 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
stepfun 3c2e30f348 fix: #12143 support streaming mode content start with "data:" (#12171) 1 tahun lalu
tencent 40fb4d16ef chore: refurbish Python code by applying refurb linter rules (#8296) 1 tahun lalu
togetherai 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
tongyi 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
triton_inference_server 1e829ceaf3 chore: format get_customizable_model_schema return value (#9335) 1 tahun lalu
upstage 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
vertex_ai 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
vessl_ai 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
volcengine_maas 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
voyage 8aae235a71 fix: int None will cause error for context size (#11055) 1 tahun lalu
wenxin 2a909e634b feat: support Ernie-lite-pro-128k (#12161) 1 tahun lalu
x cf0ff88120 feat: add grok-2-1212 and grok-2-vision-1212 (#11672) 1 tahun lalu
xinference 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
yi 56e15d09a9 feat: mypy for all type check (#10921) 1 tahun lalu
zhinao 2cf1187b32 chore(api/core): apply ruff reformatting (#7624) 1 tahun lalu
zhipuai 7c1961e618 feat: Add response format support to GLM-4 (#12252) 1 tahun lalu
__init__.py d069c668f8 Model Runtime (#1858) 2 tahun lalu
_position.yaml fb49413a41 feat: add voyage ai as a new model provider (#8747) 1 tahun lalu
model_provider_factory.py 4e7b6aec3a feat: support pinning, including, and excluding for model providers and tools (#7419) 1 tahun lalu