单位都是 ms,在新加坡的龟上压测, 2并发跑100轮
Gitee AI
| 模型 | 类型 | 维度 | 成功 | 平均 | p50 | p95 | p99 | 最小 | 最大 |
|---|---|---|---|---|---|---|---|---|---|
Qwen3-Embedding-8B |
embedding | 1024 | 100/100 | 3748.82 | 3503.50 | 5737.56 | 6702.57 | 1466.02 | 7353.17 |
bge-m3 |
embedding | 1024 | 100/100 | 1960.44 | 1672.83 | 3302.91 | 4129.85 | 1312.27 | 5576.24 |
Qwen3-Embedding-0.6B |
embedding | 1024 | 100/100 | 2022.34 | 1828.14 | 3497.15 | 3992.12 | 1286.72 | 5805.36 |
Qwen3-Embedding-4B |
embedding | 1024 | 100/100 | 5024.75 | 5325.05 | 7380.77 | 9219.69 | 1482.37 | 9349.11 |
jina-embeddings-v4 |
embedding | 2048 | 100/100 | 6454.97 | 7171.43 | 8510.47 | 8837.04 | 2190.04 | 9437.53 |
jina-clip-v2 |
embedding | 1024 | 100/100 | 11619.54 | 13724.47 | 16702.29 | 18942.98 | 1758.52 | 20001.74 |
Qwen3-Reranker-0.6B |
reranker | - | 100/100 | 1770.62 | 1533.00 | 2965.01 | 3775.70 | 1103.96 | 4387.31 |
bge-reranker-v2-m3 |
reranker | - | 100/100 | 1761.80 | 1575.14 | 2812.59 | 3027.44 | 1051.00 | 4998.91 |
Qwen3-Reranker-8B |
reranker | - | 100/100 | 2444.37 | 1654.81 | 3071.54 | 31222.96 | 1115.22 | 31244.52 |
Qwen3-Reranker-4B |
reranker | - | 100/100 | 1638.28 | 1398.68 | 2769.87 | 3052.54 | 1078.65 | 4681.06 |
| 模型 | 类型 | 维度 | 成功 | 平均 | p50 | p95 | p99 | 最小 | 最大 |
|---|---|---|---|---|---|---|---|---|---|
BAAI/bge-large-en-v1.5 |
embedding | 1024 | 99/100 | 435.34 | 396.92 | 742.03 | 884.08 | 346.44 | 967.96 |
BAAI/bge-large-zh-v1.5 |
embedding | 1024 | 99/100 | 392.64 | 387.37 | 447.33 | 555.89 | 335.87 | 702.31 |
BAAI/bge-m3 |
embedding | 1024 | 99/100 | 382.84 | 381.75 | 414.81 | 448.79 | 331.85 | 487.71 |
BAAI/bge-reranker-v2-m3 |
reranker | - | 98/100 | 357.10 | 359.18 | 387.88 | 393.48 | 316.11 | 404.57 |
如果有缺的欢迎评论补充
oracle 的那个 300 刀 trial credit 也可以用来跑模型
https://docs.oracle.com/en-us/iaas/Content/generative-ai/use-playground-embed.htm
@multiset #2 我列出来的都是目来看永久免费且不限量的,赠金的话gcp和aws的也有模型可以用