有时候我感觉ALI系的员工应该都很擅长设计迷宫和各种思辨游戏。
除了套路云的各种优惠福利一套一套又一套,没想到想要用上他们的服务也是要过一关一关又一关。
原本我就想给阿里生图AI的base url转成openai兼容格式,理论上来说搞个格式包装器就好了,但是考虑到我那贫弱的小鸡,就和业务沟通了一下。
然后人丢了一个巨长的文档过来让我参考一下,行吧,看在AI时代我不挑你理,喂给claude,然后按照指示一步一步建网关示例、申请官方域名、绑定后端、折腾VPC、折腾证书、创建用户组、搞AI网关……折腾半天,结果死活调不通网关,TLS握手永远失败,业务监控显示所有请求被网关 400 拒掉。
反馈给业务,给了具体信息,结果这哥们没法解决,帮我提交企业工单。还好速度挺快,半小时又拉了个钉钉群,又给了一堆网关实例信息,然后工程师又给我丢了一篇文档和一堆截图,让我配置服务,但入向问题没有解决呀,TLS握手直接失败。工程又要了一堆信息再给我丢了一篇文档过来,我直接力竭了,有种上学时读大部头的感觉。
思来想去,AI时代,直接新开用户,RAM授权给claude code,再把那一堆文档丢给它,并注入上下文让它解决。耗时一个小时,陷入循环。套路云成功把AI绕晕,死活卡在 Model API 出不来,逼得AI让我询问工程师:

  现象:所有 API 路径(/v1/models、/v1/images/generations、/v1/chat/completions)均返回 HTTP 404,TLS 握手正常(自签证书,443
  端口通),NAT 出方向已配置(同 VPC vpc-bp1pynjbuz359cs3eagxx,EIP 114.55.28.35,SNAT 已生效)。

  Model API 状态显示 DeployedWithChanges(之前是 Deployed,通过 UpdateHttpApi 补充了 serviceConfig 的 protocol/port/modelName
  后变成此状态)。

  关键对比

  ┌─────────────────────────────┬──────────┬──────────────────────────────────────────────────────────┐
  │             项              │ 网关调用 │                      直连 DashScope                      │
  ├─────────────────────────────┼──────────┼──────────────────────────────────────────────────────────┤
  │ GET /v1/models              │ 404      │ 正常返回模型列表(含 wan2.7-image-pro)                  │
  ├─────────────────────────────┼──────────┼──────────────────────────────────────────────────────────┤
  │ POST /v1/images/generations │ 404      │ 也是 404(DashScope compatible-mode 根本不支持这个路径) │
  ├─────────────────────────────┼──────────┼──────────────────────────────────────────────────────────┤
  │ POST /v1/chat/completions   │ 404      │ 200(wan2.7-image-pro 能正常生图)                       │
  └─────────────────────────────┴──────────┴──────────────────────────────────────────────────────────┘

  疑问(请工程师解答)

  1. 404 根因:Model API 已 Deployed 但所有路径 404——是路由未正确绑定到域名
  d-d8g9f4um1hkm5p1it5s0(env-d8g9f4mm1hkm5p1it5pg-cn-hangzhou.alicloudapi.com),还是 DeployedWithChanges
  状态表示变更未生效?是否需要触发重新部署?
  2. 图片生成路径:DashScope 的 compatible-mode 端点不支持 /v1/images/generations(我们直连验证了)。Model API 的 OpenAI
  图片生成场景下,网关是把 /v1/images/generations 翻译成 DashScope 原生的
  /api/v1/services/aigc/image-generation/generation,还是原样转发到 compatible-mode?如果是原样转发,后端必然
  404。正确的后端地址应该是什么?
  3. 后端服务 bailian-image-dashscope.ai(svc-d8gavvem1hkk9lmnbh20):这个服务的实际后端 URL 和鉴权方式是什么?我们有没有办法通过 API
  查看其完整配置?

  需要的帮助

  - 帮我们检查为什么 Model API 的路由不生效(全部 404)
  - 确认图片生成场景下,后端服务的正确配置(URL、端口、协议、鉴权 Key 位置)
  - 如果当前配置有误,指出需要修改的具体字段

甩给业务,新的工单、新的群,服务台表示:

企业钉群暂未配置该产品领域的技术服务专家,转由官网工单服务团队为您提供服务。响应SLA会调整为不超过120分钟,请您谅解。

力竭了兄弟。明天吧,我必须补觉了。