我帮hermes部署hindsight(docker),就上传过去和微信chatbot的历史聊天记录到hindsight。
Hindsight 走到 LLM 那步就卡死,
因为(OpenCode DeepSeek 响应极慢,单次要16-18分钟)
详细查看后发现,单会话上传,
免费的Agnes AI 0.8s
go订阅的OpenCode DeepSeek 27~77s
上网一查发现很多人都有提这个问题,大家要注意一下,量大管饱但是响应慢,很容易在一些地方因为响应超时埋大坑。

我帮hermes部署hindsight(docker),就上传过去和微信chatbot的历史聊天记录到hindsight。
Hindsight 走到 LLM 那步就卡死,
因为(OpenCode DeepSeek 响应极慢,单次要16-18分钟)
详细查看后发现,单会话上传,
免费的Agnes AI 0.8s
go订阅的OpenCode DeepSeek 27~77s
上网一查发现很多人都有提这个问题,大家要注意一下,量大管饱但是响应慢,很容易在一些地方因为响应超时埋大坑。

卧槽,这么慢吗
@zwlin001 #1 对话上感觉还好,就做自动任务的时候要注意,有时候你设等待120s,有时候opencod
e go 要响应180s,you know that
这不就是产品经理加延迟的需求吗……
@zwlin001 #3 肥肠合理
@小导演i #0 用的dp的pro还是flash?
@GGbo #5 flash
@小导演i #6 单次要16-18分钟 这个你怎么算?向量完全部数据吗
坦白讲我也不清楚怎么算的,模型跑了很久太慢后,跟我说的