DS有点太jb省了,省的我都疑惑了,这玩意怎么聚合缓存的?
本帖最后由 卡卡罗特 于 2025-2-14 12:59 编辑我让它天天到处爬东西处理,各种batch,还处理各种数据,解答各种问题,动不动context累积到10多个,一次性输入几万token,到现在才用了几块钱?他们到底用了他妈的什么缓存技术。我还用了一个三方api,也挺便宜的,但是也花了官方快三倍的钱。DS官方会不会把所有人的输入和输出逼养的全部缓存到一起,过后直接调缓存?那堆海外三方到现在还没解决ds不思考的bug,还依赖着预置提示词模板,国内那帮三方最开始也有这问题不过他们过后自己在服务器上应该预置了,官方是从来没出现过。我现在怀疑两件事,是不是官方的模型和开源的模型其实不完全一样,他们又调过?还有他们官方doc写的缓存那块很模糊,这帮人会不会把所有人的数据都缓存到一起,撞到了直接调缓存出来?否则计价差不多的情况下,我用官方和三方api量也差不多,现在官方便宜这么多。
不同的context之间能share吗
页:
[1]