多轮tool call能力不稳定

#35
by xielegend - opened

如图所示,到第3轮tool call,question里中文开始出乱码,function name为空,能够高频复现。
image.png

This comment has been hidden (marked as Resolved)

我们在https://github.com/zai-org/ComplexFuncBench?tab=readme-ov-file 这个多轮Function calling Benchmark上得到非常类似的结果,DS 3.1在两三轮函数调用之后,有非常大的概率输出和上下文毫不相关的内容
image.png

image.png

我们也发现同样问题,尤其是在使用read_file工具时,工具会调用失败,但后面回答会出现于回答完全无关的内容
image

image

Sign up or log in to comment