解决查询命中缓存时流式响应未遵循Ollma规范的问题
- rag返回结果未字符串时,响应分两次发送 - 第一次发送查询内容 - 第二次发送统计信息
This commit is contained in:
@@ -119,7 +119,7 @@ DEFAULT_CONFIG = {
|
||||
"test_cases": {
|
||||
"basic": {
|
||||
"query": "孙悟空",
|
||||
"stream_query": "孙悟空有什么法力,性格特征是什么"
|
||||
"stream_query": "孙悟空"
|
||||
}
|
||||
}
|
||||
}
|
||||
|
Reference in New Issue
Block a user