Commit Graph

703 Commits

Author SHA1 Message Date
Magic_yuan
e7ac7daee8 Merge branch 'HKUDS:main' into main 2024-12-09 18:17:01 +08:00
Magic_yuan
9724b59e19 提取关键词时LLM输出的关键词跟随用户提问的语言,可以避免一些指定英文而偶发的一些LLM输出的JSON不规范导致JSON解析失败的问题 2024-12-09 18:15:09 +08:00
zrguo
725284e8ba Update __version__ 2024-12-09 18:12:08 +08:00
zrguo
3e112c0d05 Merge pull request #432 from ChenZiHong-Gavin/main
fix(lightrag): use is_closed() instead of _closed
2024-12-09 18:08:43 +08:00
zrguo
4c89a1a620 Merge pull request #429 from davidleon/improvement/lazy_external_load
fix extra kwargs error: keyword_extraction.
2024-12-09 18:07:30 +08:00
zrguo
7b0f3ffcda Merge branch 'main' into main 2024-12-09 17:55:56 +08:00
Larfii
2ba20910bb fix naive_query 2024-12-09 17:45:01 +08:00
zrguo
71af34196f Merge branch 'main' into fix-entity-name-string 2024-12-09 17:30:40 +08:00
chenzihong
25d8430a60 Merge branch 'HKUDS:main' into main 2024-12-09 17:10:42 +08:00
chenzihong
9dd51f1f35 fix(lightrag): use is_closed() instead of _closed 2024-12-09 17:10:13 +08:00
Larfii
ffa95e0461 Fix jina embedding 2024-12-09 17:05:17 +08:00
david
9717ad87fc fix extra kwargs error: keyword_extraction.
add lazy_external_load to reduce external lib deps whenever it's not necessary for user.
2024-12-09 15:35:35 +08:00
Magic_yuan
865e76a083 修复bug
https://github.com/HKUDS/LightRAG/issues/306
主要修改包括:
在存储文本块数据时增加了验证,确保只存储有效的数据
在处理文本块之前增加了空列表检查
在截断文本块之前过滤掉无效的数据
增加了更多的日志警告信息
查询的修改:
添加了对 chunks 的有效性检查,过滤掉无效的 chunks:
2024-12-09 15:08:30 +08:00
partoneplay
a7fcb653e3 Merge remote-tracking branch 'origin/main' and fix syntax 2024-12-09 12:36:55 +08:00
zrguo
0a8d88212a Merge pull request #423 from davidleon/feature/jina_embedding
add jina embedding
2024-12-09 10:18:50 +08:00
david
97d1894077 add jina embedding 2024-12-08 22:20:41 +08:00
Magic_yuan
779ed604d8 清理多余注释 2024-12-08 17:38:49 +08:00
Magic_yuan
39c2cb11f3 清理多余注释 2024-12-08 17:37:58 +08:00
Magic_yuan
ccf44dc334 feat(cache): 增加 LLM 相似性检查功能并优化缓存机制
- 在 embedding 缓存配置中添加 use_llm_check 参数
- 实现 LLM 相似性检查逻辑,作为缓存命中的二次验证- 优化 naive 模式的缓存处理流程
- 调整缓存数据结构,移除不必要的 model 字段
2024-12-08 17:35:52 +08:00
Magic_yuan
dc2a45004a 缓存计算函数迁移到工具类 2024-12-08 10:37:55 +08:00
partoneplay
a8e09ba6c5 Add support for OpenAI Compatible Streaming output 2024-12-07 14:53:15 +08:00
partoneplay
50a17bb4f9 delete unreachable code 2024-12-07 14:53:15 +08:00
Saujanya Verma
5a33ce1c1a Fix: Ensure entity_or_relation_name is a string in _handle_entity_relation_summary 2024-12-06 20:54:01 +05:30
magicyuan876
4da7dd1865 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:35:09 +08:00
yuanxiaobin
6a010abb62 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:35:09 +08:00
magicyuan876
efdd4b8b8e 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:23:18 +08:00
yuanxiaobin
a1c4a036fd 移除kwargs中的hashing_kv参数取为变量 2024-12-06 15:23:18 +08:00
magicyuan876
8d9fc01b4c 解决冲突 2024-12-06 15:09:50 +08:00
yuanxiaobin
633fb55b5b 解决冲突 2024-12-06 15:09:50 +08:00
magicyuan876
8924d2b8fc Merge remote-tracking branch 'origin/main'
# Conflicts:
#	lightrag/llm.py
#	lightrag/operate.py
2024-12-06 15:06:00 +08:00
yuanxiaobin
ad4b0d1ba9 Merge remote-tracking branch 'origin/main'
# Conflicts:
#	lightrag/llm.py
#	lightrag/operate.py
2024-12-06 15:06:00 +08:00
magicyuan876
786aa92b48 fix(utils): 修复 JSON 日志编码问题
- 在 json.dumps 中添加 ensure_ascii=False 参数,以支持非 ASCII 字符编码
-这个修改确保了包含中文等非 ASCII 字符的日志信息能够正确处理和显示
2024-12-06 14:32:41 +08:00
yuanxiaobin
558068f611 fix(utils): 修复 JSON 日志编码问题
- 在 json.dumps 中添加 ensure_ascii=False 参数,以支持非 ASCII 字符编码
-这个修改确保了包含中文等非 ASCII 字符的日志信息能够正确处理和显示
2024-12-06 14:32:41 +08:00
magicyuan876
e619b09c8a 重构缓存处理逻辑
- 提取通用缓存处理逻辑到新函数 handle_cache 和 save_to_cache
- 使用 CacheData 类统一缓存数据结构
- 优化嵌入式缓存和常规缓存的处理流程
- 添加模式参数以支持不同查询模式的缓存策略
- 重构 get_best_cached_response 函数,提高缓存查询效率
2024-12-06 14:29:16 +08:00
yuanxiaobin
584258078f 重构缓存处理逻辑
- 提取通用缓存处理逻辑到新函数 handle_cache 和 save_to_cache
- 使用 CacheData 类统一缓存数据结构
- 优化嵌入式缓存和常规缓存的处理流程
- 添加模式参数以支持不同查询模式的缓存策略
- 重构 get_best_cached_response 函数,提高缓存查询效率
2024-12-06 14:29:16 +08:00
zrguo
f2a208c343 Merge branch 'main' into main 2024-12-06 11:38:27 +08:00
zrguo
ad991f904d Merge branch 'main' into main 2024-12-06 11:38:27 +08:00
Suroy
979f30d20b Update oracle_impl.py
Fixed typing error in python3.9
2024-12-06 11:06:20 +08:00
Suroy
0614a93608 Update oracle_impl.py
Fixed typing error in python3.9
2024-12-06 11:06:20 +08:00
magicyuan876
5dfb74ef2d 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:40:48 +08:00
yuanxiaobin
7c4bbe2474 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:40:48 +08:00
magicyuan876
6c29a37f20 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:28:35 +08:00
yuanxiaobin
8a69604966 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:28:35 +08:00
magicyuan876
6540d11096 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:21:53 +08:00
yuanxiaobin
f2a1897b61 修复 args_hash在使用常规缓存时候才计算导致embedding缓存时没有计算的bug 2024-12-06 10:21:53 +08:00
partoneplay
e82d13e182 Add support for Ollama streaming output and integrate Open-WebUI as the chat UI demo 2024-12-06 10:13:16 +08:00
partoneplay
335179196a Add support for Ollama streaming output and integrate Open-WebUI as the chat UI demo 2024-12-06 10:13:16 +08:00
magicyuan876
2ecdab2f18 整理了一下手误的注释 2024-12-06 09:11:22 +08:00
yuanxiaobin
c01c15f7fb 整理了一下手误的注释 2024-12-06 09:11:22 +08:00
magicyuan876
d48c6e4588 feat(lightrag): 添加 查询时使用embedding缓存功能
- 在 LightRAG 类中添加 embedding_cache_config配置项
- 实现基于 embedding 相似度的缓存查询和存储
- 添加量化和反量化函数,用于压缩 embedding 数据
- 新增示例演示 embedding 缓存的使用
2024-12-06 08:17:20 +08:00