Jyong b0b0cc045f add mutil-thread document embedding (#3016) hace 1 año
..
blod 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
entity 5b953c1ef2 Fix some RAG bugs (#2570) hace 1 año
unstructured b0b0cc045f add mutil-thread document embedding (#3016) hace 1 año
csv_extractor.py fa7ba30ba3 Fix rebuild index&csv parsing (#2705) hace 1 año
excel_extractor.py 20bd49285b excel: get keys from every sheet (#2796) hace 1 año
extract_processor.py 5b953c1ef2 Fix some RAG bugs (#2570) hace 1 año
extractor_base.py 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
helpers.py 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
html_extractor.py 5b953c1ef2 Fix some RAG bugs (#2570) hace 1 año
markdown_extractor.py 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
notion_extractor.py a4d86496e1 fix: notion extractor raise 'NoneType' object has no attribute 'curre… (#2608) hace 1 año
pdf_extractor.py 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
text_extractor.py 6c4e6bf1d6 Feat/dify rag (#2528) hace 1 año
word_extractor.py b163545771 Use `python-docx` to extract docx files (#2654) hace 1 año