dataset-creation.ts 7.1 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '创建知识库',
  5. update: '上传文件',
  6. },
  7. one: '选择数据源',
  8. two: '文本分段与清洗',
  9. three: '处理并完成',
  10. },
  11. error: {
  12. unavailable: '该知识库不可用',
  13. },
  14. firecrawl: {
  15. configFirecrawl: '配置 🔥Firecrawl',
  16. apiKeyPlaceholder: '从 firecrawl.dev 获取 API Key',
  17. getApiKeyLinkText: '从 firecrawl.dev 获取您的 API Key',
  18. },
  19. stepOne: {
  20. filePreview: '文件预览',
  21. pagePreview: '页面预览',
  22. dataSourceType: {
  23. file: '导入已有文本',
  24. notion: '同步自 Notion 内容',
  25. web: '同步自 Web 站点',
  26. },
  27. uploader: {
  28. title: '上传文本文件',
  29. button: '拖拽文件至此,或者',
  30. browse: '选择文件',
  31. tip: '已支持 {{supportTypes}},每个文件不超过 {{size}}MB。',
  32. validation: {
  33. typeError: '文件类型不支持',
  34. size: '文件太大了,不能超过 {{size}}MB',
  35. count: '暂不支持多个文件',
  36. filesNumber: '批量上传限制 {{filesNumber}}。',
  37. },
  38. cancel: '取消',
  39. change: '更改文件',
  40. failed: '上传失败',
  41. },
  42. notionSyncTitle: 'Notion 未绑定',
  43. notionSyncTip: '同步 Notion 内容前,须先绑定 Notion 空间',
  44. connect: '去绑定',
  45. button: '下一步',
  46. emptyDatasetCreation: '创建一个空知识库',
  47. modal: {
  48. title: '创建空知识库',
  49. tip: '空知识库中还没有文档,你可以在今后任何时候上传文档至该知识库。',
  50. input: '知识库名称',
  51. placeholder: '请输入知识库名称',
  52. nameNotEmpty: '名称不能为空',
  53. nameLengthInvaild: '名称长度不能超过 40 个字符',
  54. cancelButton: '取消',
  55. confirmButton: '创建',
  56. failed: '创建失败',
  57. },
  58. website: {
  59. fireCrawlNotConfigured: 'Firecrawl 未配置',
  60. fireCrawlNotConfiguredDescription: '请配置 Firecrawl 的 API 密钥以使用它。',
  61. configure: '配置',
  62. run: '运行',
  63. firecrawlTitle: '使用 🔥Firecrawl 提取网页内容',
  64. firecrawlDoc: 'Firecrawl 文档',
  65. firecrawlDocLink: 'https://docs.dify.ai/v/zh-hans/guides/knowledge-base/sync-from-website',
  66. options: '选项',
  67. crawlSubPage: '爬取子页面',
  68. limit: '限制数量',
  69. maxDepth: '最大深度',
  70. excludePaths: '排除路径',
  71. includeOnlyPaths: '仅包含路径',
  72. extractOnlyMainContent: '仅提取主要内容(无标题、导航、页脚等)',
  73. exceptionErrorTitle: '运行 Firecrawl 时发生异常:',
  74. unknownError: '未知错误',
  75. totalPageScraped: '抓取页面总数:',
  76. selectAll: '全选',
  77. resetAll: '重置全部',
  78. scrapTimeInfo: '总共在 {{time}}秒 内抓取了 {{total}} 个页面',
  79. preview: '预览',
  80. maxDepthTooltip: '相对于输入 URL 的最大抓取深度。深度0仅抓取输入 URL 本身的页面,深度1抓取输入 URL 及其后的一层目录(一个 /),依此类推。',
  81. },
  82. },
  83. stepTwo: {
  84. segmentation: '分段设置',
  85. auto: '自动分段与清洗',
  86. autoDescription: '自动设置分段规则与预处理规则,如果不了解这些参数建议选择此项',
  87. custom: '自定义',
  88. customDescription: '自定义分段规则、分段长度以及预处理规则等参数',
  89. separator: '分段标识符',
  90. separatorPlaceholder: '例如换行符(\n)或特定的分隔符(如 "***")',
  91. maxLength: '分段最大长度',
  92. overlap: '分段重叠长度',
  93. overlapTip: '设置分段之间的重叠长度可以保留分段之间的语义关系,提升召回效果。建议设置为最大分段长度的10%-25%',
  94. overlapCheck: '分段重叠长度不能大于分段最大长度',
  95. rules: '文本预处理规则',
  96. removeExtraSpaces: '替换掉连续的空格、换行符和制表符',
  97. removeUrlEmails: '删除所有 URL 和电子邮件地址',
  98. removeStopwords: '去除停用词,例如 “a”,“an”,“the” 等',
  99. preview: '确认并预览',
  100. reset: '重置',
  101. indexMode: '索引方式',
  102. qualified: '高质量',
  103. recommend: '推荐',
  104. qualifiedTip: '调用系统默认的嵌入接口进行处理,以在用户查询时提供更高的准确度',
  105. warning: '请先完成模型供应商的 API KEY 设置。.',
  106. click: '前往设置',
  107. economical: '经济',
  108. economicalTip: '使用离线的向量引擎、关键词索引等方式,降低了准确度但无需花费 Token',
  109. QATitle: '采用 Q&A 分段模式',
  110. QATip: '开启后将会消耗额外的 token',
  111. QALanguage: '分段使用',
  112. emstimateCost: '执行嵌入预估消耗',
  113. emstimateSegment: '预估分段数',
  114. segmentCount: '段',
  115. calculating: '计算中...',
  116. fileSource: '预处理文档',
  117. notionSource: '预处理页面',
  118. websiteSource: '预处理页面',
  119. other: '和其他 ',
  120. fileUnit: ' 个文件',
  121. notionUnit: ' 个页面',
  122. webpageUnit: ' 个页面',
  123. previousStep: '上一步',
  124. nextStep: '保存并处理',
  125. save: '保存并处理',
  126. cancel: '取消',
  127. sideTipTitle: '为什么要分段和预处理?',
  128. sideTipP1: '在处理文本数据时,分段和清洗是两个重要的预处理步骤。',
  129. sideTipP2: '分段的目的是将长文本拆分成较小的段落,以便模型更有效地处理和理解。这有助于提高模型生成的结果的质量和相关性。',
  130. sideTipP3: '清洗则是对文本进行预处理,删除不必要的字符、符号或格式,使知识库更加干净、整洁,便于模型解析。',
  131. sideTipP4: '通过对知识库进行适当的分段和清洗,可以提高模型在实际应用中的表现,从而为用户提供更准确、更有价值的结果。',
  132. previewTitle: '分段预览',
  133. previewTitleButton: '预览',
  134. previewButton: '切换至 Q&A 形式',
  135. previewSwitchTipStart: '当前分段预览是文本模式,切换到 Q&A 模式将会',
  136. previewSwitchTipEnd: '消耗额外的 token',
  137. characters: '字符',
  138. indexSettedTip: '要更改索引方法,请转到',
  139. retrivalSettedTip: '要更改检索方法,请转到',
  140. datasetSettingLink: '知识库设置。',
  141. },
  142. stepThree: {
  143. creationTitle: '🎉 知识库已创建',
  144. creationContent: '我们自动为该知识库起了个名称,您也可以随时修改',
  145. label: '知识库名称',
  146. additionTitle: '🎉 文档已上传',
  147. additionP1: '文档已上传至知识库:',
  148. additionP2: ',你可以在知识库的文档列表中找到它。',
  149. stop: '停止处理',
  150. resume: '恢复处理',
  151. navTo: '前往文档',
  152. sideTipTitle: '接下来做什么',
  153. sideTipContent: '当文档完成索引处理后,知识库即可集成至应用内作为上下文使用,你可以在提示词编排页找到上下文设置。你也可以创建成可独立使用的 ChatGPT 索引插件发布。',
  154. modelTitle: '确认停止索引过程吗?',
  155. modelContent: '如果您需要稍后恢复处理,则从停止处继续。',
  156. modelButtonConfirm: '确认停止',
  157. modelButtonCancel: '取消',
  158. },
  159. }
  160. export default translation