dataset-creation.ts 7.4 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '建立知識庫',
  5. update: '上傳檔案',
  6. },
  7. one: '選擇資料來源',
  8. two: '文字分段與清洗',
  9. three: '處理並完成',
  10. },
  11. error: {
  12. unavailable: '該知識庫不可用',
  13. },
  14. stepOne: {
  15. filePreview: '檔案預覽',
  16. pagePreview: '頁面預覽',
  17. dataSourceType: {
  18. file: '匯入已有文字',
  19. notion: '同步自 Notion 內容',
  20. web: '同步自 Web 站點',
  21. },
  22. uploader: {
  23. title: '上傳文字檔案',
  24. button: '拖拽檔案至此,或者',
  25. browse: '選擇檔案',
  26. tip: '已支援 {{supportTypes}},每個檔案不超過 {{size}}MB。',
  27. validation: {
  28. typeError: '檔案型別不支援',
  29. size: '檔案太大了,不能超過 {{size}}MB',
  30. count: '暫不支援多個檔案',
  31. filesNumber: '批次上傳限制 {{filesNumber}}。',
  32. },
  33. cancel: '取消',
  34. change: '更改檔案',
  35. failed: '上傳失敗',
  36. },
  37. notionSyncTitle: 'Notion 未繫結',
  38. notionSyncTip: '同步 Notion 內容前,須先繫結 Notion 空間',
  39. connect: '去繫結',
  40. button: '下一步',
  41. emptyDatasetCreation: '建立一個空知識庫',
  42. modal: {
  43. title: '建立空知識庫',
  44. tip: '空知識庫中還沒有文件,你可以在今後任何時候上傳文件至該知識庫。',
  45. input: '知識庫名稱',
  46. placeholder: '請輸入知識庫名稱',
  47. nameNotEmpty: '名稱不能為空',
  48. nameLengthInvalid: '名稱長度不能超過 40 個字元',
  49. cancelButton: '取消',
  50. confirmButton: '建立',
  51. failed: '建立失敗',
  52. },
  53. website: {
  54. maxDepth: '最大深度',
  55. selectAll: '全選',
  56. exceptionErrorTitle: '運行 Firecrawl 作業時發生異常:',
  57. run: '跑',
  58. extractOnlyMainContent: '僅提取主要內容(無頁眉、導航、頁腳等)',
  59. fireCrawlNotConfiguredDescription: '使用 API 金鑰配置 Firecrawl 以使用它。',
  60. limit: '限制',
  61. crawlSubPage: '抓取子頁面',
  62. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  63. preview: '預覽',
  64. configure: '配置',
  65. excludePaths: '排除路徑',
  66. options: '選項',
  67. firecrawlDoc: 'Firecrawl 文件',
  68. totalPageScraped: '抓取的總頁數:',
  69. firecrawlTitle: '使用 🔥Firecrawl 提取 Web 內容',
  70. includeOnlyPaths: '僅包含路徑',
  71. resetAll: '全部重置',
  72. scrapTimeInfo: '在 {{time}} 秒內總共抓取了 {{total}} 個頁面',
  73. unknownError: '未知錯誤',
  74. fireCrawlNotConfigured: '未配置 Firecrawl',
  75. maxDepthTooltip: '相對於輸入的 URL 的最大爬網深度。深度 0 只是抓取輸入的 url 的頁面,深度 1 抓取 url 以及 enteredURL + 1 / 之後的所有內容,依此類推。',
  76. },
  77. },
  78. stepTwo: {
  79. segmentation: '分段設定',
  80. auto: '自動分段與清洗',
  81. autoDescription: '自動設定分段規則與預處理規則,如果不瞭解這些引數建議選擇此項',
  82. custom: '自定義',
  83. customDescription: '自定義分段規則、分段長度以及預處理規則等引數',
  84. separator: '分段識別符號',
  85. separatorPlaceholder: '例如換行符(\n)或特定的分隔符(如 "***")',
  86. maxLength: '分段最大長度',
  87. overlap: '分段重疊長度',
  88. overlapTip: '設定分段之間的重疊長度可以保留分段之間的語義關係,提升召回效果。建議設定為最大分段長度的10%-25%',
  89. overlapCheck: '分段重疊長度不能大於分段最大長度',
  90. rules: '文字預處理規則',
  91. removeExtraSpaces: '替換掉連續的空格、換行符和製表符',
  92. removeUrlEmails: '刪除所有 URL 和電子郵件地址',
  93. removeStopwords: '去除停用詞,例如 “a”,“an”,“the” 等',
  94. preview: '確認並預覽',
  95. reset: '重置',
  96. indexMode: '索引方式',
  97. qualified: '高質量',
  98. recommend: '推薦',
  99. qualifiedTip: '呼叫系統預設的嵌入介面進行處理,以在使用者查詢時提供更高的準確度',
  100. warning: '請先完成模型供應商的 API KEY 設定。.',
  101. click: '前往設定',
  102. economical: '經濟',
  103. economicalTip: '使用離線的向量引擎、關鍵詞索引等方式,降低了準確度但無需花費 Token',
  104. QATitle: '採用 Q&A 分段模式',
  105. QATip: '開啟後將會消耗額外的 token',
  106. QALanguage: '分段使用',
  107. estimateCost: '執行嵌入預估消耗',
  108. estimateSegment: '預估分段數',
  109. segmentCount: '段',
  110. calculating: '計算中...',
  111. fileSource: '預處理文件',
  112. notionSource: '預處理頁面',
  113. other: '和其他 ',
  114. fileUnit: ' 個檔案',
  115. notionUnit: ' 個頁面',
  116. previousStep: '上一步',
  117. nextStep: '儲存並處理',
  118. save: '儲存並處理',
  119. cancel: '取消',
  120. sideTipTitle: '為什麼要分段和預處理?',
  121. sideTipP1: '在處理文字資料時,分段和清洗是兩個重要的預處理步驟。',
  122. sideTipP2: '分段的目的是將長文字拆分成較小的段落,以便模型更有效地處理和理解。這有助於提高模型生成的結果的質量和相關性。',
  123. sideTipP3: '清洗則是對文字進行預處理,刪除不必要的字元、符號或格式,使知識庫更加乾淨、整潔,便於模型解析。',
  124. sideTipP4: '透過對知識庫進行適當的分段和清洗,可以提高模型在實際應用中的表現,從而為使用者提供更準確、更有價值的結果。',
  125. previewTitle: '分段預覽',
  126. previewTitleButton: '預覽',
  127. previewButton: '切換至 Q&A 形式',
  128. previewSwitchTipStart: '當前分段預覽是文字模式,切換到 Q&A 模式將會',
  129. previewSwitchTipEnd: '消耗額外的 token',
  130. characters: '字元',
  131. indexSettingTip: '要更改索引方法,請轉到',
  132. retrievalSettingTip: '要更改檢索方法,請轉到',
  133. datasetSettingLink: '知識庫設定。',
  134. websiteSource: '預處理網站',
  135. webpageUnit: '頁面',
  136. separatorTip: '分隔符是用於分隔文字的字元。\\n\\n 和 \\n 是分隔段落和行的常用分隔符。與逗號 (\\n\\n,\\n) 組合使用時,當超過最大區塊長度時,段落將按行分段。您也可以使用自定義的特殊分隔符(例如 ***)。',
  137. },
  138. stepThree: {
  139. creationTitle: '🎉 知識庫已建立',
  140. creationContent: '我們自動為該知識庫起了個名稱,您也可以隨時修改',
  141. label: '知識庫名稱',
  142. additionTitle: '🎉 文件已上傳',
  143. additionP1: '文件已上傳至知識庫:',
  144. additionP2: ',你可以在知識庫的文件列表中找到它。',
  145. stop: '停止處理',
  146. resume: '恢復處理',
  147. navTo: '前往文件',
  148. sideTipTitle: '接下來做什麼',
  149. sideTipContent: '當文件完成索引處理後,知識庫即可整合至應用內作為上下文使用,你可以在提示詞編排頁找到上下文設定。你也可以建立成可獨立使用的 ChatGPT 索引外掛釋出。',
  150. modelTitle: '確認停止索引過程嗎?',
  151. modelContent: '如果您需要稍後恢復處理,則從停止處繼續。',
  152. modelButtonConfirm: '確認停止',
  153. modelButtonCancel: '取消',
  154. },
  155. firecrawl: {
  156. configFirecrawl: '配置 🔥Firecrawl',
  157. apiKeyPlaceholder: '來自 firecrawl.dev 的 API 金鑰',
  158. getApiKeyLinkText: '從 firecrawl.dev 獲取 API 金鑰',
  159. },
  160. }
  161. export default translation