dataset-creation.zh.ts 4.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '创建数据集',
  5. update: '上传文件',
  6. },
  7. one: '选择数据源',
  8. two: '文本分段与清洗',
  9. three: '处理并完成',
  10. },
  11. error: {
  12. unavailable: '该数据集不可用',
  13. },
  14. stepOne: {
  15. filePreview: '文件预览',
  16. dataSourceType: {
  17. file: '导入已有文本',
  18. notion: '同步自 Notion 内容',
  19. web: '同步自 Web 站点',
  20. },
  21. uploader: {
  22. title: '上传文本文件',
  23. button: '拖拽文件至此,或者',
  24. browse: '选择文件',
  25. tip: '已支持 TXT, HTML, Markdown, PDF',
  26. validation: {
  27. typeError: '文件类型不支持',
  28. size: '文件太大了,不能超过 15MB',
  29. count: '暂不支持多个文件',
  30. },
  31. cancel: '取消',
  32. change: '更改文件',
  33. failed: '上传失败',
  34. },
  35. button: '下一步',
  36. emptyDatasetCreation: '创建一个空数据集',
  37. modal: {
  38. title: '创建空数据集',
  39. tip: '空数据集中还没有文档,你可以在今后任何时候上传文档至该数据集。',
  40. input: '数据集名称',
  41. placeholder: '请输入数据集名称',
  42. nameNotEmpty: '名称不能为空',
  43. nameLengthInvaild: '名称长度不能超过 40 个字符',
  44. cancelButton: '取消',
  45. confirmButton: '创建',
  46. failed: '创建失败',
  47. },
  48. },
  49. stepTwo: {
  50. segmentation: '分段设置',
  51. auto: '自动分段与清洗',
  52. autoDescription: '自动设置分段规则与预处理规则,如果不了解这些参数建议选择此项',
  53. custom: '自定义',
  54. customDescription: '自定义分段规则、分段长度以及预处理规则等参数',
  55. separator: '分段标识符',
  56. separatorPlaceholder: '例如换行符(\n)或特定的分隔符(如 "***")',
  57. maxLength: '分段最大长度',
  58. rules: '文本预处理规则',
  59. removeExtraSpaces: '替换掉连续的空格、换行符和制表符',
  60. removeUrlEmails: '删除所有 URL 和电子邮件地址',
  61. removeStopwords: '去除停用词,例如 “a”,“an”,“the” 等',
  62. preview: '确认并预览',
  63. reset: '重置',
  64. indexMode: '索引方式',
  65. qualified: '高质量',
  66. recommend: '推荐',
  67. qualifiedTip: '调用 OpenAI 的嵌入接口进行处理,以在用户查询时提供更高的准确度',
  68. warning: '请先完成模型供应商的 API KEY 设置。.',
  69. click: '前往设置',
  70. economical: '经济',
  71. economicalTip: '使用离线的向量引擎、关键词索引等方式,降低了准确度但无需花费 Token',
  72. emstimateCost: '执行嵌入预估消耗',
  73. emstimateSegment: '预估分段数',
  74. segmentCount: '段',
  75. calculating: '计算中...',
  76. fileName: '预处理文档',
  77. lastStep: '上一步',
  78. nextStep: '保存并处理',
  79. sideTipTitle: '为什么要分段和预处理?',
  80. sideTipP1: '在处理文本数据时,分段和清洗是两个重要的预处理步骤。',
  81. sideTipP2: '分段的目的是将长文本拆分成较小的段落,以便模型更有效地处理和理解。这有助于提高模型生成的结果的质量和相关性。',
  82. sideTipP3: '清洗则是对文本进行预处理,删除不必要的字符、符号或格式,使数据集更加干净、整洁,便于模型解析。',
  83. sideTipP4: '通过对数据集进行适当的分段和清洗,可以提高模型在实际应用中的表现,从而为用户提供更准确、更有价值的结果。',
  84. previewTitle: '分段预览',
  85. characters: '字符',
  86. indexSettedTip: '要更改索引方法,请转到',
  87. datasetSettingLink: '数据集设置。',
  88. },
  89. stepThree: {
  90. creationTitle: '🎉 数据集已创建',
  91. creationContent: '我们自动为该数据集起了个名称,您也可以随时修改',
  92. label: '数据集名称',
  93. additionTitle: '🎉 文档已上传',
  94. additionP1: '文档已上传至数据集:',
  95. additionP2: ',你可以在数据集的文档列表中找到它。',
  96. stop: '停止处理',
  97. resume: '恢复处理',
  98. navTo: '前往文档',
  99. sideTipTitle: '接下来做什么',
  100. sideTipContent: '当文档完成索引处理后,数据集即可集成至应用内作为上下文使用,你可以在提示词编排页找到上下文设置。你也可以创建成可独立使用的 ChatGPT 索引插件发布。',
  101. modelTitle: '确认停止索引过程吗?',
  102. modelContent:'如果您需要稍后恢复处理,则从停止处继续。',
  103. modelButtonConfirm: "确认停止",
  104. modelButtonCancel: '取消'
  105. },
  106. }
  107. export default translation