2 år sedan · 6c832ee328
--- a/api/core/model_providers/models/llm/openllm_model.py
+++ b/api/core/model_providers/models/llm/openllm_model.py
@@ -1,13 +1,13 @@
 
				 from typing import List, Optional, Any
			
 
				 
			
 
				 from langchain.callbacks.manager import Callbacks
			
 
				-from langchain.llms import OpenLLM
			
 
				 from langchain.schema import LLMResult
			
 
				 
			
 
				 from core.model_providers.error import LLMBadRequestError
			
 
				 from core.model_providers.models.llm.base import BaseLLM
			
 
				 from core.model_providers.models.entity.message import PromptMessage
			
 
				 from core.model_providers.models.entity.model_params import ModelMode, ModelKwargs
			
 
				+from core.third_party.langchain.llms.openllm import OpenLLM
			
 
				 
			
 
				 
			
 
				 class OpenLLMModel(BaseLLM):
			
@@ -19,7 +19,7 @@ class OpenLLMModel(BaseLLM):
 
				         client = OpenLLM(
			
 
				             server_url=self.credentials.get('server_url'),
			
 
				             callbacks=self.callbacks,
			
 
				-            **self.provider_model_kwargs
			
 
				+            llm_kwargs=self.provider_model_kwargs
			
 
				         )
			
 
				 
			
 
				         return client
			
--- a/api/core/model_providers/providers/openllm_provider.py
+++ b/api/core/model_providers/providers/openllm_provider.py
@@ -1,14 +1,13 @@
 
				 import json
			
 
				 from typing import Type
			
 
				 
			
 
				-from langchain.llms import OpenLLM
			
 
				-
			
 
				 from core.helper import encrypter
			
 
				 from core.model_providers.models.entity.model_params import KwargRule, ModelKwargsRules, ModelType
			
 
				 from core.model_providers.models.llm.openllm_model import OpenLLMModel
			
 
				 from core.model_providers.providers.base import BaseModelProvider, CredentialsValidateFailedError
			
 
				 
			
 
				 from core.model_providers.models.base import BaseProviderModel
			
 
				+from core.third_party.langchain.llms.openllm import OpenLLM
			
 
				 from models.provider import ProviderType
			
 
				 
			
 
				 
			
@@ -46,11 +45,11 @@ class OpenLLMProvider(BaseModelProvider):
 
				         :return:
			
 
				         """
			
 
				         return ModelKwargsRules(
			
 
				-            temperature=KwargRule[float](min=0, max=2, default=1),
			
 
				+            temperature=KwargRule[float](min=0.01, max=2, default=1),
			
 
				             top_p=KwargRule[float](min=0, max=1, default=0.7),
			
 
				             presence_penalty=KwargRule[float](min=-2, max=2, default=0),
			
 
				             frequency_penalty=KwargRule[float](min=-2, max=2, default=0),
			
 
				-            max_tokens=KwargRule[int](min=10, max=4000, default=128),
			
 
				+            max_tokens=KwargRule[int](alias='max_new_tokens', min=10, max=4000, default=128),
			
 
				         )
			
 
				 
			
 
				     @classmethod
			
@@ -71,7 +70,9 @@ class OpenLLMProvider(BaseModelProvider):
 
				             }
			
 
				 
			
 
				             llm = OpenLLM(
			
 
				-                max_tokens=10,
			
 
				+                llm_kwargs={
			
 
				+                    'max_new_tokens': 10
			
 
				+                },
			
 
				                 **credential_kwargs
			
 
				             )
			
 
				 
			
--- a/api/core/third_party/langchain/llms/openllm.py
+++ b/api/core/third_party/langchain/llms/openllm.py
@@ -0,0 +1,87 @@
 
				+from __future__ import annotations
			
 
				+
			
 
				+import logging
			
 
				+from typing import (
			
 
				+    Any,
			
 
				+    Dict,
			
 
				+    List,
			
 
				+    Optional,
			
 
				+)
			
 
				+
			
 
				+import requests
			
 
				+from langchain.llms.utils import enforce_stop_tokens
			
 
				+from pydantic import Field
			
 
				+
			
 
				+from langchain.callbacks.manager import (
			
 
				+    AsyncCallbackManagerForLLMRun,
			
 
				+    CallbackManagerForLLMRun,
			
 
				+)
			
 
				+from langchain.llms.base import LLM
			
 
				+
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+class OpenLLM(LLM):
			
 
				+    """OpenLLM, supporting both in-process model
			
 
				+    instance and remote OpenLLM servers.
			
 
				+
			
 
				+    If you have a OpenLLM server running, you can also use it remotely:
			
 
				+        .. code-block:: python
			
 
				+
			
 
				+            from langchain.llms import OpenLLM
			
 
				+            llm = OpenLLM(server_url='http://localhost:3000')
			
 
				+            llm("What is the difference between a duck and a goose?")
			
 
				+    """
			
 
				+
			
 
				+    server_url: Optional[str] = None
			
 
				+    """Optional server URL that currently runs a LLMServer with 'openllm start'."""
			
 
				+    llm_kwargs: Dict[str, Any] = Field(default_factory=dict)
			
 
				+    """Key word arguments to be passed to openllm.LLM"""
			
 
				+
			
 
				+    @property
			
 
				+    def _llm_type(self) -> str:
			
 
				+        return "openllm"
			
 
				+
			
 
				+    def _call(
			
 
				+        self,
			
 
				+        prompt: str,
			
 
				+        stop: Optional[List[str]] = None,
			
 
				+        run_manager: CallbackManagerForLLMRun | None = None,
			
 
				+        **kwargs: Any,
			
 
				+    ) -> str:
			
 
				+        params = {
			
 
				+            "prompt": prompt,
			
 
				+            "llm_config": self.llm_kwargs
			
 
				+        }
			
 
				+
			
 
				+        headers = {"Content-Type": "application/json"}
			
 
				+        response = requests.post(
			
 
				+            f'{self.server_url}/v1/generate',
			
 
				+            headers=headers,
			
 
				+            json=params
			
 
				+        )
			
 
				+
			
 
				+        if not response.ok:
			
 
				+            raise ValueError(f"OpenLLM HTTP {response.status_code} error: {response.text}")
			
 
				+
			
 
				+        json_response = response.json()
			
 
				+        completion = json_response["responses"][0]
			
 
				+
			
 
				+        if completion:
			
 
				+            completion = completion[len(prompt):]
			
 
				+
			
 
				+        if stop is not None:
			
 
				+            completion = enforce_stop_tokens(completion, stop)
			
 
				+
			
 
				+        return completion
			
 
				+
			
 
				+    async def _acall(
			
 
				+        self,
			
 
				+        prompt: str,
			
 
				+        stop: Optional[List[str]] = None,
			
 
				+        run_manager: Optional[AsyncCallbackManagerForLLMRun] = None,
			
 
				+        **kwargs: Any,
			
 
				+    ) -> str:
			
 
				+        raise NotImplementedError(
			
 
				+            "Async call is not supported for OpenLLM at the moment."
			
 
				+        )
			
--- a/api/requirements.txt
+++ b/api/requirements.txt
@@ -49,5 +49,4 @@ huggingface_hub~=0.16.4
 
				 transformers~=4.31.0
			
 
				 stripe~=5.5.0
			
 
				 pandas==1.5.3
			
 
				-xinference==0.2.0
			
 
				-openllm~=0.2.26
			
 
				+xinference==0.2.0
			
--- a/api/tests/unit_tests/model_providers/test_openllm_provider.py
+++ b/api/tests/unit_tests/model_providers/test_openllm_provider.py
@@ -23,8 +23,7 @@ def decrypt_side_effect(tenant_id, encrypted_key):
 
				 
			
 
				 
			
 
				 def test_is_credentials_valid_or_raise_valid(mocker):
			
 
				-    mocker.patch('langchain.llms.openllm.OpenLLM._identifying_params', return_value=None)
			
 
				-    mocker.patch('langchain.llms.openllm.OpenLLM._call',
			
 
				+    mocker.patch('core.third_party.langchain.llms.openllm.OpenLLM._call',
			
 
				                  return_value="abc")
			
 
				 
			
 
				     MODEL_PROVIDER_CLASS.is_model_credentials_valid_or_raise(
			
@@ -35,8 +34,6 @@ def test_is_credentials_valid_or_raise_valid(mocker):
 
				 
			
 
				 
			
 
				 def test_is_credentials_valid_or_raise_invalid(mocker):
			
 
				-    mocker.patch('langchain.llms.openllm.OpenLLM._identifying_params', return_value=None)
			
 
				-
			
 
				     # raise CredentialsValidateFailedError if credential is not in credentials
			
 
				     with pytest.raises(CredentialsValidateFailedError):
			
 
				         MODEL_PROVIDER_CLASS.is_model_credentials_valid_or_raise(