added support for OAI chat completions adapter file, added default stop sequences to prevent chat compl leakage

2025-09-10 09:04:36 +00:00 · 2024-04-07 10:35:20 +08:00 · 2024-04-07 10:35:20 +08:00 · 6166fdfde4
commit 6166fdfde4
parent 0061299cce
2 changed files with 28 additions and 3 deletions
--- a/class.py
+++ b/class.py
@ -273,7 +273,8 @@ class model_backend(InferenceModel):
        unbantokens=False, bantokens=None, usemirostat=None, forceversion=0, nommap=self.kcpp_nommap,
        usemlock=False, noavx2=self.kcpp_noavx2, debugmode=self.kcpp_debugmode, skiplauncher=True, hordeconfig=None, noblas=self.kcpp_noblas,
        useclblast=self.kcpp_useclblast, usecublas=self.kcpp_usecublas, usevulkan=self.kcpp_usevulkan, gpulayers=self.kcpp_gpulayers, tensor_split=self.kcpp_tensor_split, config=None,
-        onready='', multiuser=False, foreground=False, preloadstory=None, noshift=False, remotetunnel=False, ssl=False, benchmark=None, nocertify=False, sdconfig=None, mmproj=None, password=None)
+        onready='', multiuser=False, foreground=False, preloadstory=None, noshift=False, remotetunnel=False, ssl=False, benchmark=None, nocertify=False, sdconfig=None, mmproj=None,
+        password=None, chatcompletionsadapter=None)


        #koboldcpp.main(kcppargs,False) #initialize library without enabling Lite http server