BBC-Esq
diff --git a/‎src/chat_kobold.py‎
Lines changed: 132 additions & 0 deletions b/‎src/chat_kobold.py‎
Lines changed: 132 additions & 0 deletions
diff --git a/‎src/constants.py‎
Lines changed: 14 additions & 14 deletions b/‎src/constants.py‎
Lines changed: 14 additions & 14 deletions
diff --git a/‎src/database_interactions.py‎
Lines changed: 33 additions & 24 deletions b/‎src/database_interactions.py‎
Lines changed: 33 additions & 24 deletions
@@ -0,0 +1,132 @@
+import json
+from pathlib import Path
+import requests
+import logging
+import sseclient
+from PySide6.QtCore import QThread, Signal, QObject
+from database_interactions import QueryVectorDB
+
+ROOT_DIRECTORY = Path(__file__).resolve().parent
+contexts_output_file_path = ROOT_DIRECTORY / "contexts.txt"
+metadata_output_file_path = ROOT_DIRECTORY / "metadata.txt"
+
+class KoboldSignals(QObject):
+    response_signal = Signal(str)
+    error_signal = Signal(str)
+    finished_signal = Signal()
+    citation_signal = Signal(str)
+
+class KoboldAPIWorker(QThread):
+    def __init__(self, url, payload):
+        super().__init__()
+        self.url = url
+        self.payload = payload
+        self.signals = KoboldSignals()
+
+    def run(self):
+        try:
+            response = requests.post(self.url, json=self.payload, stream=True)
+            response.raise_for_status()
+            client = sseclient.SSEClient(response)
+            for event in client.events():
+                if event.event == "message":
+                    try:
+                        data = json.loads(event.data)
+                        if 'token' in data:
+                            logging.debug(f"Received token: {data['token']}")
+                            self.signals.response_signal.emit(data['token'])  # Corrected this line
+                        else:
+                            logging.warning(f"Unexpected data format: {data}")
+                    except json.JSONDecodeError:
+                        logging.error(f"Failed to parse JSON: {event.data}")
+                        self.signals.error_signal.emit(f"Failed to parse: {event.data}")  # Corrected this line
+                else:
+                    logging.info(f"Received non-message event: {event.event}")
+        except Exception as e:
+            logging.error(f"Error in API request: {str(e)}")
+            self.signals.error_signal.emit(str(e))  # Corrected this line
+        finally:
+            self.signals.finished_signal.emit()
+
+class KoboldChat:
+    def __init__(self):
+        self.signals = KoboldSignals()
+        self.api_url = "http://localhost:5001/api/extra/generate/stream"
+        self.query_vector_db = None
+
+    def ask_kobold(self, query, chunks_only, selected_database):
+        logging.debug(f"ask_kobold called with query: {query}, chunks_only: {chunks_only}, selected_database: {selected_database}")
+        
+        if self.query_vector_db is None or self.query_vector_db.selected_database != selected_database:
+            logging.debug(f"Initializing QueryVectorDB with database: {selected_database}")
+            self.query_vector_db = QueryVectorDB(selected_database)
+
+        contexts, metadata_list = self.query_vector_db.search(query)
+        logging.debug(f"Retrieved {len(contexts)} contexts from vector database")
+        
+        if chunks_only:
+            logging.debug("Chunks only mode, displaying contexts")
+            self.display_chunks(contexts, metadata_list)
+            self.signals.finished_signal.emit()
+            return
+
+        prepend_string = "Only base your answer on the provided context/contexts. If you cannot, please state so."
+        augmented_query = f"{prepend_string}\n\n---\n\n" + "\n\n---\n\n".join(contexts) + f"\n\n-----\n\n{query}"
+        logging.debug(f"Augmented query: {augmented_query[:100]}...") # Log first 100 characters of augmented query
+
+        payload = {
+            "prompt": augmented_query,
+            "max_context_length": 4096,
+            "max_length": 512,
+            "temperature": 0.1,
+            "top_p": 0.9,
+            "rep_pen": 1.1
+        }
+
+        logging.debug("Creating KoboldAPIWorker")
+        self.worker = KoboldAPIWorker(self.api_url, payload)
+        self.worker.signals.response_signal.connect(self.on_response_received)
+        self.worker.signals.error_signal.connect(self.signals.error_signal.emit)
+        self.worker.signals.finished_signal.connect(self.on_response_finished)
+        logging.debug("Starting Kobold API worker")
+        self.worker.start()
+
+        self.metadata_list = metadata_list  # Store for citation use later
+        logging.debug("ask_kobold method completed")
+
+    def on_response_received(self, token):
+        logging.debug(f"Response received in KoboldChat: {token}")
+        self.signals.response_signal.emit(token)
+
+    def display_chunks(self, contexts, metadata_list):
+        formatted_chunks = self.format_chunks(contexts, metadata_list)
+        self.signals.response_signal.emit(formatted_chunks)
+
+    def format_chunks(self, contexts, metadata_list):
+        formatted_chunks = ""
+        for i, (context, metadata) in enumerate(zip(contexts, metadata_list), 1):
+            formatted_chunks += f"---------- Context {i} | From File: {metadata.get('file_name', 'Unknown')} ----------\n\n{context}\n\n"
+        return formatted_chunks
+
+    def on_response_finished(self):
+        self.signals.citation_signal.emit(self.format_citations(self.metadata_list))
+        self.signals.finished_signal.emit()
+
+    def format_citations(self, metadata_list):
+        return "\n".join([Path(metadata['file_path']).name for metadata in metadata_list])
+
+class KoboldChatThread(QThread):
+    def __init__(self, query, chunks_only, selected_database):
+        super().__init__()
+        self.query = query
+        self.chunks_only = chunks_only
+        self.selected_database = selected_database
+        self.kobold_chat = KoboldChat()
+
+    def run(self):
+        logging.debug("KoboldChatThread started running")
+        try:
+            self.kobold_chat.ask_kobold(self.query, self.chunks_only, self.selected_database)
+        except Exception as e:
+            logging.error(f"Error in KoboldChatThread: {str(e)}")
+            self.kobold_chat.signals.error_signal.emit(str(e))
@@ -6,7 +6,7 @@
             'max_sequence': 512,
             'size_mb': 134,
             'repo_id': 'BAAI/bge-small-en-v1.5',
-            'cache_dir': 'BAAI--bge-small-en-v1.5',
+            'cache_dir': 'BAAI_bge-small-en-v1.5',
             'type': 'vector'
         },
         {
@@ -15,7 +15,7 @@
             'max_sequence': 512,
             'size_mb': 438,
             'repo_id': 'BAAI/bge-base-en-v1.5',
-            'cache_dir': 'BAAI--bge-base-en-v1.5',
+            'cache_dir': 'BAAI-bge-base-en-v1.5',
             'type': 'vector'
         },
         {
@@ -24,7 +24,7 @@
             'max_sequence': 512,
             'size_mb': 1340,
             'repo_id': 'BAAI/bge-large-en-v1.5',
-            'cache_dir': 'BAAI--bge-large-en-v1.5',
+            'cache_dir': 'BAAI_bge-large-en-v1.5',
             'type': 'vector'
         },
     ],
@@ -35,7 +35,7 @@
             'max_sequence': 512,
             'size_mb': 439,
             'repo_id': 'hkunlp/instructor-base',
-            'cache_dir': 'hkunlp--instructor-base',
+            'cache_dir': 'hkunlp_instructor-base',
             'type': 'vector'
         },
         {
@@ -44,7 +44,7 @@
             'max_sequence': 512,
             'size_mb': 1340,
             'repo_id': 'hkunlp/instructor-large',
-            'cache_dir': 'hkunlp--instructor-large',
+            'cache_dir': 'hkunlp_instructor-large',
             'type': 'vector'
         },
         {
@@ -53,7 +53,7 @@
             'max_sequence': 512,
             'size_mb': 4960,
             'repo_id': 'hkunlp/instructor-xl',
-            'cache_dir': 'hkunlp--instructor-xl',
+            'cache_dir': 'hkunlp_instructor-xl',
             'type': 'vector'
         },
     ],
@@ -64,7 +64,7 @@
             'max_sequence': 256,
             'size_mb': 120,
             'repo_id': 'sentence-transformers/all-MiniLM-L12-v2',
-            'cache_dir': 'sentence-transformers--all-MiniLM-L12-v2',
+            'cache_dir': 'sentence-transformers_all-MiniLM-L12-v2',
             'type': 'vector'
         },
         {
@@ -73,7 +73,7 @@
             'max_sequence': 384,
             'size_mb': 438,
             'repo_id': 'sentence-transformers/all-mpnet-base-v2',
-            'cache_dir': 'sentence-transformers--all-mpnet-base-v2',
+            'cache_dir': 'sentence-transformers_all-mpnet-base-v2',
             'type': 'vector'
         },
     ],
@@ -84,7 +84,7 @@
             'max_sequence': 512,
             'size_mb': 67,
             'repo_id': 'thenlper/gte-small',
-            'cache_dir': 'thenlper--gte-small',
+            'cache_dir': 'thenlper_gte-small',
             'type': 'vector'
         },
         {
@@ -93,7 +93,7 @@
             'max_sequence': 512,
             'size_mb': 219,
             'repo_id': 'thenlper/gte-base',
-            'cache_dir': 'thenlper--gte-base',
+            'cache_dir': 'thenlper_gte-base',
             'type': 'vector'
         },
         {
@@ -102,7 +102,7 @@
             'max_sequence': 512,
             'size_mb': 670,
             'repo_id': 'thenlper/gte-large',
-            'cache_dir': 'thenlper--gte-large',
+            'cache_dir': 'thenlper_gte-large',
             'type': 'vector'
         },
     ],
@@ -114,21 +114,21 @@
         'precision': 'autoselect',
         'size': '232m',
         'repo_id': 'microsoft/Florence-2-base',
-        'cache_dir': 'microsoft--Florence-2-base',
+        'cache_dir': 'vision',
         'requires_cuda': False
     },
     'Florence-2-large': {
         'precision': 'autoselect',
         'size': '770m',
         'repo_id': 'microsoft/Florence-2-large',
-        'cache_dir': 'microsoft--Florence-2-large',
+        'cache_dir': 'vision',
         'requires_cuda': False
     },
     'Moondream2': {
         'precision': 'float16',
         'size': '2b',
         'repo_id': 'vikhyatk/moondream2',
-        'cache_dir': 'vikhyatk--moondream2',
+        'cache_dir': 'vision',
         'requires_cuda': True
     }
 }
 
@@ -48,8 +48,9 @@ def load_config(self, root_directory):
             return yaml.safe_load(stream)
 
     @torch.inference_mode()
-    def initialize_vector_model(self, embedding_model_name, config_data):
-        EMBEDDING_MODEL_NAME = config_data.get("EMBEDDING_MODEL_NAME")
+    def initialize_vector_model(self, config_data):
+        model_name = config_data.get("EMBEDDING_MODEL_NAME")
+        cache_folder = Path.cwd() / "Models" / "vector"
         compute_device = config_data['Compute_Device']['database_creation']
         model_kwargs = {"device": compute_device, "trust_remote_code": True}
         encode_kwargs = {'normalize_embeddings': True, 'batch_size': 8}
@@ -58,55 +59,59 @@ def initialize_vector_model(self, embedding_model_name, config_data):
             encode_kwargs['batch_size'] = 2
         else:
             batch_size_mapping = {
-                'sentence-t5-xxl': 1,
-                ('instructor-xl', 'sentence-t5-xl'): 2,
-                'instructor-large': 3,
-                ('jina-embedding-l', 'bge-large', 'gte-large', 'roberta-large'): 4,
-                'jina-embedding-s': 9,
-                ('bge-small', 'gte-small'): 10,
-                ('MiniLM',): 30,
+                'instructor-xl': 2,
+                'bge-large': 4,
+                'instructor-large': 4,
+                'gte-large': 4,
+                'instructor-base': 6,
+                'mpnet': 8,
+                'bge-base': 8,
+                'gte-base': 8,
+                'bge-small': 10,
+                'gte-small': 10,
+                'MiniLM': 30,
             }
 
             for key, value in batch_size_mapping.items():
                 if isinstance(key, tuple):
-                    if any(model_name_part in EMBEDDING_MODEL_NAME for model_name_part in key):
+                    if any(model_name_part in model_name for model_name_part in key):
                         encode_kwargs['batch_size'] = value
                         break
                 else:
-                    if key in EMBEDDING_MODEL_NAME:
+                    if key in model_name:
                         encode_kwargs['batch_size'] = value
                         break
 
-        if "instructor" in embedding_model_name:
+        if "instructor" in model_name:
             encode_kwargs['show_progress_bar'] = True
 
             model = HuggingFaceInstructEmbeddings(
-                model_name=embedding_model_name,
+                model_name=model_name,
                 model_kwargs=model_kwargs,
-                encode_kwargs=encode_kwargs,
+                cache_folder=str(cache_folder)
             )
 
-        elif "bge" in embedding_model_name:
+        elif "bge" in model_name:
             query_instruction = config_data['embedding-models']['bge'].get('query_instruction')
             encode_kwargs['show_progress_bar'] = True
 
             model = HuggingFaceBgeEmbeddings(
-                model_name=embedding_model_name,
+                model_name=model_name,
                 model_kwargs=model_kwargs,
                 query_instruction=query_instruction,
-                encode_kwargs=encode_kwargs
+                cache_folder=str(cache_folder)
             )
 
         else:
             # model_kwargs["trust_remote_code"] = True
             model = HuggingFaceEmbeddings(
-                model_name=embedding_model_name,
+                model_name=model_name,
                 show_progress=True,
                 model_kwargs=model_kwargs,
-                encode_kwargs=encode_kwargs
+                encode_kwargs=encode_kwargs,
+                cache_folder=str(cache_folder)
             )
 
-        model_name = Path(EMBEDDING_MODEL_NAME).name
         my_cprint(f"{model_name} vector model loaded into memory.", "green")
 
         return model, encode_kwargs
@@ -224,7 +229,6 @@ def save_documents_to_pickle(self, documents):
     @torch.inference_mode()
     def run(self):
         config_data = self.load_config(self.ROOT_DIRECTORY)
-        EMBEDDING_MODEL_NAME = config_data.get("EMBEDDING_MODEL_NAME")
 
         # create  a list to hold langchain "document objects"        
         # langchain_core.documents.base.Document
@@ -265,7 +269,7 @@ def run(self):
             self.save_document_structures(texts) # optional for troubleshooting
 
             # initialize vector model
-            embeddings, encode_kwargs = self.initialize_vector_model(EMBEDDING_MODEL_NAME, config_data)
+            embeddings, encode_kwargs = self.initialize_vector_model(config_data)
 
             # create database
             if isinstance(texts, list) and texts:
@@ -303,25 +307,30 @@ def initialize_vector_model(self):
         compute_device = self.config['Compute_Device']['database_query']
         encode_kwargs = {'normalize_embeddings': True, 'batch_size': 1}
 
+        cache_folder = str(Path.cwd() / "Models" / "vector")
+
         if "instructor" in model_path:
             return HuggingFaceInstructEmbeddings(
                 model_name=model_path,
                 model_kwargs={"device": compute_device},
                 encode_kwargs=encode_kwargs,
+                cache_folder=cache_folder
             )
         elif "bge" in model_path:
             query_instruction = self.config['embedding-models']['bge']['query_instruction']
             return HuggingFaceBgeEmbeddings(
                 model_name=model_path,
                 model_kwargs={"device": compute_device},
                 query_instruction=query_instruction,
-                encode_kwargs=encode_kwargs
+                encode_kwargs=encode_kwargs,
+                cache_folder=cache_folder
             )
         else:
             return HuggingFaceEmbeddings(
                 model_name=model_path,
                 model_kwargs={"device": compute_device, "trust_remote_code": True},
-                encode_kwargs=encode_kwargs
+                encode_kwargs=encode_kwargs,
+                cache_folder=cache_folder
             )
 
     def initialize_database(self):