Merge pull request #158 from stacklok/bug-109

Luke Hinds · web-flow · commit 12dd7c4dc82e · 2024-12-03T08:24:48.000Z
Convert async _close_models in LlamaCppInferenceEngine
diff --git a/src/codegate/inference/inference_engine.py b/src/codegate/inference/inference_engine.py
@@ -24,7 +24,16 @@ def __init__(self):
             self.__models = {}
 
     def __del__(self):
-        self.__close_models()
+        self._close_models()
+
+    def _close_models(self):
+        """
+        Closes all open models and samplers
+        """
+        for _, model in self.__models.items():
+            if model._sampler:
+                model._sampler.close()
+            model.close()
 
     async def __get_model(self, model_path, embedding=False, n_ctx=512, n_gpu_layers=0):
         """
@@ -70,12 +79,3 @@ async def embed(self, model_path, content):
         """
         model = await self.__get_model(model_path=model_path, embedding=True)
         return model.embed(content)
-
-    async def __close_models(self):
-        """
-        Closes all open models and samplers
-        """
-        for _, model in self.__models:
-            if model._sampler:
-                model._sampler.close()
-            model.close()