Initial Commit

2025-03-16 20:56:15 -03:00
commit 5238d73942
17 changed files with 290 additions and 0 deletions
--- a/.github/prompts/pdfExtractor.prompt.md
+++ b/.github/prompts/pdfExtractor.prompt.md
@@ -0,0 +1,6 @@
 # Extrator de pdf
 O extrator é um agente de IA construído com o langchain em python, seguindo as seguintes instruções:
  Dentro de um PDF deve extrair as seguintes informações:
 - Os índices dos capítulos retornando as linhas de início e do fim
 - Separar cada capítulo, criando um PDF diferente para cada um
--- a/.github/prompts/projeto.prompt.md
+++ b/.github/prompts/projeto.prompt.md
@@ -0,0 +1,8 @@
 # Escopo do projeto:
 Vai consumir um modelo llm para realizar consultas em um banco de dados, possuindo as seguintes características:
 - Agnóstico de banco de dados, podendo ser usado para qualquer tipo
 - A resposta retorna a lógica do que foi feito junto com o resultado do seu sql exceto:
    - Caso altere qualquer tipo de dado no banco, retorne apenas o sql para o próprio usuário executar
    - Caso sela apenas consulta realize a consulta, retorne qual foi o sql e o resultado da consulta
 - Usará llm local, com o llama cpp e suporte a vulkan
--- a/.vscode/settings.json
+++ b/.vscode/settings.json
@@ -0,0 +1,11 @@
 {
    "python.testing.unittestArgs": [
        "-v",
        "-s",
        "./test",
        "-p",
        "test_*.py"
    ],
    "python.testing.pytestEnabled": false,
    "python.testing.unittestEnabled": true
 }
--- a/agentsConfig.ini
+++ b/agentsConfig.ini
@@ -0,0 +1,3 @@
 [PDFAgent]
 model = qwen2.5:1.5b
 modelProvider = ollama
--- a/src/init.py
+++ b/src/init.py
@@ -0,0 +1 @@
 # Este arquivo transforma o diretório em um pacote Python
--- a/src/interfaces/agents/agent.py
+++ b/src/interfaces/agents/agent.py
@@ -0,0 +1,23 @@
 from abc import ABC, abstractmethod
 from typing import List, Dict, Any
 class Agent(ABC):
    @abstractmethod
    def get_agent_tools(self) -> List[Dict[str, Any]]:
        """
        Get the tools available for the agent.
        Returns:
            List[Dict[str, Any]]: A list of dictionaries representing the tools.
        """
        pass
    @abstractmethod
    def get_agent_details(self) -> Dict[str, Any]:
        """
        Get the details of the agent.
        Returns:
            Dict[str, Any]: A dictionary containing agent details.
        """
        pass
--- a/src/interfaces/models/modelInference.py
+++ b/src/interfaces/models/modelInference.py
@@ -0,0 +1,16 @@
 from abc import ABC, abstractmethod
 from ast import Dict
 from typing import List, Dict, Any, Optional
 class ModelManager(ABC):
    @abstractmethod
    def get_available_models(self) -> List[Dict[str, Any]]:
        pass
    @abstractmethod
    def get_model_details(self, model_name: str) -> Optional[Dict[str, Any]]:
        pass
--- a/src/main.py
+++ b/src/main.py
@@ -0,0 +1,9 @@
 from service.ollama.ollamaModelManager import OllamaModelManager
 # Utilizando nossa classe para obter os modelos
 ollama_manager = OllamaModelManager()
 models = ollama_manager.get_available_models()
 # print(models)
 details = ollama_manager.get_model_details("qwen2.5:1.5b")
 print(details)
--- a/src/modules/pdf/pdfAgent.py
+++ b/src/modules/pdf/pdfAgent.py
@@ -0,0 +1,33 @@
 from langchain.agents import AgentExecutor
 from langchain_community.tools import BaseTool
 import fitz
 import os
 from src.interfaces.agents.agent import Agent
 class PDFAgent(Agent): 
    def __init__(self):
        """
        Initialize a PDF agent.
        This initializes the PDF agent which handles operations related to PDF documents.
        The agent attribute needs to be set with an appropriate agent implementation
        during instantiation.
        Attributes:
            agent: The agent implementation for PDF operations.
        """
        self.agent 
    def get_agent_details(self):
        return super().get_agent_details()
    def get_agent_tools(self):
        return super().get_agent_tools()
--- a/src/modules/pdf/tools/metadata.pdf.tool.py
+++ b/src/modules/pdf/tools/metadata.pdf.tool.py
@@ -0,0 +1,15 @@
 import fitz
 from langchain_community.tools import BaseTool
 class PDFMetadataTool(BaseTool):
    name="pdf_metadata"
    description="Extract metadata from PDF file"
    def _run(self, path: str):
        try: 
            with fitz.open(path) as doc:
                metadata = {
                    "páginas": len(doc)
                }
        except Exception as e:
            return f"Error: {e}"
--- a/src/modules/pdf/tools/textExtract.pdf.tool.py
+++ b/src/modules/pdf/tools/textExtract.pdf.tool.py
@@ -0,0 +1,10 @@
 from langchain_community.tools import BaseTool
 class PDFextractTextTool(BaseTool):
    name="pdf_text_extract"
    description="Extract text from PDF file"
    def _run(self, path: str):
        try: 
--- a/src/modules/pdf/utils.py
+++ b/src/modules/pdf/utils.py
@@ -0,0 +1,18 @@
 import fitz
 import os
 class PDFUtils:
    @staticmethod
    def get_total_lines(pdf_path: str):
        pdf = fitz.open(pdf_path)
        return len(pdf)
 # Get the user's home directory and construct the path to the PDF
 home_dir = os.path.expanduser("~")
 pdf_path = os.path.join(home_dir, "Downloads", "Manuais.pdf")
 # Call the method with the full path
 total_pages = PDFUtils.get_total_lines(pdf_path)
 print(f"Total pages in PDF: {total_pages}")
--- a/src/service/ollama/ollamaModelManager.py
+++ b/src/service/ollama/ollamaModelManager.py
@@ -0,0 +1,46 @@
 import requests
 from src.interfaces.models.modelInference import ModelManager
 class OllamaModelManager(ModelManager):
    def __init__(self, base_url = "http://localhost:11434"):
        self.base_url = base_url
    def get_available_models(self):
        try:
            print(requests.__file__)
            print(self.base_url)
            response = requests.get(f"{self.base_url}/api/tags")
            data = response.json()
            return data.get('models', [])
        except Exception as e:
            print(f"Erro ao obter modelos: {e}")
            return []
    def get_model_details(self, model_name):
        try:
           # Obter detalhes completos do modelo via API
            response = requests.post(
                f"{self.base_url}/api/show",
                json={"name": model_name}
            )
            model_details = response.json()
            # O tamanho do contexto geralmente está disponível em model_details['parameters']['context_length']
            # ou em outro campo similar dependendo do modelo
            context_size = model_details.get('parameters', {}).get('context_length', 'Não disponível')
            # Podemos adicionar outros detalhes relevantes
            details = {
                "name": model_name,
                "context_size": context_size,
                "model_type": model_details.get('modelfile', {}).get('parameter', 'Não disponível'),
                "license": model_details.get('license', 'Não disponível')
            }
            return details
        except Exception as e:
            print(f"Error getting model details: {e}")
            return {"name": model_name, "error": str(e)}
--- a/src/utils/init.py
+++ b/src/utils/init.py
@@ -0,0 +1 @@
 # Este arquivo transforma o diretório em um pacote Python
--- a/src/utils/getModels.py
+++ b/src/utils/getModels.py
@@ -0,0 +1,9 @@
 from service.ollama.ollamaModelManager import OllamaModelManager
 ollama_service = OllamaModelManager()
 models = ollama_service.get_available_models()
 print(models)
--- a/test/init.py
+++ b/test/init.py
--- a/test/test_ollamaModelManager.py
+++ b/test/test_ollamaModelManager.py
@@ -0,0 +1,81 @@
 import unittest
 from unittest.mock import patch, MagicMock
 from src.service.ollama.ollamaModelManager import OllamaModelManager
 class TestOllamaModelManager(unittest.TestCase):
    def setUp(self):
        self.model_manager = OllamaModelManager()
        self.model_manager.base_url = "http://test-url:11434"
    @patch('service.ollama.ollamaModelManager.requests.get')
    def test_get_available_models_success(self, mock_get):
        # Setup mock response
        mock_response = MagicMock()
        mock_response.json.return_value = {
            'models': [
                {'name': 'model1'},
                {'name': 'model2'}
            ]
        }
        mock_get.return_value = mock_response
        # Call method
        result = self.model_manager.get_available_models()
        # Assertions
        mock_get.assert_called_once_with("http://test-url:11434/api/tags")
        self.assertEqual(len(result), 2)
        self.assertEqual(result, [{'name': 'model1'}, {'name': 'model2'}])
    @patch('service.ollama.ollamaModelManager.requests.get')
    def test_get_available_models_exception(self, mock_get):
        # Setup mock to raise exception
        mock_get.side_effect = Exception("Connection error")
        # Call method
        result = self.model_manager.get_available_models()
        # Assertions
        self.assertEqual(result, [])
    @patch('service.ollama.ollamaModelManager.requests.post')
    def test_get_model_details_success(self, mock_post):
        # Setup mock response
        mock_response = MagicMock()
        mock_response.json.return_value = {
            'parameters': {'context_length': 4096},
            'modelfile': {'parameter': 'llama2'},
            'license': 'Apache 2.0'
        }
        mock_post.return_value = mock_response
        # Call method
        result = self.model_manager.get_model_details('llama2')
        # Assertions
        mock_post.assert_called_once_with(
            "http://test-url:11434/api/show",
            json={"name": "llama2"}
        )
        self.assertEqual(result['name'], 'llama2')
        self.assertEqual(result['context_size'], 4096)
        self.assertEqual(result['license'], 'Apache 2.0')
    @patch('service.ollama.ollamaModelManager.requests.post')
    def test_get_model_details_exception(self, mock_post):
        # Setup mock to raise exception
        mock_post.side_effect = Exception("API error")
        # Call method
        result = self.model_manager.get_model_details('unknown_model')
        # Assertions
        self.assertEqual(result['name'], 'unknown_model')
        self.assertTrue('error' in result)
        self.assertEqual(result['error'], 'API error')
 if __name__ == '__main__':
    unittest.main()
		`@@ -0,0 +1 @@`
							`# Este arquivo transforma o diretório em um pacote Python`