Como rodar modelos de linguagem locais com interface web e API no Ubuntu Server 24.04

Se você quer hospedar modelos de linguagem (LLMs) no seu próprio servidor, com interface web para testes e uma API para integração, essa é a solução completa

glaucomartins

Ago 6, 2025 - 14:35

Ago 6, 2025 - 17:09

Como rodar modelos de linguagem locais com interface web e API no Ubuntu Server 24.04

Foto Reprodução Pixabay

Se você busca autonomia, performance e controle total sobre os seus modelos de linguagem, chegou a hora de conhecer o Text Generation WebUI, uma das ferramentas mais completas e versáteis para rodar LLMs no seu próprio ambiente.

Com uma interface amigável e suporte a uma ampla variedade de modelos (como LLaMA, Mistral, GPTQ, GGUF, entre outros), o Text Generation WebUI é a escolha ideal para desenvolvedores que querem ir além da nuvem, integrando inteligência artificial diretamente aos seus sistemas, aplicações e fluxos de trabalho, com mais privacidade, personalização e velocidade.

Vamos te dar o passo a passo. Fique atento!

🔧 Requisitos mínimos

Recurso	Recomendado
CPU	x86_64 com suporte a AVX
RAM	16 GB ou mais
GPU	Opcional, NVIDIA com CUDA (para acelerar)
Disco	SSD com 20 GB livres ou mais
SO	Ubuntu Server 24.04 LTS

Passo 1: Instale os pacotes básicos

Passo 2: Clone o repositório oficial

Passo 3: Crie e ative o ambiente virtual Python

Passo 4: Instale as dependências do projeto

Para rodar via CPU:

Para rodar com GPU NVIDIA (CUDA 11.8):

Passo 5: Baixe um modelo de linguagem

Como exemplo, vamos usar o Mistral 7B Instruct, no formato GGUF:

Você pode baixar outros modelos no HuggingFace.

Passo 6: Inicie o servidor com interface web + API

A interface web estará disponível em:
http://:7860
A API REST estará no mesmo endereço, permitindo chamadas POST para integração com seus sistemas.

Rodar em segundo plano com `tmux`

Para deixar o servidor rodando mesmo após encerrar a sessão SSH:

Para reconectar:

Conclusão

Com esse setup, você terá um servidor local rodando modelos LLM com:

Interface web amigável para testes
API REST para conectar com seus sistemas PHP, Node, Python, etc.
Total controle sobre os dados, sem depender de serviços externos

Se quiser automatizar esse processo com um script .sh, posso criar um pronto para uso.

Fonte: OpenAI ChatGPT

Click Here To See More

Arquivos

Qual é a sua Reação?

Gostei 1

Não gostei 0

Amei 0

Engraçado 0

Bravo 0

Triste 0

Uau 0

glaucomartins Glauco Martins, 36 anos, é um profissional de Tecnologia da Informação com uma trajetória marcada por iniciativa, visão prática e respeito às raízes do desenvolvimento tecnológico. Formado em TI, iniciou sua jornada cedo — aos 14 anos já programava, e aos 16 era dono da própria lan house. Foi ali, na prática do dia a dia, que nasceu seu interesse mais profundo pela área de tecnologia. Com apenas 19 para 20 anos, já formado, ingressou no serviço público, trabalhando para o Governo do Espírito Santo. Participou da homologação e testes de sistemas para órgãos como a Polícia Civil, Correios, Prefeitura de Cariacica e outros. Dentre suas realizações, destacam-se a implantação de um sistema de controle patrimonial e a criação de um gerenciador de máquinas voltado para o uso cidadão na unidade do Faça Fácil em Cariacica – ES. Depois de adquirir sólida experiência no setor público, Glauco tomou uma decisão ousada: pediu demissão para fundar seu próprio negócio. No início, enfrentou erros, parcerias que não deram certo e dificuldades típicas de quem aprende na marra. Mas foi exatamente esse processo — mais duro que qualquer faculdade — que o moldou como empreendedor. Hoje, com uma empresa de tecnologia bem estruturada, Glauco fornece soluções completas: softwares de gestão, automações com inteligência artificial, integrações via API com qualquer sistema, além de VPS e serviços de hospedagem para clientes em vários estados do Brasil — e até do exterior, por um período. Entre seus projetos, destaca-se o Informe 365, um portal de notícias fruto direto de sua bagagem técnica e visão estratégica. Por meio dele, construiu uma rede sólida de contatos, parcerias e amizades que se estendem por anos. Glauco Martins representa o perfil do profissional que une técnica, experiência e coragem para construir algo duradouro — respeitando o passado, aprendendo com os tropeços e olhando para frente com os pés no chão.