DeepSeek: conheça modelo de IA da China que pode superar o ChatGPT

Saiba mais sobre chatbot de IA chinês capaz de ameaçar a hegemonia da OpenAI no mercado e com app que já está no topo entre os mais baixados da App Store nos EUA

deepseek

A DeepSeek liberou recentemente o seu chatbot de Inteligência Artificial gratuito e de código aberto baseado no modelo LLM DeepSeek-R1. Conforme benchmarks especializados, ele supera o modelo GPT-4o1 em quesitos importantes, como codificação e progressões lógicas, utilizando apenas uma fração do custo de operação e recursos computacionais do concorrente. Após ter o app liberado publicamente, o DeepSeek atingiu o topo entre os aplicativos mais baixados da App Store nos EUA, crescimento vertiginoso de visibilidade que acendeu uma série de alertas para a OpenAI e outras gigantes como Google e Meta. Nesta segunda (27), em meio ao boom de acessos, a empresa disse ter sofrido um ciberataque e precisou limitar o cadastro de novos usuários. A seguir, confira mais detalhes sobre a plataforma.

DeepSeek Clique aqui e acesse

O que é o DeepSeek?


A startup chinesa surgiu de um braço de pesquisa do fundo de hedge quantitativo High-Flyer, fundado em 2015 com foco em computação avançada para análises financeiras. Com o avanço dos estudos em análises de dados financeiros, Liang Wenfeng, fundador e CEO do fundo, estabeleceu em 2019 que a High-Flyer passaria a focar no desenvolvimento e aplicação de algoritmos de negociação de IA. Apenas em 2023, já com o ChatGPT operando publicamente, Wenfeng determinou a criação da Fire-Flyer, laboratório especializado dedicado à pesquisa de Inteligência Artificial Geral (AGI), que posteriormente deu origem à DeepSeek.

Ainda em 2023, a empresa chegou a lançar os modelos de linguagem DeepSeek Coder, para geração de códigos, e o DeepSeek LLM, cujo desempenho seria equivalente ao do GPT-4, mas que enfrentou problemas de escalabilidade e eficiência computacional para demandar muito complexas. No entanto, a experiência serviu de base para o desenvolvimento do DeepSeek-R1, inclusive de seu treinamento, fazendo com que o modelo liberado em janeiro de 2025 alcançasse o topo da lista de apps mais baixados para iOS das últimas semanas nos EUA.

Qual é o diferencial do DeepSeek?


O principal diferencial do modelo DeepSeek-R1 está em sua gratuidade de utilização por usuários individuais e o baixíssimo custo para desenvolvedores, cobrando apenas US$ 0,14 por milhão de tokens, contra os US$ 2,50 do modelo GPT-4o, quase 18x mais barato. Para maximizar o desempenho, o modelo utiliza sistema de aprendizado por reforço, abordagem em IA que imita o processo de “tentativa e erro”, descartando respostas ruins e reforçando respostas boas.

Supostamente, a abordagem consegue reduzir os custos operacionais e de treinamento da DeepSeek, utilizando cerca de 2 mil chips especializados da NVIDIA para treinar seus modelos mais avançados, enquanto as gigantes ocidentais utilizando mais de 16 mil chips. O lançamento do modelo DeepSeek-R1 vem quase simultaneamente ao anúncio do lançamento do Duo Bao 1.5 Pro, modelo de IA da ByteDance, dona do TikTok, reforçando que a corrida pelo setor de IA está acirrada também dentro da China, e não apenas no mercado internacional.

Possíveis desdobramentos nos EUA


O salto repentino de interesse dos estadunidenses por mais um aplicativo chinês pode resultar em novos imbróglios internacionais, principalmente com o novo mandato de Donald Trump, que assumiu a presidência dia 20 de janeiro. Em seu primeiro mandato, Trump foi pivô das movimentações que desencadearam todos os atritos com o TikTok sob a premissa de a empresa oferecer riscos para a segurança nacional. O governo estadunidense tem histórico de intervir diretamente na penetração de produtos estrangeiros no país, já tendo agido diretamente para barrar a entrada de carros eletrificados chinesas após a Tesla começar a perder mercado.

Especificamente no setor de computação de alto desempenho (HPC) e Inteligência Artificial, tanto a primeira administração Trump quanto o governo de Joe Biden também passaram uma série de emendas restringindo a exportação de tecnologia destes setores para barrar o avanço da China. Até o momento, o governo não se pronunciou sobre a popularidade crescente da DeepSeek, mas o lançamento de modelos quase tão competentes aos da OpenAI, a despeito de todas as sanções e com uma fração do investimento, sem dúvida, acende um novo alerta.

Se considerarmos ainda que praticamente todas as Big Techs estadunidenses estão passando medidas acenando para o novo governo, é possível, sim, que a nova IA seja o estopim para uma nova onda de medidas restritivas e intervencionistas, provavelmente sob a mesma premissa de risco nacional.

Com funciona o modelo DeepSeek


Na prática, tanto a interface quanto às interações com o modelo da DeepSeek são muito similares com o ChatGPT, mas com dois botões na barra de prompt para ativar as funcionalidades de busca na web e motor de raciocínio lógico. Para fins de teste, propus um problema simulando a partida de dois ônibus de estações rodoviárias em São Paulo e Belo Horizonte, definindo apenas poucos parâmetros, como horários de saída, velocidade média e rota, solicitando o momento e região em que os ônibus se cruzariam, mas não determinando uma distância.

Após processar o problema por cerca de 90 segundos, o modelo descreveu todo o raciocínio lógico envolvido, inclusive estabelecendo que a distância do trajeto não havia sido fornecido, o forçando a realizar buscas em bancos de rotas para a rodovia Fernão Dias (BR-381) e estimar o valor mais próximo naquele contexto. Todo o raciocínio resultou em uma explicação de quatro páginas, com 2100 palavras e 12 mil caracteres, sem contar a resposta em si, descrevendo o problema em detalhes e o resultado.

DeepSeek resolve problema matemático complementando lacuna de variável com estimativas obtidas em buscas reais e descreve toda a linha de raciocínio do problema — Foto: Reprodução/DeepSeek
DeepSeek resolve problema matemático complementando lacuna de variável com estimativas obtidas em buscas reais e descreve toda a linha de raciocínio do problema — Foto: Reprodução/DeepSeek
O único detalhe é que, mesmo com o enunciado em português, apenas a resposta final é produzida em português, com as etapas descritivas da linha de raciocínio tendo sido geradas todas em inglês. Além do aplicativo de chatbot, a DeepSeek ainda lançou o modelo multimodal Janus Pro, para gerações de imagem. Com desempenho equivalente ou superior ao do DALL-E3, por enquanto, disponível apenas para desenvolvedores por meio da plataforma Hugging Face, mas que logo deve receber aplicações via APIs ou até integração no chatbot.

Apesar de estar um pouco congestionada nos últimos dias, quem tiver interesse em testar a DeepSeek pode fazê-lo diretamente pelo site oficial do projeto (https://chat.deepseek.com/), ou baixando o aplicativo para iOS, ou Android.