Empresa chinesa Alibaba lança modelo de IA que alegadamente supera até o DeepSeek
05:39 29.01.2025 (atualizado: 05:41 29.01.2025)
© AP Photo / Andy WongVisitantes no estande de exposição da empresa de tecnologia chinesa ZTE AI durante a Conferência Mundial de Inteligência Artificial (WAIC) de 2024 e Reunião de Alto Nível sobre Governança Global de IA com o tema no Salão Multifuncional do Shanghai Expo Center em Xangai, China, 4 de julho de 2024
© AP Photo / Andy Wong
Nos siga no
Nesta quarta-feira (29), a empresa de tecnologia chinesa Alibaba lançou uma versão de seu modelo de inteligência artificial (IA) Qwen 2.5-Max que alega superar a concorrência, incluindo o DeepSeek-V3 que abalou as estruturas de mercado das big techs nesta semana.
O lançamento do Qwen 2.5-Max destaca a pressão que a rápida ascensão da startup chinesa de IA, DeepSeek, nas últimas três semanas, colocou não apenas sobre seus concorrentes estrangeiros, mas também sobre a concorrência doméstica.
Em um anúncio publicado na conta oficial do WeChat, a unidade de nuvem do Alibaba afirmou que o Qwen 2.5-Max supera quase todos os aspectos dos modelos de IA mais avançados de código aberto, como o GPT-4o da OpenAI, o DeepSeek-V3 e o Llama-3.1-405B da Meta (empresa proibida na Rússia por atividade extremista).
O lançamento do assistente de IA da DeepSeek, alimentado pelo modelo DeepSeek-V3, no dia 10 de janeiro, seguido pelo lançamento do modelo R1 no dia 20, surpreendeu o Vale do Silício. Esse movimento fez com que as ações de tecnologia caíssem, pois os supostos baixos custos de desenvolvimento e uso da startup chinesa levaram os investidores a questionar os enormes planos de gastos das principais empresas de IA nos EUA, segundo a Reuters.
O sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para atualizar seus próprios modelos de IA. Dois dias após o lançamento do DeepSeek-R1, a ByteDance, proprietária do TikTok, lançou uma atualização para seu modelo de IA principal.
A ByteDance afirmou que seu modelo atualizado superou o o1 da OpenAI, apoiado pela Microsoft, no AIME, um teste de benchmark (referência) que avalia a capacidade dos modelos de IA de entender e responder a instruções complexas. Essa afirmação refletiu a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.