O TeleChat2-115B de código aberto e um segundo modelo ainda sem nome foram testados em dezenas de milhares de chips, o que se tornou um marco importante no contexto do aumento das restrições dos EUA ao acesso da China a semicondutores avançados, incluindo os mais recentes chips de inteligência artificial da Nvidia, disse o jornal.
O desenvolvimento foi realizado pelo instituto de pesquisa de IA da China Telecom. O Telechart-115B contém mais de 100 bilhões de parâmetros, enquanto o modelo sem nome tem 1 trilhão de parâmetros. O número de parâmetros envolvidos no processo de treinamento determina a complexidade e a eficiência dos modelos de IA.
Em outubro de 2022, os Estados Unidos anunciaram uma série de regras restringindo a exportação de equipamentos e componentes para a produção de chips avançados para empresas localizadas na China.
Um ano depois, o Departamento de Comércio dos EUA emitiu uma série de novas restrições à exportação desses semicondutores. Essas regras mudaram a definição de chips de IA e introduziram requisitos de licenciamento adicionais para suas remessas para mais de 40 países para evitar sua revenda na China.
Na China, há mais de 100 LLMs (large language models em inglês) com mais de 1 bilhão de parâmetros. Eles podem ser usados em transmissão eletrônica de informações, assistência médica, transporte e em qualquer outro campo.
A tecnologia LLM está avançando rapidamente e pode lidar com texto, linguagem e visão, mas para atingir AGI (inteligência artificial que pode pensar e agir como um humano), os modelos de próxima geração devem ter pensamento lógico maior, mais complexo e multinível.
Em dois anos, o tamanho dos large language models aumentou milhares de vezes e o custo do poder de computação continua a cair.
Diante de um desenvolvimento exponencial da indústria de semicondutores, a China saltou da produção do seu primeiro chip só em 2009 para alcançar 27% do mercado global até 2027.