A Cerebras Systems, uma startup com sede nos Estados Unidos, lançou o maior chip integrando mais de 1,2 trilhão de transistores e medindo 46.225 milímetros quadrados. O novo chip Cerebras Wafer Scale Engine (WSE) é otimizado para IA e é 56,7 vezes maior do que a maior unidade de processamento gráfico que mede 815 milímetros quadrados e contém 21,1 bilhões de transistores. O novo Cerebras Wafer Scale Engine (WSE) oferece 3.000 vezes mais alta velocidade de memória no chip e vem com 10.000 vezes mais largura de banda de memória. O tamanho maior do chip garante que as informações possam ser processadas mais rapidamente e pode até mesmo reduzir o tempo de percepção, ou “tempo de treinamento”, que permite aos pesquisadores testar mais ideias, usar mais dados e resolver novos problemas.
O Cerebras WSE é projetado para IA e contém inovações fundamentais que avançam o estado da arte, resolvendo desafios técnicos de décadas que são de tamanho limitado de chip - como conectividade retículo cruzado, rendimento, fornecimento de energia e embalagem. O WSE pode acelerar cálculos e comunicações, o que reduz o tempo de treinamento. O WSE tem 56,7 vezes mais área de silício do que a maior unidade de processamento gráfico. Além disso, o WSE pode fornecer mais núcleos para fazer mais cálculos e recursos mais memória perto dos núcleos, para que os núcleos possam operar com eficiência. Toda a comunicação é mantida no próprio silício por causa de sua vasta gama de núcleos e memória embutida em um único chip.
O chip Cerebras WSE contém 46.225 mm2 de silício e abriga 400.000 núcleos de computação otimizados para IA, sem cache, sem sobrecarga e 18 gigabytes de memória SRAM local, distribuída e super rápida. O chip vem com 9 petabytes por segundo de largura de banda de memória, onde os núcleos são interligados com uma rede de comunicação conectada em malha integrada, totalmente em hardware, que oferece uma largura de banda agregada de 100 petabits por segundo. Isso significa que a largura de banda de comunicação de baixa latência do WSE é extremamente grande, o que faz com que os grupos de núcleos colaborem com o máximo de eficiência, e a largura de banda da memória não é mais um gargalo. Mais memória local, mais núcleos e uma malha de alta largura de banda de baixa latência combinados formam a arquitetura ideal para acelerar o trabalho de IA.
As características do chip Cerebras WSE:
- Núcleos aumentados: O WSE integra 400.000 núcleos de computação otimizados para IA, chamados SLAC (Sparse Linear Algebra Cores), que são programáveis, flexíveis e otimizados para a álgebra linear esparsa que sustenta toda a computação de rede neural. O recurso de programação do SLAC garante que os núcleos possam executar facilmente todos os algoritmos de rede neural em um campo de aprendizado de máquina em constante mudança. Os núcleos WSE incorporam a tecnologia de coleta de dispersão inventada pela Cerebras que acelera o desempenho computacional em cargas de trabalho esparsas (cargas de trabalho que contêm zeros) como aprendizado profundo.
- Memória aprimorada: O Cerebras WSE integra mais memória local com mais núcleos, o que é mais do que qualquer chip que permite computação flexível e rápida com menor latência e menos energia. O WSE vem com 18 GB (Gigabytes) de memória no chip acessível por seu núcleo em um ciclo de clock. Esta coleção de memória local central faz com que o WSE forneça um agregado de 9 petabytes por segundo de largura de banda de memória que é 10.000 X mais largura de banda de memória e 3.000 X