A Microsoft Research acaba de lançar ferramentas que impulsionarão o futuro da compilação da inteligência artificial (IA).
Os quatro compiladores de IA, apelidados de “Roller”, “Welder”, “Grinder” e “Rammer”, pretendem redefinir o conceito de eficiência computacional, uso de memória e fluxo de controle em modelos de IA.
Leia mais: Sofri um golpe, e agora? Como agir em casos de fraude
Ferramentas de IA da Microsoft
Roller, a primeira das ferramentas de inteligência artificial da Microsoft, busca romper o status quo na compilação de modelos de IA, que geralmente leva dias ou semanas para ser concluída. O sistema reimagina o processo de particionamento de dados dentro de aceleradores. Também funciona como um rolo compactador, colocando meticulosamente dados tensores de alta dimensão na memória bidimensional, de forma semelhante a colocar ladrilhos no chão.
A ferramenta garante uma compilação mais rápida com boa eficiência computacional, focando em como utilizar melhor a memória disponível. Avaliações recentes sugerem que o Roller pode gerar kernels altamente otimizados em segundos, superando os compiladores existentes em três ordens de magnitude.
Já o Welder aborda o problema de eficiência de memória inerente aos modelos modernos de Rede Neural Profunda (DNN). O compilador foi projetado para remediar o desalinhamento entre a utilização dos núcleos de computação e a largura de banda saturada da memória.
Utilizando uma técnica análoga à produção em linha de montagem, a ferramenta “solda” diferentes estágios do processo computacional. Isto reduz transferências desnecessárias de dados, melhorando significativamente a eficiência do acesso à memória.
Testes em GPUs NVIDIA e AMD indicam que o desempenho do Welder supera os frameworks convencionais, com acelerações chegando a 21,4 vezes em comparação ao PyTorch.
Grinder acelera processos em 8x
O Grinder se concentra em outro aspecto crucial – a execução eficiente do fluxo de controle. Em termos gerais, o objetivo é tornar os modelos de IA mais inteligentes para determinar o que executar e quando. Ao “triturar” o fluxo de controle no fluxo de dados, o Grinder aumenta a eficiência geral dos modelos com caminhos de tomada de decisão mais complexos.
Dados experimentais mostram que o Grinder atinge uma aceleração de até 8,2x em modelos DNN com uso intensivo de fluxo de controle, superando as estruturas existentes.
Finalmente, o Rammer trabalha na maximização do paralelismo de hardware. Isso se refere à capacidade do hardware de fazer coisas diferentes simultaneamente.
Os quatro compiladores de IA da Microsoft são construídos sobre uma abstração comum e uma representação intermediária unificada, formando um conjunto abrangente de soluções para lidar com paralelismo, eficiência de compilação, memória e fluxo de controle.
Jilong Xue, pesquisador principal da Microsoft Research Asia, disse:
“Os compiladores de IA que desenvolvemos demonstraram uma melhoria substancial na eficiência da compilação de IA, facilitando assim o treinamento e a implantação de modelos de inteligência artificial. ”
- Não entendeu algum termo do universo Web3? Confira no nosso Glossário!
- Quer se manter atualizado em tudo o que é relevante no mundo cripto? O BeInCrypto tem uma comunidade no Telegram em que você pode ler em primeira mão as notícias relevantes e conversar com outros entusiastas em criptomoedas. Confira!
- Você também pode se juntar a nossas comunidades no Twitter (X), Instagram e Facebook.
Isenção de responsabilidade
Todas as informações contidas em nosso site são publicadas de boa fé e apenas para fins de informação geral. Qualquer ação que o leitor tome com base nas informações contidas em nosso site é por sua própria conta e risco.