Álgebra linear acelerada (XLA, na sigla em inglês)

A álgebra linear acelerada (XLA, na sigla em inglês) é um compilador de código aberto para machine learning. O compilador XLA usa modelos de frameworks conhecidos, como PyTorch, TensorFlow e JAX, e otimiza os modelos para execução de alto desempenho em diferentes plataformas de hardware, incluindo GPUs, CPUs e aceleradores de ML.

Como parte do projeto OpenXLA, o XLA é criado em colaboração por empresas líderes de hardware e software de ML, incluindo Alibaba, Amazon Web Services, AMD, Apple, Arm, Google, Intel, Meta e NVIDIA.

Principais vantagens

  • Criar em qualquer lugar: a XLA já está integrada aos principais frameworks de ML, como TensorFlow, PyTorch e JAX.

  • Executar em qualquer lugar: oferece suporte a vários back-ends, incluindo GPUs, CPUs e aceleradores de ML, e inclui uma infraestrutura plugável para adicionar suporte a mais recursos.

  • Maximizar e dimensionar a performance: otimiza a performance de um modelo com passagens de otimização testadas na produção e particionamento automatizado para paralelismo de modelo.

  • Eliminar a complexidade: aproveita o poder do MLIR para trazer os melhores recursos para uma única ferramenta de linha de comando do compilador, para que você não precise gerenciar uma variedade de compiladores específicos de domínio.

  • Pronto para o futuro: como um projeto de código aberto, criado em colaboração com os principais fornecedores de hardware e software de ML, a XLA foi projetada para operar na vanguarda do setor de ML.

Documentação

Para saber mais sobre a XLA, confira os links à esquerda. Se você é um desenvolvedor XLA novo, comece com a arquitetura XLA e leia Como contribuir.