Drivers da Intel permite dedicar até 93% da memória do sistema para Arc Pro

Redação Rádio Plug
Foto: Créditos: Wallup.net (editada)

A Intel anunciou uma atualização para seus drivers de GPU Arc Pro, que agora permite aos usuários alocar até 93% da RAM do sistema para a GPU integrada. Essa melhoria está incluída na versão 32.0.101.8517 do driver, oferecendo suporte mais extenso para tarefas de inferência de modelos de linguagem de larga escala (LLM).

Atualmente, a capacidade de alocação está disponível apenas para um número limitado de unidades de processamento gráfico. No entanto, a empresa está se esforçando para ampliar as cargas de trabalho que podem ser gerenciadas sem enfrentar limitações significativas de memória.

Tradicionalmente, o sistema de particionamento de memória restringia a utilização máxima de uma GPU a apenas 50% da RAM total disponível no sistema.

Interação com o driver de GPU.Créditos: AMD.

A título de comparação, a AMD possui uma alternativa chamada Memória Gráfica Variável (VGM), que permite que modelos de ponta, como a Strix Halo, utilizem até 96 GB de um total de 128 GB de RAM para a GPU integrada. Essa diferença revela que a Intel está adotando uma abordagem mais agressiva em termos de alocação de memória. No ano anterior, a Intel já havia aumentado a alocação de memória para 87% com o lançamento do recurso “Shared GPU Memory Override”, disponível para os processadores da linha Core Ultra Series 2.

Suporte a GPUs Arc Pro integradas

GPU Arc Pro.Créditos: Intel (editada).

É importante ressaltar que essa atualização é específica para as GPUs Arc Pro integradas, como a Arc Pro B390 e a Arc Pro B370. Embora o recurso de alocação de memória seja a principal adição, o driver também é compatível com as placas gráficas das séries A e B da Arc Pro. Com essa melhoria, os usuários poderão executar modelos de linguagem significativamente maiores, mesmo sem a necessidade de hardware extremamente caro.

Em números, em um sistema com 32 GB de RAM, essa alocação possibilita a execução de um modelo Qwen 2.5 de 32 bits com quantização de 4 bits, proporcionando uma janela de contexto adequada. Por outro lado, estações de trabalho equipadas com 64 GB de RAM são capazes de rodar modelos complexos, como o Llama 3 de 70 bits, com espaço suficiente para o cache KV, garantindo a estabilidade do sistema.

Outros fatores limitantes

Apesar de ser uma atualização impressionante, a capacidade computacional e a largura de banda continuam a influenciar o desempenho dos modelos em execução. Os chips da linha Intel Core Ultra Series 3 (Panther Lake) incluem memória LPDDR5X-9600, que suporta uma largura de banda de aproximadamente 150 GB/s.

Em contraste, a arquitetura Strix Halo da AMD possui um barramento de memória de 256 bits, oferecendo uma largura de banda de 256 GB/s. Essa especificação garante que modelos grandes não só sejam capazes de caber na memória, mas também funcionem em velocidades adequadas durante suas operações.

Desempenho do Apple Silicon.Créditos: Apple.

Entretanto, o Apple Silicon ainda se destaca como o padrão de excelência nesse contexto. O M5 Max, por exemplo, apresenta uma largura de banda impressionante de 614 GB/s, com sua verdadeira vantagem proveniente da Arquitetura de Memória Unificada (UMA). Essa arquitetura elimina o particionamento tradicional utilizado em sistemas x86, permitindo que toda a memória disponível seja acessada nativamente tanto pela CPU quanto pela GPU.

Essas inovações na alocação de memória e no suporte a novas tecnologias destacam o compromisso da Intel em seguir a evolução das necessidades do mercado de computação e IA.

Fonte:: adrenaline.com.br

Advertisements
Compartilhe este artigo