Site Overlay

O 3D V-Cache ajudaria as CPUs Intel?


Algo que nos perguntaram várias vezes durante a série de perguntas e respostas do HUB é: “Por que a Intel não desenvolve seu próprio tipo de V-Cache 3D?” É uma pergunta instigante, especialmente considerando o quão benéfico o 3D V-Cache tem sido para Chips Ryzen da AMDapesar de algumas desvantagens.

Essas desvantagens incluem velocidades de clock reduzidas, maior uso de energia e temperaturas operacionais mais altas. No caso das CPUs Ryzen, a redução da velocidade do clock não é significativa, uma vez que essas peças não têm uma freqüência muito alta para começar, e o aumento de desempenho alcançado com o cache L3 maior mais do que compensa a diminuição na velocidade do clock. O uso de energia também não é uma grande preocupação e, embora as térmicas possam ser um problema com os processadores Ryzen, é fácil evitar o afogamento.

No caso das CPUs da Intel, pelo menos seus atuais 13º e Núcleo de 14ª geração série, o orçamento de energia está bastante esgotado. Isso tem sido objeto de muita discussão nos últimos anos e recentemente chegou ao auge.

Também sabemos que a Intel depende muito da frequência do clock para aproveitar ao máximo suas peças. Portanto, você deve estar se perguntando se mais cache L3 poderia resolver seus problemas, reduzindo a velocidade do clock e, portanto, o consumo de energia, ao mesmo tempo que aumenta o desempenho dos jogos além do que estamos vendo atualmente.

Para ter uma ideia se mais cache L3 seria benéfico, refazemos alguns testes feitos com o Núcleo de 10ª geração série, mas usando o mais recente 14ª geração partes (também conhecido como Raptor Lake). Essencialmente, este é um benchmark de núcleos versus cache.

Nós pegamos o Núcleo i9-14900K, Núcleo i7-14700Ke Núcleo i5-14600Kdesativou os E-cores completamente, bloqueou os P-cores em 5 GHz com o Ring Bus em 3 GHz e, em seguida, testou três configurações: 8 núcleos com 14900K e 14700K, 6 núcleos com todos os três processadores e 4- núcleos com todos os três processadores.

Este método de teste nos forneceu uma ótima visão sobre como a série de 10ª geração se comparava e o que foi responsável pela maior parte do aumento de desempenho nos jogos daquela época (a resposta nesse caso foi cache L3). No entanto, a série de 10ª geração tinha consideravelmente menos cache L3, apenas 20 MB para o Core i9, 16 MB para o i7 e apenas 12 MB para o i5. Avançando até hoje, o 14600K tem mais cache L3 do que o 10900K com 24 MB, enquanto o 14700K tem 33 MB e o 14900K tem 36 MB.

Os próprios núcleos têm uma freqüência mais alta, embora a configuração aqui tenha mudado muito, especialmente com os E-Cores desabilitados. Finalmente, também estamos usando memória DDR5-7200 e o GeForce RTX 4090então vamos ver como são os resultados dos benchmarks.

Referências

Começando com os resultados do Murderer's Creed Mirage, esses dados não se parecem em nada com os testes da 10ª geração que fizemos. Os resultados são muito inesperados, pois parecem limitados pela CPU, e de fato são. No entanto, adicionar mais núcleos, de 6 para 8, ou aumentar a capacidade do cache L3 não aumenta o desempenho. Em vez disso, o gargalo aqui para as configurações de 6 e 8 núcleos parece ser a frequência de clock de 5 GHz, sugerindo que a principal limitação da arquitetura de 14ª geração é a frequência, e não a capacidade do cache L3, pelo menos neste exemplo.

Cair para apenas 4 núcleos faz com que o desempenho diminua e agora a capacidade do cache desempenha um papel muito pequeno. Ainda assim, é notável ver o 14900K caia menos de 20% neste teste com apenas metade dos núcleos P ativos.

Helldivers 2 vê alguma degradação de desempenho ao cair de 8 para 6 núcleos ativos, embora estejamos falando apenas de uma redução de 7% na taxa de quadros média com uma diminuição muito menor nos mínimos de 1%. Cair para apenas 4 núcleos reduz o desempenho, especialmente nos mínimos de 1%, que são reduzidos em pouco mais de 40%, levando a uma experiência abaixo do ultimate.

Ratchet & Clank, como Murderer's Creed Mirage, quase não vê diferença no desempenho entre as configurações de 6 e 8 núcleos, sugerindo novamente que a frequência do clock central é o principal gargalo aqui. Só quando reduzimos a contagem de núcleos P ativos para apenas 4 é que vemos alguma degradação de desempenho, e a queda aqui é praticamente a mesma, independentemente da capacidade do cache L3.

O Homem-Aranha Remasterizado os resultados são interessantes por alguns motivos. Em primeiro lugar, com 8 núcleos ativos, o 14900K e o 14700K forneceram resultados praticamente idênticos a 5 GHz, portanto, novamente naquele exemplo, a frequência do clock foi o principal gargalo. Mas ao cair para 6 núcleos, parece que o cache se torna mais importante. Embora as margens não sejam exatamente enormes, o 14700K foi apenas 3% mais lento que o 14900K, por exemplo.

Então, estranhamente, ao cair para apenas 4 núcleos, os resultados tornam-se novamente limitados em frequência, apesar do desempenho ter caído apenas 22% quando comparado com os resultados de 8 núcleos.

Cyberpunk 2077: Liberdade Fantasma vê muito pouca diferença entre as configurações de 8 núcleos. O 14700K é novamente apenas 3% mais lento que o 14900K, e estamos vendo apenas uma redução de 7% no desempenho com 6 núcleos ativos e depois uma redução de 22% de 8 núcleos para apenas 4 núcleos. Independentemente de quantos núcleos estão ativos, parece que a capacidade de cache de 5 GHz desempenha um papel muito pequeno.

Legado de Hogwarts não vê nenhuma diferença no desempenho com as configurações de 8 núcleos, com uma pequena variação observada nas configurações de 6 núcleos. A diferença entre 14600K e 14900K aqui é de apenas 5%, e é ainda menor com apenas 4 núcleos ativos. A diferença de desempenho entre 8 e 6 núcleos ativos também é muito pequena, com 4 núcleos reduzindo as taxas de quadros em apenas 20%.

Horizon Forbidden West é outro jogo que parece principalmente limitado em frequência, já que a capacidade do cache não faz diferença aqui, independentemente da configuração principal. A queda de 8 para 6 núcleos reduziu apenas o desempenho do 14900K em 5%, e então de 8 para 4 núcleos houve uma queda de 22%, que é o que normalmente esperamos.

Dragon's Dogma II é conhecido por ser um jogo muito limitado pela CPU, mas como a maioria dos títulos testados, não vemos muita melhoria de desempenho ao aumentar a capacidade do cache L3. O 14900K, por exemplo, foi apenas 4% mais rápido que o 14700K quando todos os 8 núcleos P estavam ativos.

Com 6 núcleos, o 14700K foi 9% mais rápido que o 14600K, enquanto o 14900K foi novamente 4% mais rápido que o 14700K. Então, com apenas 4 núcleos ativos, a contagem de núcleos se torna o principal gargalo.

O desempenho do Baldur's Gate 3 foi novamente praticamente o mesmo usando o 14700K ou o 14900K, e vimos apenas uma diminuição de até 5% no desempenho ao cair para 6 núcleos. Então, com apenas 4 núcleos ativos, o 14900K foi apenas 14% mais lento quando comparado à configuração de 8 núcleos.

O Último de Nós Parte I tem alguns resultados realmente interessantes para nós. Neste exemplo, observamos uma queda de desempenho de 5% do 14900K para o 14700K rodando com 8 núcleos habilitados. Mas com apenas 6 núcleos, essa margem é reduzida para apenas 2%, e nada com 4 núcleos. Em vez disso, é a contagem de núcleos que faz mais diferença neste exemplo.

Por exemplo, o 14900K teve uma redução de 10% na taxa de quadros média ao passar de 8 para 6 núcleos e uma queda de 36% para mínimos de 1%. Depois, de 6 para 4 núcleos, a taxa de quadros média caiu mais 24%, com uma redução de 32% para os mínimos de 1%. Portanto, passar de 8 núcleos ativos para apenas 4 fez com que os mínimos de 1% caíssem para mais da metade neste exemplo.

Campo estelar é outro jogo que se adapta bem aos núcleos e mais um exemplo em que a capacidade do cache tem pouco ou nenhum impacto neste teste. O 14900K teve uma redução de desempenho de 11% ao passar de 8 para 6 núcleos e, em seguida, uma redução adicional de 24% de 6 para 4.

Overclock em 5,7 GHz

Antes de encerrar este teste, voltamos e executamos novamente alguns desses benchmarks com núcleos com freqüência 14% maior em 5,7 GHz, junto com um aumento de 33% no Ring Bus em 4 GHz.

Fizemos isso porque previmos que algumas pessoas extremamente bem informadas considerariam os testes inúteis porque os processadores de 14ª geração podem ter uma freqüência mais alta e 5 GHz não é realista. Apesar de já ter aprendido que o gargalo é de fato a frequência do clock e, em alguns casos, a contagem de núcleos, não a capacidade do cache. Então, sim, aumentar a velocidade dessas peças aumentará o desempenho, mas, além disso, não nos ensinará nada de novo.

De qualquer forma, depois de testar alguns jogos, encontramos tendências semelhantes, então a limitação aqui para a 14ª geração é realmente a velocidade do clock. Mais cache não parece ajudar.

O que aprendemos

Devemos dizer que esses resultados foram bastante surpreendentes, pois são muito diferentes dos resultados da 10ª geração que registramos há três anos. Naquela época, nós achamos que, na maior parte, quando travados na mesma frequência, não havia muita diferença entre os processadores Core i5, i7 e i9 na maioria dos jogos. E quando houve uma diferença, ela poderia ser atribuída em grande parte ao cache L3.

Mas com o 14ª geração, a capacidade do cache não parece importar muito. Na maioria dos exemplos, 24 MB foram suficientes. Estranhamente, um aumento na capacidade de cache geralmente ajudava mais quando menos núcleos estavam ativos, embora nem sempre fosse esse o caso.

O que fez mais diferença foi a contagem de núcleos; a atualização de 4 para 6 núcleos costumava ser muito significativa, embora nenhuma dessas peças venha com apenas 4 núcleos. Houve também alguns exemplos em que passar de 6 para 8 núcleos fez uma grande diferença.

Podemos, portanto, concluir a partir destes dados que adicionar 3D V-Cache a essas CPUs Intel Core de 14ª geração provavelmente seria prejudicial, servindo apenas para reduzir o desempenho dos jogos (pelo menos nos jogos de hoje), o que é surpreendente.

Também imaginamos que ir para 10 ou mesmo 12 núcleos P nos jogos de hoje resultaria apenas em um ganho de desempenho muito pequeno em relação a 8 núcleos. Portanto, para a Intel, o único caminho a seguir com sua arquitetura atual é a velocidade do clock, o que explica por que as coisas aconteceram do jeito que estão, pelo menos até agora.

Atalhos de compras:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

doze + 13 =