Como prever partidas de Counter-Strike utilizando IA
Nesse domingo dia 17 irá começar um dos campeonatos internacionais mais importantes do jogo, sendo esse especial pois é o primeiro depois do lançamento da sua nova versão, o CS2.
Aproveitei essa oportunidade para tentar prever os jogos do campeonato usando uma LLM.
Resumão
Utilizei o GPT4 da OpenAI para prever todos os jogos do 2024 CS2 PGL Major Championship. Para cada partida forneci os artigos de notícias e as estatísticas dos times e, em seguida, perguntei qual equipe venceria aquela partida.
Há três fases nesse campeonato: Challenger, Legends e Playoffs. Nas duas primeiras, 8 times passam de fase e nos playoffs os times se enfrentam em um mata-mata.
As partidas eliminatórias e de avanço são feitas em um formato melhor de 3 jogos, enquanto as outras são em um formato de melhor de 1.
A média de acertos na primeira etapa foi de 66,7%, 75% na segunda etapa e 33% nos playoffs. Pule para a seção de resultados para uma análise detalhada.
Metodologia
Para prever um jogo com precisão, precisamos fornecer a LLM o máximo de informações possível.
Estes são os dados que enviamos a LLM quando pedimos para responder quem seria o vencedor de um jogo:
- Contexto: Explicação sobre campeonato, do formato suíço e o tipo da partida, além do desempenho de cada equipe até o momento.
- Últimas notícias que mencionam a equipe.
- Visão geral das estatísticas: Relação K/D e taxa de vitórias.
- Histórico de eventos.
- Confrontos anteriores entre as duas equipes.
Prompt
Portanto, o prompt encaminhado para a LLM tem esse formato:
Prompt de um jogo entre FURIA e Eternal Fire na rodada 1-0 na fase Challengers do PGL CS2 Major Championship:
(Todas as interações com a LLM foram feitas em inglês, todos os prompts e respostas abaixo foram traduzidas para maior compreensão.)
SISTEMA:
Você é um especialista em escolher equipes vencedoras de Counter-Strike em uma competição de “pick ems”. As equipes estão jogando em um campeonato chamado “PGL CS2 Major Championship”. Esse campeonato é dividido em três etapas: Challenger, Legends e Playoffs. No momento, estamos na fase Challenger, na qual 16 equipes se enfrentam em um formato suíço. As 8 melhores equipes são classificadas para a próxima fase e as 8 piores são eliminadas. As partidas de eliminação e de avanço são em um formato melhor de 3, enquanto as outras são em um formato melhor de 1. Esta será uma Melhor de 1.
Isso é apenas para diversão entre amigos. Não há apostas ou dinheiro a ser ganho, mas você examinará sua resposta e pensará com cuidado.
O usuário fornecerá um blob JSON de duas equipes no formato (por exemplo):
{ "home": "FURIA", "away": "Spirit" }
Você deverá responder um blob JSON no formato:
{ "winningTeam": "FURIA", "losingTeam": "Spirit" }
Você avaliará as estatísticas e os artigos e explicará passo a passo por que acha que um determinado time vencerá a partida. Depois de escolher o vencedor, critique seu raciocínio e, em seguida, responda com sua resposta final.
Nesse campeonato, o desempenho de ambas as equipes é o seguinte:
Resultados do campeonato
| Equipe | vitórias | derrotas | vitória sobre | derrota sobre | | ------------ | -------- | -------- | ------------- | ------------- | --- | | Eternal Fire | 1 | 0 | TheMongolZ | | | | FURIA | 1 | 0 | Legacy | | |
Aqui estão algumas estatísticas para ajudá-lo:
Estatísticas da equipe
Equipe Taxa de vitórias Taxa de mortes por morte Eternal Fire 61.016949152542374% 1.07 FURIA 54.54545454545454% 1.02 Classificação mundial
Equipe Classificação mundial Eternal Fire #14 FURIA #16 Histórico do evento
Equipe PGL CS2 Major Copenhague 2024 Europa RMR A Eternal Fire 6-8th
Equipe PGL CS2 Major Copenhague 2024 Américas RMR A FURIA 1-2ª Aqui estão alguns artigos de notícias possivelmente relevantes para ajudá-lo:
MAJ3R: “Wicadia jogou como um padre”
A Eternal Fire, liderada por MAJ3R, se classificou para o PGL Major Copenhagen, com um desempenho notável do jovem jogador Wicadia. A equipe melhorou significativamente depois de encontrar o equilíbrio certo nas funções dos jogadores e alcançou o pico da classificação mundial de nº 11. A MAJ3R cita a falta de experiência e compostura como áreas a serem melhoradas contra equipes de primeira linha. A forte ética de trabalho da equipe e a dedicação do MAJ3R são destacadas como razões para seu sucesso. MAJ3R está otimista em relação ao potencial da Eternal Fire para ganhar um Major, com metas altas para o próximo torneio.
FURIA vence Liquid e Imperial derruba M80 em Monterrey
A FURIA superou um déficit inicial contra a Team Liquid para entrar no grupo dos 2 a 0 na RMR das Américas, com arT e chelo liderando o primeiro tempo. Apesar da liderança inicial da Liquid no segundo tempo, a recuperação econômica da FURIA e as jogadas de KSCERATO e yuurih foram decisivas. O artigo destaca a resiliência da FURIA e a proeza individual de seus jogadores como fundamentais para a vitória, que pode ser significativa na busca por uma vaga no Major de Copenhague.
Aqui estão os mesmos resultados de confrontos do passado:
Equipe com maior número de cabeças de chave Equipe com menor número de cabeças de chave Vencedor da partida Evento Eternal Fire FURIA Eternal Fire PARI Por favor, 2023 Eternal Fire FURIA FURIA Roobet Cup 2023 O nome da equipe que você escolher DEVE ser um dos seguintes:
- FURIA
- Eternal Fire
Lembre-se de explicar passo a passo todo o seu raciocínio em detalhes. Use listas com marcadores para estruturar seu resultado. Seja decisivo - não proteja suas decisões. Os artigos de notícias apresentados podem ou não ser relevantes, portanto, avalie-os cuidadosamente.
Observe que usamos alguns conceitos de engenharia de prompts, como Chain of thought, quando pedimos a LLM para “explicar passo a passo todo o seu raciocínio”, e Self-refine, quando pedimos para “Depois de escolher seu vencedor, critique seu raciocínio e, em seguida, responda com sua resposta final”.
Respostas
Aqui estão algumas análises interessantes feitas pela LLM.
Challengers Stage: Ence vs Legacy
Ao avaliar o possível resultado de uma partida entre ENCE e Legacy em um formato melhor de 1 no PGL CS2 Major Championship, vários fatores precisam ser considerados:
- Ranking mundial: A ENCE está classificada em 10º lugar no mundo, enquanto a Legacy está em 33º lugar. Essa diferença significativa na classificação sugere que a ENCE é a equipe mais forte no cenário global.
- Taxa de vitórias: A ENCE tem uma taxa de vitórias de 55,21%, superior aos 48,31% da Legacy. Embora a diferença não seja enorme, ela ainda indica que a ENCE tem um histórico melhor de vitórias em partidas.
- Razão de mortes: Ambas as equipes têm uma taxa de mortes por morte igual de 1,01, o que significa que nenhuma delas tem uma vantagem distinta em termos de desempenho no jogo com base apenas nessa métrica.
- Desempenho recente: A ENCE teve um desempenho misto em eventos recentes, com colocações notáveis, como o 2º lugar na IEM Cologne 2023 e uma classificação para os playoffs na IEM Katowice 2024. A Legacy, por outro lado, teve menos exposição a competições internacionais de alto nível, com seu melhor resultado recente sendo um 1º lugar na CBCS 2023 Season 3, que é um evento regional.
- Dinâmica da equipe: A ENCE passou recentemente por uma reformulação na equipe, incluindo a adição de gla1ve como IGL. Essa mudança parece ter tido um impacto positivo, conforme indicado pela vitória sobre a Astralis e a classificação para o PGL Major Copenhagen. A Legacy também fez mudanças, chamando b4rtiN e colocando coldzera no AWP, o que pode afetar positiva ou negativamente a dinâmica da equipe.
- Map Pool: Em um formato Melhor de 1, a escolha do mapa pode ser crucial. O desempenho da ENCE em determinados mapas, como Vertigo e Ancient, tem sido forte, como visto em suas partidas contra a Astralis. O desempenho do Legacy em mapas é menos documentado em eventos internacionais recentes, o que pode ser uma desvantagem.
- Fatores mentais e emocionais: Os artigos da ENCE sugerem uma equipe que está encontrando seu lugar e melhorando sob nova liderança. Os artigos do Legacy, embora mostrem alguma resiliência, também destacam problemas de consistência e a necessidade de compostura no Major.
Com base nesses fatores, a ENCE parece ser a equipe mais forte para essa partida. Eles têm uma classificação mundial mais alta, uma taxa de vitórias melhor, sucesso recente em eventos internacionais e uma dinâmica de equipe potencialmente revitalizada com gla1ve como IGL. As mudanças recentes do Legacy e o desempenho menos consistente em nível internacional fazem deles os azarões nesse confronto.
No entanto, é importante criticar esse pensamento reconhecendo que as reviravoltas podem acontecer e acontecem nos esportes eletrônicos, especialmente em um formato Melhor de 1, em que um único mapa pode ditar o resultado. O Legacy pode surpreender com um bom desempenho, principalmente se as mudanças recentes no elenco tiverem se transformado rapidamente em um estilo de jogo eficaz. Além disso, as recentes mudanças de escalação da ENCE, embora aparentemente positivas, ainda podem estar em um período de ajuste, o que pode ser explorado pelo Legacy.
Apesar dessas considerações, a análise ainda se inclina para a ENCE como provável vencedora devido ao seu perfil geral mais forte e à forma recente.
O LLM menciona o map pick, que é crucial em uma partida melhor de 1 e que é impossível de se saber minutos antes do início da partida.
Também podemos ver seu uso do Self-refine, quando critica sua própria decisão, mas ainda assim a mantém.
Challengers Stage: paiN vs Lynn Vision
Para determinar o vencedor entre paiN e Lynn Vision em um formato Melhor de 1, precisamos analisar vários fatores, como desempenho recente, estatísticas da equipe, classificação mundial, histórico de eventos e artigos de notícias relevantes. Aqui está uma análise passo a passo:
- Desempenho recente: a paiN apresentou um desempenho misto nos últimos eventos, com colocações que variaram de 2º a 9-16º. Lynn Vision, por outro lado, teve um desempenho forte nos torneios asiáticos, com várias colocações em 1º lugar
- Estatísticas da equipe: paiN tem uma taxa de vitórias mais alta (61,33%) em comparação com Lynn Vision (58,70%) e uma taxa de mortes ligeiramente melhor (paiN: 1,09, Lynn Vision: 1,03)
- Classificação mundial: paiN está em uma posição mais alta (37º) do que Lynn Vision (41º), o que pode indicar um desempenho geral mais forte no cenário internacional.
- Histórico de eventos: o histórico de eventos da paiN mostra que ela tem experiência em torneios regionais e internacionais, com colocações consistentes nos primeiros lugares. O histórico da Lynn Vision é principalmente no circuito asiático, com bons resultados, mas menos exposição a competições internacionais.
- Artigos de notícias: Os artigos sobre a paiN sugerem que eles passaram por mudanças significativas no elenco, o que poderia afetar a sinergia da equipe. No entanto, a equipe se classificou para o Major de Copenhague e mostrou resiliência nas últimas partidas. Os artigos da Lynn Vision destacam a classificação para o Major e o bom desempenho contra equipes regionais, mas também observam alguns pontos fracos, como a dificuldade com o mapa Vertigo.
Com base nessa análise, a paiN parece ter uma ligeira vantagem devido à sua maior taxa de vitórias, melhor taxa de mortes, maior classificação mundial e experiência em competições internacionais. No entanto, o bom desempenho regional da Lynn Vision e a recente classificação para o Major não podem ser ignorados. O formato Melhor de 1 pode ser imprevisível, e a adaptabilidade e o conjunto de mapas da Lynn Vision (excluindo o Vertigo) podem dar a eles uma vantagem em um cenário de mapa único.
O LLM entende que, embora a Lynn Vision tenha vencido muitos torneios regionais, esse fato não se traduz em um bom desempenho em campeonatos internacionais.
Challengers Stage: TheMongolZ vs Cloud9
Ao analisar o possível resultado de uma partida entre Cloud9 e TheMongolZ em um formato Melhor de 3, vários fatores precisam ser considerados para fazer uma previsão informada. Aqui está uma análise passo a passo dos fatores que influenciarão a decisão:
- Ranking mundial: A Cloud9 está em 9º lugar no ranking mundial, enquanto a TheMongolZ está em 18º. A classificação mais alta da Cloud9 sugere que ela geralmente tem um desempenho melhor contra uma variedade maior de equipes.
- Taxa de vitórias e relação K/D: A taxa de vitórias da Cloud9 é de 55,26%, e sua relação de mortes é de 1,03. A TheMongolZ tem uma taxa de vitórias um pouco maior, de 64,49%, e uma relação de mortes por morte de 1,04. Essas estatísticas são bastante próximas, indicando que ambas as equipes são competitivas, mas a TheMongolZ tem uma ligeira vantagem em termos de desempenho bruto.
- Desempenho recente: A Cloud9 teve uma mistura de resultados em torneios recentes, com colocações que variaram de 5-8º a 21-28º. TheMongolZ, por outro lado, tem mostrado um bom desempenho em torneios regionais, com várias colocações em primeiro lugar. No entanto, a experiência da Cloud9 em eventos internacionais mais competitivos pode lhe dar uma vantagem.
- Map Pool e estratégia: Os artigos sugerem que a Cloud9 teve problemas com seu conjunto de mapas e estratégia, especialmente com a ausência de um AWPer dedicado. A TheMongolZ parece ter uma abordagem mais consistente em seu jogo, o que pode ser benéfico em uma série Melhor de 3.
- Dinâmica da equipe: A Cloud9 passou por mudanças recentes, incluindo Boombl4 assumindo a função principal de AWPer. A TheMongolZ parece ter uma equipe estável com um foco claro em refinar seu estilo de jogo. A estabilidade da equipe pode ser um fator importante em partidas de alta pressão.
- Fatores externos: O tempo de preparação, os bootcamps recentes e o estado mental das equipes também podem influenciar o resultado. A Cloud9 teve nove dias para se preparar para o Major, enquanto a preparação da TheMongolZ incluiu um bootcamp europeu, o que poderia ter proporcionado uma experiência valiosa contra uma variedade de estilos de jogo.
Com base nesses fatores, a classificação mundial mais alta da Cloud9 e a experiência em eventos internacionais são significativas, mas a forma recente da TheMongolZ e a pequena vantagem estatística não podem ser ignoradas. A decisão é desafiadora, mas a análise se inclina ligeiramente para a TheMongolZ devido ao seu desempenho consistente e estabilidade estratégica.
Esse caso exemplifica a capacidade do LLM de obter informações externas que podem influenciar o resultado do jogo, como o TheMongolZ fazendo um bootcamp na Europa, além do fato de a Cloud9 não ter um jogador do tipo Sniper dedicado.
Resumo das notícias
As notícias não podem ser inseridas na íntegra no LLM porque o prompt final ficaria gigantesco, visto que estamos selecionando uma média de 20 notícias para cada partida.
Portanto, antes de solicitar o vencedor da partida, enviamos cada artigo ao LLM para obter um resumo:
Prompt
Você é um analista especializado em e-sports para entender artigos de notícias sobre o Counter-Strike. No momento, você está analisando como a equipe NOME, uma organização profissional de Counter-Strike, trabalha, qual é o estilo de jogo dela e qual é o desempenho dela ultimamente.
O usuário fornecerá um artigo sobre esportes e você resumirá o artigo em 5 frases ou menos. Seu resumo destacará quaisquer posições e jogadores do time NOME que que possam ser mencionados e relevantes para o próximo jogo. Você precisa identificar os principais elementos que podem fazer com que a equipe NOME ganhe ou perca a próxima partida. Menções de coisas como negociações ou estatísticas DEVEM SER incluídas. Faça cada palavra valer a pena.”
Exemplo de resumo
Para este artigo ropz: “It doesn’t feel real to be in the top 3 next to ZywOo, NiKo”, a LLM retornou:
Resumo: A FaZe Clan, com ropz recentemente nomeado o terceiro melhor jogador, está se ajustando às mudanças no elenco após a saída de Twistzz e a chegada de frozen. A equipe teve um início forte no CS2, mas agora enfrenta a Vitality como um rival importante. A FaZe está se preparando para o BLAST Spring Groups, com o objetivo de se classificar para a Spring Final e evitar o Showdown. Ropz está ansioso para jogar contra seu ex-companheiro de equipe Twistzz na Liquid. O principal objetivo da equipe é se destacar no próximo Major, com um planejamento cuidadoso para evitar o esgotamento durante a intensa programação do evento.
Análise: O artigo discute o estado atual e as expectativas da FaZe, com foco na perspectiva de ropz. A FaZe começou o CS2 com força, mas enfrentou uma mudança no elenco com a saída de Twistzz e a entrada de frozen. Ropz, recentemente nomeado o jogador número três e Closer of the Year, sente-se confiante apesar da pausa da equipe nas partidas oficiais. A FaZe está se adaptando à integração de frozen, com trocas de posição entre karrigan, rain e frozen, enquanto ropz e broky mantêm suas funções. A equipe pretende se classificar diretamente para a BLAST Spring Final, evitando o Showdown. Ropz prevê uma partida contra a nova equipe de Twistzz, Liquid, e reconhece a Vitality como um adversário formidável. O principal objetivo da FaZe é ter um bom desempenho no próximo Major, com etapas que incluem a RMR e Katowice. A equipe está concentrada em evitar o esgotamento durante um calendário de eventos movimentado.
Busca de notícias
Para cada equipe, entramos em sua página na HLTV e pegamos a lista das notícias mais recentes na aba “News”. Exemplo para a equipe Spirit
Filtragem de notícias
Usei duas abordagens diferentes:
- Na primeira, simplesmente peguei os últimos 10 artigos que podem ter qualquer menção à equipe em questão
- Na segunda, procurei os últimos 10 artigos que mencionam explicitamente a equipe ou seus membros no título.
Classificação mundial
Na mesma página da equipe, podemos ver qual é sua posição no ranking mundial. Exemplo para a FURIA:
Estatísticas
Estatísticas gerais
Na página de estatísticas da HLTV, podemos ver quais são as estatísticas gerais de cada equipe. Exemplo para a NAVI:
Resultados de eventos recentes
A HLTV também mantém registros de campeonatos anteriores. Exemplo para NAVI:
Resultados de eventos recentes
Também é possível pesquisar o histórico de todos os confrontos entre duas equipes. Example for FaZe versus NAVI:
Um filtro de 8 meses é aplicado a todas essas estatísticas.
Resultados
Aqui estão os resultados completos:
- Primeira execução
- Segunda execução com uma melhoria na forma de buscar artigos do HLTV.
- Terceira execução depois que a GamerLegion substituiu a 9 Pandas no campeonato.
Primeira execução
Porcentagem de acertos na etapa Challengers: 75% (6 de 8)
Porcentagem de acertos na etapa Legends: 62,5% (5 de 8)
Porcentagem de acertos nos Playoffs: 42,9% (3 de 7)
Acertou quem ganhou o campeonato? Não (NaVi ganhou, Spirit foi a predição)
Segunda execução
Porcentagem de acertos na etapa Challengers: 62,5% (5 de 8)
Porcentagem de acertos na etapa Legends: 75% (6 de 8)
Porcentagem de acertos nos Playoffs: 42,9% (3 de 7)
Acertou quem ganhou o campeonato? Não (NaVi ganhou, Spirit foi a predição)
Terceira execução
Porcentagem de acertos na etapa Challengers: 62,5% (5 de 8)
Porcentagem de acertos na etapa Legends: 87,5% (7 de 8)
Porcentagem de acertos nos Playoffs: 28,6% (2 de 7)
Acertou quem ganhou o campeonato? Não (NaVi ganhou, Vitality foi a predição)
Análise dos resultados
Todas as execuções acima foram feitas antes do campeonato começar.
Para todas as partidas, existe um elemento importante que não foi considerado na análise: a escolha do mapa.
O jogo possui 8 mapas ativos e uma partida pode ser jogada em qualquer um deles. Minutos antes da partida começar, os líderes de cada time fazem uma rodada de “picks and bans” para escolher o mapa que irão jogar. Esse acaba sendo um fator decisivo na disputa do jogo porque os times têm diferentes preferências por mapas em que jogam melhor ou possuem mais estratégias.
Na minha opinião houve um acerto satisfatório considerando a restrição de não saber o mapa antes da partida. Houve um acerto de mais da metada nas primeiras etapas.
Já na disputa de cada partida, a LLM não obteve um resultado bom. Um grande motivo para isso ter acontecido foi o fato de que cada rodada do campeonato depende diretamente dos resultados das partidas anteriores. Assim, quanto mais a LLM fazia previsões erradas, menos partidas em que ela preveu de fato aconteceram.
Código Open-source
As informações acima foram extraídas do site da HLTV usando Playwright e a API da OpenAI é utilizada para interagir com o GPT4.
Todo o código desse artigo está disponível aqui. Você pode executar sua própria versão e ajustar qualquer métrica fornecida ao LLM.